python搜寻蓝牙_使用Python搜寻高质量ROM的网站

作者：可乐加芬达61158 | 来源：互联网 | 2023-10-11 13:09

python搜寻蓝牙假设您要从网站下载所有高质量的SuperNintendoROM。该站点仅具有将您带到文件本身的链接列表。由于这是一棵扁平树，因此可以使用URLal

python 搜寻蓝牙

假设您要从网站下载所有高质量的Super Nintendo ROM。该站点仅具有将您带到文件本身的链接列表。由于这是一棵扁平树&＃xff0c;因此可以使用URL ala运行基本的wget命令&＃xff1a;

wget -m -np -c -w 3 -R"index.html*" "https://rom-site.blah/path/to/roms/"

但是&＃xff0c;这将为您提供每场比赛&＃xff0c;无论质量如何。幸运的是&＃xff0c;ROM发烧友使用后缀来表示rom的状态&＃xff1a;

[a] Alternate [p] Pirate [b] Bad Dump (avoid these, they may not work!) [t] Trained [f] Fixed [T-] OldTranslation [T&＃43;] NewerTranslation [h] Hack (-) Unknown Year [o] Overdump [!] Verified Good Dump (M#) Multilanguage (# of Languages) ( ###) Checksum (??k) ROM Size ZZZ_ Unclassified (Unl) Unlicensed

因此&＃xff0c;我们只想要带有[&＃xff01;]后缀的代码。 您可能还希望 仅针对美国发行版 指定 [U] 。

当然可以使用正则表达式将其指定为wget &＃xff0c;但是我绝对不是wget或regex pro&＃xff0c;因此&＃xff0c;在尝试了几分钟后&＃xff0c;我放弃并编写了一个简短的Python脚本来获取想要使用的内容美丽的汤

在编写任何代码之前&＃xff0c;我分析了目标URL的来源&＃xff0c;并且
可以肯定的是&＃xff0c;该页面几乎只是一个锚定标记列表&＃xff0c;
直接链接到ROM文件。完善。

窥视html &＃xff0c;我知道我只需要从所有锚点中提取链接&＃xff0c;但只收集包含[&＃xff01;]后缀的链接即可。这可以在不到15行的Python中完成&＃xff1a;

首先&＃xff0c;安装beautifulsoup4&＃xff1a;

pip3 install beautfilsoup4

然后使用以下代码创建一个名为good_roms.py的文件&＃xff1a;

# good_roms.py import requests from bs4 import BeautifulSoupweburl &＃61; &＃39;https://site.site/path/to/roms/&＃39; data &＃61; requests.get(weburl) soup &＃61; BeautifulSoup(data.text, features&＃61; &＃39;html.parser&＃39; )links &＃61; [] for anch in soup.find_all( &＃39;a&＃39; ):if &＃39;[!]&＃39; in str(anch):links.append(weburl &＃43; anch.get( &＃39;href&＃39; ))for link in links:print(link)

现在&＃xff0c;我可以运行程序并将输出重定向到文本文件&＃xff1a;

python3 good_roms.py > rom-list.txt

现在&＃xff0c;我有了一个包含所有好的ROM的URL的文本文件&＃xff0c;我可以将该文件直接提供给wget &＃xff0c;它将使用-i输入文件开关仅下载好的文件&＃xff1a;

wget -i rom-list.txt

而已&＃xff01; 确保您有足够的空间容纳所有rom&＃xff0c;并观看它们一次堆积一堆&＃xff1a;

--2019-01-25 21:27:02-- https://rom-site.blah/path/to/roms/YourFavoriteRom[!].bin Reusing existing connection to [rom-site.blah]:443. HTTP request sent, awaiting response... 200 OK Length: 2097152 (2.0M) [application/octet-stream] Saving to: ‘YourFavoriteRom[!].bin’YourFavoriteRom[!].bin 100%[&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;>] 2.00M 513KB/sin 3.9s 2019-01-25 21:27:09 (513 KB/s) - ‘YourFavoriteRom[!].bin’ saved [2097152/2097152]FINISHED --2019-01-25 21:29:41-- Total wall clock time: 38m 47s Downloaded: 693 files, 888M in 30m 38s (495 KB/s)

翻译自: https://hackernoon.com/scraping-a-website-for-high-quality-roms-using-python-2x21t28ey

python 搜寻蓝牙

推荐阅读

get
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
get
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
get
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
get
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
get
java 线程死锁模拟

1，关于死锁的理解死锁，我们可以简单的理解为是两个线程同时使用同一资源，两个线程又得不到相应的资源而造成永无相互等待的情况。 2，模拟死锁背景介绍：我们创建一个朋友 ... [详细]

蜡笔小新 2023-12-13 19:12:25
get
Linux下Perl的安装及第一个程序运行

本文介绍了在Linux下安装Perl的步骤，并提供了一个简单的Perl程序示例。同时，还展示了运行该程序的结果。 ... [详细]

蜡笔小新 2023-12-13 18:29:11
get
南邮ctf-web的writeup

本文介绍了南邮ctf-web的writeup，包括签到题和md5 collision。在CTF比赛和渗透测试中，可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型，可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]

蜡笔小新 2023-12-13 10:58:55
get
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
get
Spring源码解密之默认标签的解析方式分析

本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断，区分默认命名空间和自定义命名空间，并采用不同的解析方式。其中，bean标签的解析最为复杂和重要。 ... [详细]

蜡笔小新 2023-12-14 17:24:50
get
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
get
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
list
PHP实现断点续传乱序合并文件的方法和源码

本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因，文件需要分割成多个部分发送，因此无法按顺序接收。文章中提供了merge2.php的源码，通过使用shuffle函数打乱文件读取顺序，实现了乱序合并文件的功能。同时，还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]

蜡笔小新 2023-12-14 04:33:19
express
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
express
《数据结构》学习笔记3——串匹配算法性能评估

本文主要讨论串匹配算法的性能评估，包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库，可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n)，通过随机取出长度为m的子串作为模式P，在文本T中进行匹配，统计平均复杂度。对于成功和失败的匹配分别进行测试，分析其平均复杂度。详情请参考相关学习资源。 ... [详细]

蜡笔小新 2023-12-13 16:16:05
case
开发笔记：实验7的文件读写操作

本文介绍了使用C++的ofstream和ifstream类进行文件读写操作的方法，包括创建文件、写入文件和读取文件的过程。同时还介绍了如何判断文件是否成功打开和关闭文件的方法。通过本文的学习，读者可以了解如何在C++中进行文件读写操作。 ... [详细]

蜡笔小新 2023-12-12 17:48:18

可乐加芬达61158

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章