当前位置: 开发笔记 > 编程语言 > 正文

m3u8转mp4缓存合并工厂_使用Python下载M3U8格式视频

作者：那是黑夜过后的黎明_182 | 来源：互联网 | 2023-09-24 20:47

作者简介本篇文章来自MRArchive的投稿，分享了如何使用Python下载M3U8格式的视频，希望对大家有所帮助！同时也感谢作者贡献的精

/ 作者简介 /

本篇文章来自 MRArchive 的投稿&＃xff0c;分享了如何使用Python下载M3U8格式的视频&＃xff0c;希望对大家有所帮助&＃xff01;同时也感谢作者贡献的精彩文章。

作者信息

网站&＃xff1a;https://toodo.fun

B站&＃xff1a;https://space.bilibili.com/314191627

/ 背景简介 /

M3U 是一种播放多媒体列表的文件格式&＃xff0c;它的设计初衷是为了播放音频文件&＃xff0c;比如MP3&＃xff0c;但是越来越多的软件现在用来播放视频文件列表&＃xff0c;M3U也可以指定在线流媒体音频源。很多播放器和软件都支持M3U文件格式。

m3u8 文件是 HTTP Live Streaming(缩写为 HLS) 协议的部分内容&＃xff0c;而 HLS 是一个由苹果公司提出的基于 HTTP 的流媒体网络传输协议。

HLS 是新一代流媒体传输协议&＃xff0c;其基本实现原理为将一个大的媒体文件进行分片&＃xff0c;将该分片文件资源路径记录于 m3u8 文件(即 playlist)内&＃xff0c;其中附带一些额外描述(比如该资源的多带宽信息···)用于提供给客户端。客户端依据该 m3u8 文件即可获取对应的媒体资源&＃xff0c;进行播放。

扩展M3U指令&＃xff1a;

#EXTM3U //必需&＃xff0c;表示一个扩展的m3u文件
#EXT-X-VERSION:3 //hls的协议版本号&＃xff0c;暗示媒体流的兼容性
#EXT-X-MEDIA-SEQUENCE:xx //首个分段的sequence number
#EXT-X-ALLOW-CACHE:NO //是否缓存
#EXT-X-TARGETDURATION:5 //每个视频分段最大的时长(单位秒)
#EXT-X-DISCONTINUITY //表示换编码
#EXTINF: //每个切片的时长

/ 获取.m3u8文件中的视频信息 /

.m3u8文件储存了视频所在的位置信息&＃xff0c;我们可以通过发送一个Get请求来获取链接中的内容&＃xff1a;

content &＃61; requests.get(m3u8Url).text

/ 拼接视频下载链接 /

我们通过得到的视频信息进行视频网址拼接&＃xff0c;.m3u8文件中的链接可以为全路径或者相对路径&＃xff0c;所以我们判断后进行拼接并存入一个列表当中&＃xff1a;

urls &＃61; []for index, video in enumerate(content.split(&＃39;\n&＃39;)): if &＃39;#EXTINF&＃39; in video: if content[index &＃43; 1][0] &＃61;&＃61; &＃39;/&＃39;: downloadLink &＃61; url.split(&＃39;//&＃39;)[0] &＃43; "//" &＃43; url.split(&＃39;//&＃39;)[1].split(&＃39;/&＃39;)[0] &＃43; content[index &＃43; 1] elif content[index &＃43; 1][:4] &＃61;&＃61; &＃39;http&＃39;: downloadLink &＃61; content[index &＃43; 1] else: downloadLink &＃61; url.replace(url.split(&＃39;/&＃39;)[-1], content[index &＃43; 1]) urls.append(downloadLink)

/ 使用多线程下载视频 /

得到视频列表后&＃xff0c;我们就可以对视频进行下载了&＃xff0c;为了提高下载效率&＃xff0c;我们可以使用多线程进行下载&＃xff1a;

def download(downloadLink, name): for _ in range(10): try: req &＃61; requests.get(downloadLink, headers&＃61;headers, timeout&＃61;15).content with open(f"{name}", "wb") as f: f.write(req) f.flush() break except: if _ &＃61;&＃61; 9: print(f"{name}下载失败") else: print(f"{name}正在进行第{_}次重试")pool &＃61; ThreadPoolExecutor(max_workers&＃61;threadNum)futures &＃61; []for index, downloadLink in enumerate(urls): fileList.append(os.path.basename(downloadLink)) futures.append(pool.submit(download, downloadLink, f"{downloadPath}/{os.path.basename(downloadLink)}"))wait(futures)

/ 合并视频 /

等待全部下载完成后&＃xff0c;是一个个的ts视频文件&＃xff0c;然后我们再将这些文件合并成一个视频文件&＃xff0c;此时要注意视频的顺序&＃xff0c;我们可以在我们的视频列表中依次取出进行合并

def merge_file(path, name): global fileList cmd &＃61; "copy /b " for i in fileList: if i !&＃61; fileList[-1]: cmd &＃43;&＃61; f"{i} &＃43; " else: cmd &＃43;&＃61; f"{i} {name}" os.chdir(path) with open(&＃39;combine.cmd&＃39;, &＃39;w&＃39;) as f: f.write(cmd) os.system("combine.cmd") os.system(&＃39;del /Q *.ts&＃39;) os.system(&＃39;del /Q *.cmd&＃39;)

这里我们是写了一个脚本来完成合并的任务&＃xff0c;使用命令&＃39;copy /b file1 &＃43; file2 &＃43;... &＃43; fileN newFile&＃39;进行合并&＃xff0c;并于完成后将ts小文件进行了删除。至此&＃xff0c;视频就下载完成了。

/ 完整代码如下 /

import requestsimport osfrom concurrent.futures import ThreadPoolExecutor, waitimport sysfinishedNum &＃61; 0allNum &＃61; 0fileList &＃61; []headers &＃61; {&＃39;User-Agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:62.0) Gecko/20100101 Firefox/62.0&＃39;}def download(downloadLink, name): global finishedNum global allNum for _ in range(10): try: req &＃61; requests.get(downloadLink, headers&＃61;headers, timeout&＃61;15).content with open(f"{name}", "wb") as f: f.write(req) f.flush() finishedNum &＃43;&＃61; 1 print(f"{name}下载成功, 总进度{round(finishedNum / allNum * 100, 2)}% ({finishedNum}/{allNum})") break except: if _ &＃61;&＃61; 9: print(f"{name}下载失败") else: print(f"{name}正在进行第{_}次重试")def merge_file(path, name): global fileList cmd &＃61; "copy /b " for i in fileList: if i !&＃61; fileList[-1]: cmd &＃43;&＃61; f"{i} &＃43; " else: cmd &＃43;&＃61; f"{i} {name}" os.chdir(path) with open(&＃39;combine.cmd&＃39;, &＃39;w&＃39;) as f: f.write(cmd) os.system("combine.cmd") os.system(&＃39;del /Q *.ts&＃39;) os.system(&＃39;del /Q *.cmd&＃39;)def downloader(url, name, threadNum): global allNum global fileList print("读取文件信息中...") downloadPath &＃61; &＃39;Download&＃39; if not os.path.exists(downloadPath): os.mkdir(downloadPath) # 查看是否存在 if os.path.exists(f"{downloadPath}/{name}"): print(f"视频文件已经存在&＃xff0c;如需重新下载请先删除之前的视频文件") return content &＃61; requests.get(url, headers&＃61;headers).text.split(&＃39;\n&＃39;) if "#EXTM3U" not in content[0]: raise BaseException(f"非M3U8链接") # .m3u8 跳转 for video in content: if ".m3u8" in video: if video[0] &＃61;&＃61; &＃39;/&＃39;: url &＃61; url.split(&＃39;//&＃39;)[0] &＃43; "//" &＃43; url.split(&＃39;//&＃39;)[1].split(&＃39;/&＃39;)[0] &＃43; video elif video[:4] &＃61;&＃61; &＃39;http&＃39;: url &＃61; video else: url &＃61; url.replace(url.split(&＃39;/&＃39;)[-1], video) print(url) content &＃61; requests.get(url, headers&＃61;headers).text.split(&＃39;\n&＃39;) urls &＃61; [] for index, video in enumerate(content): if &＃39;#EXTINF&＃39; in video: if content[index &＃43; 1][0] &＃61;&＃61; &＃39;/&＃39;: downloadLink &＃61; url.split(&＃39;//&＃39;)[0] &＃43; "//" &＃43; url.split(&＃39;//&＃39;)[1].split(&＃39;/&＃39;)[0] &＃43; content[index &＃43; 1] elif content[index &＃43; 1][:4] &＃61;&＃61; &＃39;http&＃39;: downloadLink &＃61; content[index &＃43; 1] else: downloadLink &＃61; url.replace(url.split(&＃39;/&＃39;)[-1], content[index &＃43; 1]) urls.append(downloadLink) allNum &＃61; len(urls) pool &＃61; ThreadPoolExecutor(max_workers&＃61;threadNum) futures &＃61; [] for index, downloadLink in enumerate(urls): fileList.append(os.path.basename(downloadLink)) futures.append(pool.submit(download, downloadLink, f"{downloadPath}/{os.path.basename(downloadLink)}")) wait(futures) print(f"运行完成") merge_file(downloadPath, name) print(f"合并完成") print(f"文件下载成功&＃xff0c;尽情享用吧")if __name__ &＃61;&＃61; &＃39;__main__&＃39;: videoUrl &＃61; str(sys.argv[1]) name &＃61; str(sys.argv[2]) threadNum &＃61; int(sys.argv[3]) downloader(videoUrl, name, threadNum)

/ 打包好的Windows版软件下载 /

百度云下载地址&＃xff1a;https://pan.baidu.com/s/1ZsPb9WTmYP8VUKuR9tuoyw 提取码&＃xff1a;mxb6

蓝奏云下载地址&＃xff1a;https://lanzous.com/icnc1ve

推荐阅读

io
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
io
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
io
Support Paged.JS for automatic hugo resume> PDF conversion.

FeatureRequestIsyourfeaturerequestrelatedtoaproblem?Please ... [详细]

蜡笔小新 2023-12-13 11:52:05
io
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
io
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
io
t-io 2.0.0发布-法网天眼第一版的回顾和更新说明

本文回顾了t-io 1.x版本的工程结构和性能数据，并介绍了t-io在码云上的成绩和用户反馈。同时，还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后，详细介绍了t-io 2.0.0版本的更新内容，包括更简洁的使用方式和内置的httpsession功能。 ... [详细]

蜡笔小新 2023-12-14 10:17:48
merge
PHP实现断点续传乱序合并文件的方法和源码

本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因，文件需要分割成多个部分发送，因此无法按顺序接收。文章中提供了merge2.php的源码，通过使用shuffle函数打乱文件读取顺序，实现了乱序合并文件的功能。同时，还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]

蜡笔小新 2023-12-14 04:33:19
io
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
io
PhysioNet生理信号处理（三）WFDB Toolbox for Matlab的安装和使用方法

本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容，即可完成安装。该工具箱提供了一系列函数，可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-13 20:46:48
io
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
io
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
java
postman测试登录后的接口_使用postman进行接口测试的方法(测试用户管理模块)

本文介绍了使用postman进行接口测试的方法，以测试用户管理模块为例。首先需要下载并安装postman，然后创建基本的请求并填写用户名密码进行登录测试。接下来可以进行用户查询和新增的测试。在新增时，可以进行异常测试，包括用户名超长和输入特殊字符的情况。通过测试发现后台没有对参数长度和特殊字符进行检查和过滤。 ... [详细]

蜡笔小新 2023-12-14 10:29:45
default
eclipse学习（第三章：ssh中的Hibernate）——11.Hibernate的缓存（2级缓存，get和load）

本文介绍了eclipse学习中的第三章内容，主要讲解了ssh中的Hibernate的缓存，包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]

蜡笔小新 2023-12-14 00:31:35
io
推荐系统遇上深度学习(十七）详解推荐系统中的常用评测指标

原创：石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值， ... [详细]

蜡笔小新 2023-12-13 19:35:25
io
org.apache.catalina.LifecycleEvent类的使用及代码示例

标题： ... [详细]

蜡笔小新 2023-12-13 11:03:10

那是黑夜过后的黎明_182

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章