热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

安装realtekhdaudiodriver失败_猎人能饭否?——荣耀猎人本的DL体验amp;piano_transcription_inference安装...

荣耀猎人V700用了英伟达的GTX2060战术核显卡,显然是可以用来跑深度学习或者玩具框架的。有时候我需要一个“能跑网络就行”的东西,因为毕竟有些情况下

荣耀猎人V700用了英伟达的GTX 2060战术核显卡,显然是可以用来跑深度学习或者玩具框架的。有时候我需要一个“能跑网络就行”的东西,因为毕竟有些情况下并不需要性能或者说准确性太高,比如拿YOLO帮朋友跑交通流的视频——反正跑出来就行了。

为此我专门去问了 @到处挖坑蒋玉成 蒋老板,“有没有什么可以通用的反映深度学习性能的模型”,然后得到的回复是“没有”。

既然这样,那我就按兴趣,用字节跳动最近发布的“钢琴扒带”工具来测试效果了。项目Git如下:

https://github.com/bytedance/piano_transcription​github.com

配置我直接用的cuda 11.1+对应的PyTorch。

cuda可以直接官网exe:

CUDA 工具包 11.1 下载​developer.nvidia.com

PyTorch去官网可以找到对应的安装命令:

pip install torch===1.7.0+cu110 torchvision===0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

字节跳动钢琴扒带的命令:

pip install piano_transcription_inference

漫长的安装好了,还差一步——字节跳动的包不含权重,权重的话貌似需要自己下载,虽然包里有自动下载的命令,但是我这边执行总是失败:

if not os.path.exists(checkpoint_path) or os.path.getsize(checkpoint_path) <1.6e8:create_folder(os.path.dirname(checkpoint_path))print(&#39;Total size: ~165 MB&#39;)zenodo_path &#61; &#39;https://zenodo.org/record/4034264/files/CRNN_note_F1%3D0.9677_pedal_F1%3D0.9186.pth?download&#61;1&#39;os.system(&#39;wget -O "{}" "{}"&#39;.format(checkpoint_path, zenodo_path))

所以直接把那个网址拿来下载权重&#xff1a;

https://zenodo.org/record/4034264/files/CRNN_note_F1%3D0.9677_pedal_F1%3D0.9186.pth?download&#61;1

下载完了可以改个名字&#xff0c;我就叫“note.pth”了。

官网给的脚本坑在checkpoint_path&#xff0c;这个我是自己下载然后挂在项目根目录的&#xff0c;不然没有权重跑个卵。

from piano_transcription_inference import PianoTranscription, sample_rate, load_audio
import osdef mp32mid(fp):# Load audio(audio, _) &#61; load_audio(fp, sr&#61;sample_rate, mono&#61;True)print(&#39;loaded&#39;)# Transcriptortranscriptor &#61; PianoTranscription(device&#61;&#39;cuda&#39;, checkpoint_path&#61;&#39;note.pth&#39;) # &#39;cuda&#39; | &#39;cpu&#39;fname&#61;fp.split(&#39;&#39;)[-1]print(fname&#43;&#39; is processing...&#39;)# Transcribe and write out to MIDI filetranscribed_dict &#61; transcriptor.transcribe(audio, fname &#43; &#39;.mid&#39;)def file_name(file_dir):l &#61; []for root, dirs, files in os.walk(file_dir):for file in files:if os.path.splitext(file)[1] &#61;&#61; &#39;.mp3&#39;: # 想要保存的文件格式l.append(os.path.join(root, file))return lprint(&#39;start&#39;)
for l in file_name(&#39;D:CloudMusic&#39;):print(l)mp32mid(l)
pass


跑出来的结果是喜出望外的&#xff0c;对于钢琴音色准确率极高&#xff0c;但节奏是错的

ad70d129ddd0de94cfe1d0627b537685.png

这时候可以使用logic pro自带的“智能速度”去修正这个midi的节拍、速度等信息。

松本文纪的曲子一般喜欢加很大的混响&#xff0c;所以识别会把一些ECHO当成是钢琴音符识别。

但是这首ReSound Wave的鸟之诗改编版就识别的很好。我把一个视频翻录了一下&#xff0c;配上bgm。

【Lia——鳥の詩 (鸟之诗)】夏之AIR&#xff0c;千年守护郁郁葱葱_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili​www.bilibili.com
95631f7aa877d1f984286e7e65a3709b.png
知乎视频​www.zhihu.com

原曲地址&#xff1a;

Feather in Dreams​music.163.com
7c012d494394113b85433bd735f4add1.png

显然力度动态不如原曲&#xff0c;不过这个不大影响制谱。应该听得出原曲和mp3->mid->mp3后的差距&#xff0c;还是挺明显的。

转码的速度也还行&#xff0c;大概两分钟一首&#xff0c;还算比较快。

翻录的过程中发现Mate40Pro的录像能力真的有大幅度提升&#xff0c;放Mate30Pro早过曝了……后面再详细对比吧。

喜欢的朋友可以尝试一下~

猎人可以用来作为生产力工具&#xff0c;存乎一心。

感谢字节跳动开源了如此好的转码工具。



推荐阅读
  • RouterOS 5.16软路由安装图解教程
    本文介绍了如何安装RouterOS 5.16软路由系统,包括系统要求、安装步骤和登录方式。同时提供了详细的图解教程,方便读者进行操作。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • 本文讲述了如何通过代码在Android中更改Recycler视图项的背景颜色。通过在onBindViewHolder方法中设置条件判断,可以实现根据条件改变背景颜色的效果。同时,还介绍了如何修改底部边框颜色以及提供了RecyclerView Fragment layout.xml和项目布局文件的示例代码。 ... [详细]
  • 本文介绍了在Linux下安装Perl的步骤,并提供了一个简单的Perl程序示例。同时,还展示了运行该程序的结果。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 本文介绍了三种方法来实现在Win7系统中显示桌面的快捷方式,包括使用任务栏快速启动栏、运行命令和自己创建快捷方式的方法。具体操作步骤详细说明,并提供了保存图标的路径,方便以后使用。 ... [详细]
  • 怎么在PHP项目中实现一个HTTP断点续传功能发布时间:2021-01-1916:26:06来源:亿速云阅读:96作者:Le ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • 海马s5近光灯能否直接更换为H7?
    本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡,并提供了完整的教程下载地址。此外,还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
author-avatar
归零xinghx_318
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有