安装realtekhdaudiodriver失败_猎人能饭否？——荣耀猎人本的DL体验amp;piano_transcription_inference安装...

作者：归零xinghx_318 | 来源：互联网 | 2023-09-05 08:35

荣耀猎人V700用了英伟达的GTX2060战术核显卡，显然是可以用来跑深度学习或者玩具框架的。有时候我需要一个“能跑网络就行”的东西，因为毕竟有些情况下

荣耀猎人V700用了英伟达的GTX 2060战术核显卡&＃xff0c;显然是可以用来跑深度学习或者玩具框架的。有时候我需要一个“能跑网络就行”的东西&＃xff0c;因为毕竟有些情况下并不需要性能或者说准确性太高&＃xff0c;比如拿YOLO帮朋友跑交通流的视频——反正跑出来就行了。

为此我专门去问了 &＃64;到处挖坑蒋玉成蒋老板&＃xff0c;“有没有什么可以通用的反映深度学习性能的模型”&＃xff0c;然后得到的回复是“没有”。

既然这样&＃xff0c;那我就按兴趣&＃xff0c;用字节跳动最近发布的“钢琴扒带”工具来测试效果了。项目Git如下&＃xff1a;

https://github.com/bytedance/piano_transcriptiongithub.com

配置我直接用的cuda 11.1&＃43;对应的PyTorch。

cuda可以直接官网exe&＃xff1a;

CUDA 工具包 11.1 下载developer.nvidia.com

PyTorch去官网可以找到对应的安装命令&＃xff1a;

pip install torch&＃61;&＃61;&＃61;1.7.0&＃43;cu110 torchvision&＃61;&＃61;&＃61;0.8.1&＃43;cu110 torchaudio&＃61;&＃61;&＃61;0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

字节跳动钢琴扒带的命令&＃xff1a;

pip install piano_transcription_inference

漫长的安装好了&＃xff0c;还差一步——字节跳动的包不含权重&＃xff0c;权重的话貌似需要自己下载&＃xff0c;虽然包里有自动下载的命令&＃xff0c;但是我这边执行总是失败&＃xff1a;

if not os.path.exists(checkpoint_path) or os.path.getsize(checkpoint_path) <1.6e8:create_folder(os.path.dirname(checkpoint_path))print(&＃39;Total size: ~165 MB&＃39;)zenodo_path &＃61; &＃39;https://zenodo.org/record/4034264/files/CRNN_note_F1%3D0.9677_pedal_F1%3D0.9186.pth?download&＃61;1&＃39;os.system(&＃39;wget -O "{}" "{}"&＃39;.format(checkpoint_path, zenodo_path))

所以直接把那个网址拿来下载权重&＃xff1a;

https://zenodo.org/record/4034264/files/CRNN_note_F1%3D0.9677_pedal_F1%3D0.9186.pth?download&＃61;1

下载完了可以改个名字&＃xff0c;我就叫“note.pth”了。

官网给的脚本坑在checkpoint_path&＃xff0c;这个我是自己下载然后挂在项目根目录的&＃xff0c;不然没有权重跑个卵。

from piano_transcription_inference import PianoTranscription, sample_rate, load_audio import osdef mp32mid(fp):# Load audio(audio, _) &＃61; load_audio(fp, sr&＃61;sample_rate, mono&＃61;True)print(&＃39;loaded&＃39;)# Transcriptortranscriptor &＃61; PianoTranscription(device&＃61;&＃39;cuda&＃39;, checkpoint_path&＃61;&＃39;note.pth&＃39;) # &＃39;cuda&＃39; | &＃39;cpu&＃39;fname&＃61;fp.split(&＃39;&＃39;)[-1]print(fname&＃43;&＃39; is processing...&＃39;)# Transcribe and write out to MIDI filetranscribed_dict &＃61; transcriptor.transcribe(audio, fname &＃43; &＃39;.mid&＃39;)def file_name(file_dir):l &＃61; []for root, dirs, files in os.walk(file_dir):for file in files:if os.path.splitext(file)[1] &＃61;&＃61; &＃39;.mp3&＃39;: # 想要保存的文件格式l.append(os.path.join(root, file))return lprint(&＃39;start&＃39;) for l in file_name(&＃39;D:CloudMusic&＃39;):print(l)mp32mid(l) pass

跑出来的结果是喜出望外的&＃xff0c;对于钢琴音色准确率极高&＃xff0c;但节奏是错的。

这时候可以使用logic pro自带的“智能速度”去修正这个midi的节拍、速度等信息。

松本文纪的曲子一般喜欢加很大的混响&＃xff0c;所以识别会把一些ECHO当成是钢琴音符识别。

但是这首ReSound Wave的鸟之诗改编版就识别的很好。我把一个视频翻录了一下&＃xff0c;配上bgm。

【Lia——鳥の詩 (鸟之诗)】夏之AIR&＃xff0c;千年守护郁郁葱葱_哔哩哔哩 (゜-゜)つロ干杯~-bilibiliwww.bilibili.com

知乎视频www.zhihu.com

原曲地址&＃xff1a;

Feather in Dreamsmusic.163.com

显然力度动态不如原曲&＃xff0c;不过这个不大影响制谱。应该听得出原曲和mp3->mid->mp3后的差距&＃xff0c;还是挺明显的。

转码的速度也还行&＃xff0c;大概两分钟一首&＃xff0c;还算比较快。

翻录的过程中发现Mate40Pro的录像能力真的有大幅度提升&＃xff0c;放Mate30Pro早过曝了……后面再详细对比吧。

喜欢的朋友可以尝试一下~

猎人可以用来作为生产力工具&＃xff0c;存乎一心。

感谢字节跳动开源了如此好的转码工具。

推荐阅读

php
RouterOS 5.16软路由安装图解教程

本文介绍了如何安装RouterOS 5.16软路由系统，包括系统要求、安装步骤和登录方式。同时提供了详细的图解教程，方便读者进行操作。 ... [详细]

蜡笔小新 2023-12-12 10:22:22
php
数据库的存储结构及其重要性

本文介绍了数据库的存储结构及其重要性，强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离，可以实现对物理存储的重新组织和数据库的迁移，而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构，并介绍了表空间的概念和作用。 ... [详细]

蜡笔小新 2023-12-14 16:00:02
rsa
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
rsa
在Windows 8上安装gvim中的插件的错误加载问题

本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置，但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置，并列出了出现的错误信息。 ... [详细]

蜡笔小新 2023-12-14 14:44:00
rsa
如何在Android中通过代码更改Recycler视图项的背景颜色

本文讲述了如何通过代码在Android中更改Recycler视图项的背景颜色。通过在onBindViewHolder方法中设置条件判断，可以实现根据条件改变背景颜色的效果。同时，还介绍了如何修改底部边框颜色以及提供了RecyclerView Fragment layout.xml和项目布局文件的示例代码。 ... [详细]

蜡笔小新 2023-12-14 12:45:01
config
Linux下Perl的安装及第一个程序运行

本文介绍了在Linux下安装Perl的步骤，并提供了一个简单的Perl程序示例。同时，还展示了运行该程序的结果。 ... [详细]

蜡笔小新 2023-12-13 18:29:11
fetch
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
fetch
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
include
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
command
Win7如何显示桌面及快捷方式

本文介绍了三种方法来实现在Win7系统中显示桌面的快捷方式，包括使用任务栏快速启动栏、运行命令和自己创建快捷方式的方法。具体操作步骤详细说明，并提供了保存图标的路径，方便以后使用。 ... [详细]

蜡笔小新 2023-12-13 13:15:57
header
php 主动断掉http,怎么在PHP项目中实现一个HTTP断点续传功能

怎么在PHP项目中实现一个HTTP断点续传功能发布时间：2021-01-1916:26:06来源：亿速云阅读：96作者：Le ... [详细]

蜡笔小新 2023-12-12 17:17:29
search
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
search
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
const
海马s5近光灯能否直接更换为H7？

本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡，并提供了完整的教程下载地址。此外，还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]

蜡笔小新 2023-12-12 11:39:00
const
Swing组件及其用法，图标接口的定义和创建方法

本文介绍了Swing组件的用法，重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联，可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法，并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]

蜡笔小新 2023-12-11 21:03:59

归零xinghx_318

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章