当前位置: 开发笔记 > 编程语言 > 正文

意念实时转语音！Facebook的非植入式脑机接口，解码准确率达到76%

作者：z1996y | 来源：互联网 | 2023-10-11 11:50

铜灵发自凹非寺量子位出品|公众号QbitAI今天，加州大学旧金山分校（UCSF）和Facebook在NatureCommuications

铜灵发自凹非寺
量子位出品 | 公众号 QbitAI

今天&＃xff0c;加州大学旧金山分校&＃xff08;UCSF&＃xff09;和Facebook在Nature Commuications上发表的一项研究显示&＃xff1a;

他们在“非植入式”的穿戴设备上取得了最新进展&＃xff0c;构建出了一个大脑-计算机系统&＃xff0c;能准确解码佩戴设备的人听到和说出词语和对话&＃xff0c;实时从大脑信号中解码。

也就是说&＃xff0c;在这种脑机接口面前&＃xff0c;你的所思所想已无处遁形&＃xff0c;Facebook已经让意念打字成为了现实。

此前&＃xff0c;马斯克的脑机接口公司Neuralink也发布过脑机接口系统&＃xff0c;但这种植入式的设备需要向大脑中植入3000多个电极&＃xff0c;以此来检测神经元的活动&＃xff0c;但非植入式的设备就免去了复杂的植入步骤。

研究人员表示&＃xff0c;目前对生成和感知的两部分语言进行解码&＃xff0c;准确率超出了他们的想象&＃xff0c;分别能达到61%和76%的准确率。

640?wx_fmt&＃61;jpeg

这项项目对于正常人和残疾人来说&＃xff0c;都具有实用意义。

比如&＃xff0c;你可以将思维直连到语音助手siri&＃xff0c;查询天气、搜索信息不用直接喊出来了。

研究人员之一、加州大学旧金山分校神经外科医生Edward Chang表示&＃xff0c;这是向神经植入物迈出的重要一步&＃xff0c;因为中风&＃xff0c;脊髓损伤或其他疾病而失去说话能力的患者&＃xff0c;有望因此获得自然交流的能力。

如何意念转语音

这项成果来自Facebook Reality Labs&＃xff0c;一直与加州大学旧金山分校合作开展这项脑机接口的研究。

Facebook的设想是&＃xff0c;设计一种可以将大脑信号转换成语言的装置&＃xff0c;不需要劳动任何一块肌肉&＃xff0c;深度学习就能直接读懂大脑&＃xff0c;解码脑中所想&＃xff0c;实现流畅交流。

为了进行试验&＃xff0c;研究人员此前还招募了五名在医院接受癫痫治疗的志愿者。

640?wx_fmt&＃61;png

他们先是从高密度皮层活动中提取相关信号特征。志愿者们说了上百句话&＃xff0c;而通过植入性大脑皮层电图&＃xff08;ECoG&＃xff09;&＃xff0c;研究人员可以跟踪控制语言和发音的大脑区域的活动&＃xff0c;并将这些活动与志愿者说话时嘴唇、舌头、喉部和下颚的微妙运动联系起来&＃xff0c;然后将这些运动学特征翻译成口语句子。

研究人员采用bLSTM&＃xff08;bidi-rectional long short-term memory&＃xff09;循环神经网络来破译ECoG信号表达的运动学表征。

接着用另外一个bLSTM解码先前破译的运动学特征中的声学特征。

在这个过程中&＃xff0c;两个神经网络都会被投喂训练数据&＃xff0c;以提高它们的解码性能。

640?wx_fmt&＃61;png

在今年的四月份&＃xff0c;利用这样的方法&＃xff0c;Facebook已经实现了以每分钟150词的速度帮你说出所思所想。

而在这篇最新的论文Real-time decoding of question-and-answer speech dialogue using human cortical activity中&＃xff0c;他们在此前研究基础上&＃xff0c;研究人员想进一步提高精度。

640?wx_fmt&＃61;png

大多数语音解码的工作原理是对一个人在想什么声音做出最佳猜测&＃xff0c;在解码过程中可能会被“synthesizer”和“fertilizer”这类发音相似的单词混淆。

但Facebook的新系统增加了上下文信息来帮助区分这些单词。

首先&＃xff0c;这个算法预测从一组已知问题中听到的问题&＃xff0c;比如“你在一块土地上撒了什么?”然后&＃xff0c;这些信息作为上下文来帮助预测答案&＃xff1a;“肥料”&＃xff08;fertilizer&＃xff09;。

640?wx_fmt&＃61;png

Edward Chang表示&＃xff0c;通过添加上下文&＃xff0c;这个系统能够用的指定问题和答案解码感知&＃xff08;听到&＃xff09;的语音准确率达到76%&＃xff0c;解码产生&＃xff08;口头&＃xff09;的语音准确率达到了61%。

640?wx_fmt&＃61;png

Facebook表示&＃xff0c;未来将扩大系统的词汇量&＃xff0c;让其能适用在更广泛的领域。

缘起两年前

Facebook早在两年前&＃xff0c;就开始着手这个项目了。

2017年4月&＃xff0c;Facebook旗下的前沿产品研发团队Building 8负责人Regina Dugan宣布&＃xff0c;这家社交网络公司将在未来两年内&＃xff0c;开发出一个能以每分钟100字的速度从人脑向外传输语句的“帽子”。

640?wx_fmt&＃61;png

Facebook设想中的“帽子”&＃xff0c;是用来分享你的思维的。此前清华大学也做过类似概念的研究&＃xff0c;头戴一个小巧的电极帽&＃xff0c;控制屏幕软键盘上的26个字母就能打出任何语句。

640?wx_fmt&＃61;gif

Facebook最终计划&＃xff0c;是想打造一款AR眼镜。

Facebook AR/VR业务副总裁Andrew “Boz” Bosworth表示&＃xff0c;这个项目的初衷&＃xff0c;是想构建一个非侵入式可穿戴设备&＃xff0c;让人们只想通过想象他们想说什么来打字&＃xff0c;展示未来对AR眼镜的投入和互动成为现实的潜力。

传送门

Facebook官方博客&＃xff1a;
https://tech.fb.com/imagining-a-new-interface-hands-free-communication-without-saying-a-word/

论文Real-time decoding of question-and-answer speech dialogue using human cortical activity
地址&＃xff1a;
https://www.nature.com/articles/s41467-019-10994-4

论文Speech synthesis from neural decoding of spoken sentences&＃xff1a;
https://www.gwern.net/docs/ai/2019-anumanchipalli.pdf

— 完 —

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

640?wx_fmt&＃61;jpeg

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 &＃xff01;

推荐阅读

ip
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
go
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
uri
C#生成随机数的三种方法及其问题分析

本文介绍了C#中生成随机数的三种方法，并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法，但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数，进一步突显了这个问题。文章指出，随机数生成在任何编程语言中都是必备的功能，但Random类生成的随机数并不可靠。最后，提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]

蜡笔小新 2023-12-14 14:15:30
go
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
go
EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析

本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程，并分析了其所需的资源容量。通过解决错误提示和调整内存大小，成功存储了波形数据。然后，讨论了储存环逐束团信号的意义，以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大，每天需要近250G，一年需要90T。然而，储存环逐束团信号具有重要意义，可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]

蜡笔小新 2023-12-14 17:43:56
list
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
go
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
go
生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍

一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks（论文下载链接arxiv：[h ... [详细]

蜡笔小新 2023-12-14 11:39:45
import
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
ip
JavaScript设计模式之策略模式（Strategy Pattern）的优势及应用

本文介绍了JavaScript设计模式之策略模式（Strategy Pattern）的定义和优势，策略模式可以避免代码中的多重判断条件，体现了开放-封闭原则。同时，策略模式的应用可以使系统的算法重复利用，避免复制粘贴。然而，策略模式也会增加策略类的数量，违反最少知识原则，需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例，说明了策略模式的应用场景和实现方式。 ... [详细]

蜡笔小新 2023-12-14 09:31:45
go
解决Cydia数据库错误：could not open file /var/lib/dpkg/status 的方法

本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件，以及ifunbox工具和终端命令，可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中，并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]

蜡笔小新 2023-12-13 19:02:44
go
JVM 学习总结（三）——对象存活判定算法的两种实现

本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法：引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活，虽然简单高效，但无法解决循环引用的问题；可达性分析算法通过判断对象是否可达来确定存活对象，是主流的Java虚拟机内存管理算法。 ... [详细]

蜡笔小新 2023-12-13 18:59:46
uri
自动轮播，反转播放的ViewPagerAdapter的使用方法和效果展示

本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter，并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]

蜡笔小新 2023-12-13 14:41:31
go
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
import
使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例

本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤，可以获取到网站首页的新闻数据。代码示例使用Python编写，并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-12 19:16:21