当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

来源：51CTO.COM 2023-09-25 16:44:09 0浏览收藏

今日不肯埋头，明日何以抬头！每日一句努力自己的话哈哈~哈喽，今天我将给大家带来一篇《UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！》，主要内容是讲解等等，感兴趣的朋友可以收藏或者有更好的建议在评论提出，我都会认真看的！大家一起进步，一起学习！

脑机接口时代，天天都有新鲜玩意儿。

今天带来四个字：脑植音乐。

具体来说，就是先用AI来观察某段音乐会让人的大脑中产生什么样的电波，然后直接在有需要的人的大脑里模拟这个电波的活动，以此来达到治疗某类疾病的目的。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

让我们回顾一下几年前的Albany医疗中心，看看那里的神经科学家们是如何进行研究的

语言障碍者的福音！

在奥尔巴尼医疗中心，一首名为「另一堵墙」的音乐缓缓响起，充满了整个医院病房

躺在病床上准备接受癫痫手术的病人们，他们并非医生，而是在聆听

神经科学家们聚集在一旁，观察电脑屏幕上显示的病人脑电图活动

主要观察的内容，就是大脑部分区域在听到一些独属于音乐的东西后所产生的电极活动，然后看看通过这些记录下来的电极活动能不能复现出他们在听什么音乐。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

在前面提到的内容中，涉及到音乐的要素包括音调、节奏、和声以及歌词

这个研究进行了十多年。加利福尼亚大学伯克利分校的神经科学家们对29名参与实验的癫痫患者的数据进行了详细分析

科学家们能够根据病人大脑中电极活动的结果，成功重建了这段音乐

在复现的歌曲中，其中的一句歌词「All in all it was just a brick in the wall」的节奏非常完整，虽说歌词不算太清晰，但研究人员表示，可以破译出来，并非混沌一片。

而这首歌曲也是科学家们第一个通过大脑电极活动重建歌曲成功的案例。

结果表明，通过对脑电波的记录和解除，是可以捕捉到一些音乐元素以及音节的。

这些音乐元素可以用专业术语称为韵律（prosody），包括节奏、重音、抑扬顿挫等等。这些元素的意义无法仅通过语言来表达

此外，由于这些颅内脑电图（iEEG）只记录在大脑表层进行的活动（也就是最接近听觉中心的部分），因此无需担心有人会通过这种方式偷听你在听什么歌（笑）

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

但是，对于那些得了中风，或者瘫痪，导致交流困难的人来说，这种从大脑表层电极活动进行的复现，可以帮助他们重现乐曲的音乐性。

显然，这比之前那种机器人式的、语调呆呆的复现要好得多。就像上面提到的一样，有些东西光靠文字真不够，咱听的是那个调调。

Helen Wills神经科学研究所的神经科学家，兼加州大学伯克利分校的心理学教授Robert Knight表示，这是一项了不起的成果。

「对于我来说，音乐的魅力之一就在于它的前奏和所要表达的情感内容。而随着脑机接口领域的不断突破，这项技术就可以给有需要的人，通过植入的方式提供只有音乐才能提供的东西。受众可能包括患有渐冻人症的病人，或是癫痫病人，总之一切因为病症影响到语言输出神经的人。」

换句话说，我们现在能做的不仅仅是语言本身，与音乐相比，文字所表达的情感可能会显得有些单薄。我相信，从现在开始，我们才真正踏上了解读之旅

而随着脑电波记录技术的更迭，未来的某一天我们也有可能在不打开大脑的情况下，通过附着在头皮上的电极进行记录。

Knight表示，目前的头皮脑电图已经可以测量并记录一些大脑活动，比方说从一大串字母中检测出单个字母。虽说效率不高，每个字母都得花上至少20秒钟，但总归是个开始。

大力发展头皮电极的原因在于目前无创技术的熟练程度不够。换句话说，开颅测量无法百分之百确保安全性

头皮电极的测量准确度，特别是对于大脑深层的测量，仍然有待提高。可以说已经取得了一定的成功，但并不完全成功

能读心吗？

直接给答案：no。

打个比方，对于那些说话有障碍的人来说，脑机接口技术相当于给了他们一把「键盘」，通过捕捉脑电波的活动，他们就可以在这把「键盘」上打字，表达他们所想表达的。

例如，以霍金为例，他所使用的装置就是通过捕捉他的脑电波来生成机器人声音的语音

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

通过类比，你应该能够理解了。仅仅看到这个「键盘」，你无法知道它在想些什么。现在的技术使得键盘可以启动并输出语音。如果没有人想要输入，键盘就不会启动，你也无法知道它在想什么

所以，读心是不可行的

实验内容

请看下图，图A展示了实验中使用的歌曲的整体波形图。图A下方是该歌曲的听觉频谱图，最顶部的橙色条表示有人声出现

图B为X光片下，一名患者的电极覆盖图。每一个点代表着一个电极。

C图展示了B图中四个电极的电极信号。同时，图中还显示了歌曲刺激引发的高频活动（HFA），用下滑的黑色短线表示，频率在70到150赫兹之间

图D展示了A中一小段（10秒）歌曲播放时的放大听觉频谱图和电极神经活动图。我们可以观察到，HFA的时间点与频谱图中每个标出的矩形的右侧红色线条相吻合

这些配对情况就构成了研究人员用于训练和评估编码模型的示例。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

研究人员的实验结果显示，解码模型中用作预测因子的电极数量与预测准确率之间存在对数关系，如下图所示。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

例如，使用43个电极（或12.4%）可以获得80%的最佳预测准确率（最佳预测准确率即为使用所有347个电极的结果）。

在单个患者身上观察到了相同的关系，这是研究人员的发现

此外，通过引导分析，研究人员观察到数据集持续的时间与预测准确率之间也存在类似的对数关系，如下图所示。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

举个例子，如果使用长度为69秒（占总长度的36.1%）的数据，可以获得90%的最佳性能（最佳性能是指使用整首歌长190.72秒的数据得出的）

而关于模型类型，线性解码的平均解码准确率为0.325，而使用双层全连接神经网络的非线性解码的平均解码准确率则为0.429。

总体而言，线性音乐歌曲重建（音频S2）听起来闷闷的，对一些音乐元素（指人声音节和主音吉他）的存在有很强的节奏提示，但可能对另外一些元素的感知有限。

非线性歌曲重建的（音频S3）再现了一首可辨识的歌曲，与线性重建相比，细节更加丰富。音高和音色等频谱元素的感知质量明显提高，音素特征也更加清晰可辨。线性重建中存在的一些识别盲区也得到了一定程度的改进

以下是图示：

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

所以研究人员使用非线性模型通过第29个患者的61个电极重建了歌曲。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

这些模型的性能优于基于所有患者电极的线性重建，但解码准确度不及使用所有患者的347个电极所获得的准确度

在感知方面，这些基于单个患者的模型提供了足够高的频谱-时间的细节，足以让研究人员识别出歌曲（音频S4）

同时，为了评估基于单个患者的解码下限，研究人员从另外3位患者的脑神经活动中重建了歌曲，这3位患者的电极数量较少，分别为23、17和10个，而上述第29个患者的电极数量为61个，电极密度也相对较低。当然，还是覆盖了歌曲的反应区域，线性解码的准确性也算良好。

在重建的波形图（音频文件S5、S6 和 S7）中，研究人员检索到了部分人声。然后，他们将原始歌曲与解码歌曲的频谱图进行关联，对解码歌曲的可识别性进行了量化。

线性重构（下图A）和非线性重构（下图B）都提供了较高比例的正确识别率。

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

另外，研究人员分析了所有347个重要电极的STRF（频谱-时间接受域）系数，以评估不同音乐元素在不同脑区的编码情况。

这项分析揭示了不同频谱和时间的调谐模式

为了全面描述歌曲频谱图与神经活动之间的关系，研究人员对所有重要的STRFs进行了独立成分分析（ICA）。

研究人员发现了3个具有不同频谱-时间调谐模式的组成部分，每个部分的方差解释率均超过了5%，合计方差解释率达52.5%，如下图所示。

第一个部分（解释方差为28%）展示了一个正系数的集群，该集群在大约500Hz到7000Hz的宽频率范围内分布，并且在观察到HFA之前的约90ms的狭窄时间窗口内可见

这个瞬时集群显示了声音起始的调谐。这部分被称为起始部分，只出现在双侧STG后部的电极上，如下图所示的位置

UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！

最后，研究人员表示，未来的研究可能会扩大电极的覆盖范围，改变模型的特征和目标，或增加新的行为维度

理论要掌握，实操不能落！以上关于《UC伯克利脑机接口突破：利用脑电波重现音乐，为语言障碍者带来福音！》的详细介绍，大家都掌握了吧！如果想要继续提升自己的能力，那么就来关注golang学习网公众号吧！

AI 数据

版本声明

本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除

汽车的未来：拥抱智能制造

汽车的未来：拥抱智能制造

上一篇: 汽车的未来：拥抱智能制造

2023紫光展锐泛物联网终端生态论坛成功举办

下一篇: 2023紫光展锐泛物联网终端生态论坛成功举办

查看更多

最新文章

科技周边 · 人工智能 | 5天前 | 人工智能 · rag · 向量检索 · 知识库问答 · AI工程化 · 人工智能知识库 RAG 重排向量检索文档切分证据引用

AI 知识库检索召回工作流：从文档切分到重排和证据引用

191浏览收藏
科技周边 · 人工智能 | 1星期前 | JSON · 人工智能 · 结构化输出 · 大模型接口 · 后端接入 · 人工智能 JSON AI接口 Schema 结构化输出

AI 接口 JSON 返回不稳定排查：从提示词到结构化输出

299浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · mcp · ai agent · 工具接入 · 安全审计 · AI Agent MCP Model Context Protocol 工具清单资源上下文权限审计

MCP 服务接入工作流：从工具清单到权限审计的 AI Agent 落地路线

378浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · ai agent · 工具调用 · 结构化输出 · 工程排查 · AI Agent Schema 结构化输出超时重试工具调用兜底回答

AI Agent 工具调用失败排查：从 Schema 到超时兜底的完整工作流

195浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · rag · 知识库检索 · RAG 向量检索 AI知识库混合召回结果重排

AI 知识库检索不到答案排查：从分块到重排的 RAG 修复流程

453浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · AI工程 · 成本控制 · 人工智能成本控制 AI接口 token预算 Batch API

AI 批量调用成本控制：从请求日志到预算阈值的完整工作流

202浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · rag · 知识库 · AI工程实践 · 人工智能 RAG 知识库问答向量检索引用检查

AI 知识库回答跑偏怎么办：RAG 检索、重排和引用检查完整流程

419浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · ai agent · 工程实践 · AI Agent 上下文管理人工确认多智能体交接摘要

AI Agent 交接跑偏怎么办：从意图检查到交接摘要一步步排查

170浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · 质量检查 · AI应用 · 提示词工程 · 回归测试 · 大模型应用回归测试人工复核 AI提示词评分规则上线检查

AI 提示词回归测试实战：小样本集、评分规则和上线前对比

475浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · tracing · ai agent · 可观测性 · 工具调用 · 可观测性 AI Agent Tracing 工具调用 OpenAI Agents SDK

AI Agent Tracing 实战：工具调用、护栏和人工确认怎么追踪

292浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · ai agent · 工具调用 · 权限治理 · 人工智能审计日志 AI Agent 权限分级工具调用人工确认

AI Agent 工具权限分级实战：读、写、发布三类操作怎么管

379浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · AI应用 · 结构化输出 · 内容质检 · 提示词工程 · AI 提示词结构化输出 JSON Schema 质检流水线人工兜底

AI 输出质检流水线实战：规则检查、结构化结果和人工兜底

394浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

485次学习

查看更多

AI推荐

ljg-skills

ljg-skills 是李继刚开源的 AI 技能与提示词集合，面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板，适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。

2215次使用
MELO音乐

MELO音乐是一站式AI视频与音乐制作助手，对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐，MELO为你免费谱曲，轻松做同款！

2025次使用
UniScribe

UniScribe 是一款 AI 音视频转文字与内容整理工具，支持上传音频、视频文件或粘贴 YouTube 链接，自动生成转写文本、摘要、思维导图和关键问题，并支持多格式导出，适合会议记录、课程学习、访谈整理和内容创作复盘。

1980次使用
剧云

剧云是专业中文剧本创作平台，安全稳定运行十余年，集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能，数据安全防护，轻松高效创作剧本。

2192次使用
万象有声

万象有声，一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具，可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验，让有声书制作更简单！

2155次使用

查看更多

相关文章

AI写作工具免费版安装教程（含豆包Clawdbot）

2026-05-30 501浏览
WPS AI能自动生成PPT吗？输入主题一键制作演示文稿

2026-05-27 501浏览
Canva手机闪退解决方法及适配指南

2026-05-25 501浏览
Hermes Agent依赖的工具链有哪些必备工具链介绍

2026-05-05 501浏览
千问AI官网地址链接入口_千问AI官方网站登陆入口

2026-05-05 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码