脑机接口首次让语言障碍患者实现说话唱歌

11 阅读：128 2025-06-13 08:56:03 评论：0

一名患有严重语言障碍的男子，借助大脑植入装置，能够富有表现力地说话和歌唱。该装置可以将他的神经活动转化为话语，不仅能实现语调变化，强调他选择的单词，还能让他以3个音调哼唱一串音符。

该系统被称为脑机接口（BCI），使用人工智能解码参与者说话时的脑电活动。该装置是第一个不仅能再现一个人的意图，还能复制自然语言特征的BCI。而音调、音高、重音等自然语言特征有助于表达意思和情感。

在一项研究中，一种模仿参与者声音的合成声音，在他的神经活动发出说话意图信号的10毫秒内就说出了他的话。这项6月11日发表于《自然》的研究成果标志着对早期BCI的重大改进。早期BCI通常在3秒内输出语音，或者仅在用户模拟完整个句子后才能生成语音。

植入运动皮层的电极有助于记录和语言相关的大脑活动。图片来源：Kateryna Kon

“这是语音BCI领域的圣杯。”荷兰马斯特里赫特大学的Christian Herff说，“这是真实、自发、连续的讲话。”

这项研究的参与者是一名45岁男子，在患上一种运动神经元疾病——肌萎缩侧索硬化症后，失去了清晰说话的能力。这种疾病会损害控制肌肉运动的神经，包括说话所需的神经。虽然他还能发音和说话，但说得很慢，也不清楚。

在症状出现5年后，这名男子接受了手术，在控制运动的大脑区域插入256个硅电极，每个长1.5毫米。论文作者之一、美国加利福尼亚大学戴维斯分校的Maitreyee Wairagkar和同事训练了深度学习算法，能够每10毫秒捕捉一次大脑中的信号。团队的系统实时解码了该男子试图发出的声音，而不是他想要表达的具体词语或基本音素——构成单词的语音亚单位。

“我们并不总是用语言表达想法。我们还有感叹词，以及一些词汇表里没有的富有表现力的发音。为了实现这一点，我们采用了这种完全不受限制的方法。”Wairagkar解释说。

该团队还通过训练人工智能算法，根据病人生病前的采访录音，将合成声音个性化，使其听起来像病人自己的声音。

研究人员要求参与者尝试发出“啊”“哦”“嗯”之类的感叹词，并说出虚构的单词。BCI成功产生了这些声音，表明它可以在不需要固定词汇的情况下生成语音。

使用这款BCI，这名男子可以拼写单词、回答开放式问题，并使用解码器训练数据库之外的一些单词说出想说的话。他告诉研究人员，听到合成声音说话让他“感到高兴”，感觉就像他的“真实声音”。

在其他实验中，BCI能够识别出参与者是想把一个句子说成疑问句还是陈述句。该装置还能判断他在一句话中想强调哪些词语，并相应调整合成声音的语调。“我们正在引入人类语言中所有这些重要的元素。”Wairagkar说，以前的BCI只能产生单调的语音。

瑞士日内瓦大学的Silvia Marchesotti说，该装置的功能“对于患者的日常使用至关重要”。“从某种意义上说，这是一种范式转变，可以真正带来一种现实生活中的工具。”

相关论文信息：https://doi.org/10.1038/s41586-025-09127-3

（原标题为《脑机接口首次让患者有感情地说话唱歌，可实时将思想转化为语言》）