大脑中的文字被传送到电脑屏幕上

【字体: 时间:2023年08月28日 来源:med.stanford

编辑推荐:

  即使负责大声说出来的肌肉丧失了能力,我们的大脑也会记住如何表达单词。一种脑机连接装置正在使恢复语言的梦想成为现实。

  

弗兰克·威利特(Frank Willett)操作的软件可以将帕特·贝内特(Pat Bennett)尝试说话的声音——由她大脑中的传感器记录下来——转换成屏幕上的文字。

帕特·班尼特的处方比“吃几片阿司匹林,早上给我打电话”要复杂一些。但在她的大脑中植入了四个婴儿阿司匹林大小的传感器,旨在解决一个困扰她和其他人的问题:失去清晰说话的能力。该设备将信号从贝内特大脑中与语言相关的几个区域传输到最先进的软件,该软件解码她的大脑活动,并将其转换为显示在电脑屏幕上的文本。

现年68岁的贝内特曾是一名人力资源总监,曾经是马术运动员,每天都慢跑。2012年,她被诊断出患有肌萎缩性侧索硬化症,这是一种进行性神经退行性疾病,会攻击控制运动的神经元,导致身体虚弱,最终瘫痪。

“当你想到肌萎缩侧索硬化症时,你会想到胳膊和腿受到的冲击,”贝内特在接受电子邮件采访时写道。“但在一群肌萎缩侧索硬化症患者中,它始于语言障碍。我说不出话来了。”

通常,ALS首先表现在身体的外围-手臂和腿,手和手指。对于贝内特来说,病情的恶化并不是像一般情况那样始于脊髓,而是始于脑干。她仍然可以走动,自己穿衣服,用手指打字,尽管难度越来越大。但是她再也不能使用嘴唇、舌头、喉头和下颚的肌肉来清晰地发出音素——或者是声音的单位,比如sh——这些是语言的基本组成部分。

虽然贝内特的大脑仍然可以制定出产生这些音素的方向,但她的肌肉无法执行这些命令。

2022年3月29日,斯坦福大学医学院的一位神经外科医生在班尼特大脑表面的两个不同区域分别放置了两个微型传感器,这两个传感器都与语言产生有关。这些传感器是皮质内脑机接口(iBCI)的组成部分。与最先进的解码软件相结合,它们被设计成将大脑活动转化为屏幕上的文字。

手术后大约一个月,斯坦福大学的一个科学家团队开始了每周两次的研究会议,以训练翻译她讲话的软件。四个月后,班尼特尝试的话语以每分钟62个单词的速度在电脑屏幕上转换成单词,比之前脑机接口辅助交流记录的速度快了三倍多。

帕特·贝内特因为ALS失去了说话的能力。史蒂夫·费斯

班尼特写道:“这些初步的结果已经证明了这个概念,最终技术将会赶上来,让那些不会说话的人也能轻松地使用它。”“对于那些不会说话的人来说,这意味着他们可以与更大的世界保持联系,也许可以继续工作,维持朋友和家庭关系。”

接近说话速度的

进行手术的外科医生杰米·亨德森博士说,班尼特的语速开始接近每分钟160个单词的自然语速。

亨德森说:“我们已经证明,你可以通过记录大脑表面很小一块区域的活动来解码预定的语言。”

亨德森是神经外科的约翰和简·布鲁姆-罗伯特和露丝·哈尔佩林教授,他是8月23日发表在《自然》杂志上的一篇描述研究结果的论文的资深作者之一。他的合著者,电子工程和生物工程教授Krishna Shenoy博士,在研究发表之前就去世了。

弗兰克·威利特博士是霍华德·休斯医学研究所的一名科学家,隶属于亨德森和谢诺伊于2009年共同创立的神经修复转化实验室,他与研究生艾琳·昆兹和范超飞共同撰写了这项研究。

2021年,亨德森、谢诺伊和威利特共同撰写了一项发表在《自然》杂志上的研究,描述了他们成功地利用iBCI将瘫痪患者想象中的笔迹转化为屏幕上的文字,速度达到每分钟90个字符,即18个单词,这是迄今为止iBCI相关方法的世界纪录。

当贝内特得知亨德森和谢诺伊的工作后,她与亨德森取得了联系,并自愿参加了临床试验。

它是如何工作的

亨德森将传感器植入贝内特的大脑皮层,即大脑的最外层,是由微小硅电极组成的方形阵列。每个阵列包含64个电极,排列成8 × 8的网格,彼此之间的距离约为信用卡厚度的一半。电极穿透大脑皮层的深度大致相当于两个堆叠的四分之一。

植入的阵列被连接在细小的金线上,这些金线从固定在头骨上的基座上穿出来,然后通过电缆连接到计算机上。

一个人工智能算法接收并解码来自贝内特大脑的电子信息,最终教会自己区分与她试图形成英语口语的39个音素中的每一个相关联的独特的大脑活动。它将关于班尼特尝试的音素序列的最佳猜测提供给所谓的语言模型,本质上是一个复杂的自动校正系统,它将音素流转换成它们所代表的单词序列。


威利特解释说:“这个系统经过训练,知道哪些单词应该出现在其他单词之前,以及哪些音素构成哪些单词。如果一些音素被错误地解释了,它仍然可以做出很好的猜测。”

熟能生巧

为了教该算法识别哪些大脑活动模式与哪些音素相关,贝内特进行了大约25次训练,每次训练持续约4小时,在此期间,她试图重复从一个由打电话的人的谈话样本组成的大型数据集中随机选择的句子。

举个例子:“在过去的五年里,情况一直是这样。”另一个:“我中途离开了。”

当贝内特试图背诵每一个句子时,她的大脑活动会被解码器翻译成音素流,然后由自动纠正系统组装成单词,这些活动会显示在原始句子下方的屏幕上。然后一个新的句子就会出现在屏幕上。

班尼特每次训练重复260到480个句子。整个系统不断改进,因为它熟悉了贝内特在尝试说话时的大脑活动。

iCBI的意向语音翻译能力在不同的句子上进行了测试,这些句子与培训课程中使用的句子不同。当句子和单词组合语言模型被限制在50个单词的词汇表中时(在这种情况下,所使用的句子是从一个特殊的列表中抽取的),翻译系统的错误率为9.1%。

当词汇量扩大到125,000个单词时(足够大,几乎可以写任何你想说的东西),错误率上升到23.8%——远非完美,但与之前的技术水平相比,这是一个巨大的进步。

威利特说:“这是一个概念的科学证明,而不是人们日常生活中可以使用的实际设备。但这是一个巨大的进步,可以帮助瘫痪、不能说话的人恢复快速沟通。”

“想象一下,”贝内特写道,“当非语言的人能够实时交流他们的想法时,购物、赴约、点餐、去银行、打电话、表达爱或感激——甚至争吵等日常活动将会有多么不同。”



相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:大脑|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号