脑机接口将迎来AlphaGo时刻!我国首部标准发布
失语者重获新“声”,意识操控“照进现实”
作者/ IT时报 孙妍
编辑/ 潘少颖
肉体在现实中沉睡,意识却在虚拟文明里苏醒过来……尼奥猛然睁眼,从恍惚中清醒,那个自以为真实的母体系统,不过是一个由晶体管构成的世界。
《黑客帝国》这部科幻片承载了很多人对脑机接口最初的想象,包括上海脑机接口公司岩思类脑人工智能研究院首席科学家李孟。走进岩思类脑的办公室,将人霎时拉回《黑客帝国》的混沌中,但我们比以往更清晰地看到:《盗梦空间》的非侵入式手腕电极、《阿凡达》的意念操控化身正在照进现实。
在复旦大学附属华山医院,一位失语患者的意念被解码成完整语句,显示在电脑屏幕上,这背后是脑电大模型实现了对实时采集的脑电数据进行持续解码,并翻译成中文语句的全过程。脑机接口技术的突破,正在让渐冻症、脑卒中等失语患者重获新“声”。
脑机接口将迎来AlphaGo时刻!
国家药监局日前批准发布《采用脑机接口技术的医疗器械 术语》行业标准,明年1月1日正式实施。这不仅是我国第一部脑机接口医疗器械标准,在国际上也是处于领先地位的标准,为脑机接口行业提供了“通用语言”。
半秒内精准解码意念
芯片植入大脑18个月后,全球首位Neuralink受试者Noland Arbaugh激动地表示“就像重生了一样”,他不仅能用意念玩游戏、控制家电,还在重返大学、创业和公开演讲中找回生活的意义。
与马斯克旗下脑机接口公司Neuralink相似的是,岩思类脑也让数位在大脑中植入电极的受试者重新获得“中文表达”的能力。
超越正在发生,李孟带领团队研发了脑电大模型,可以在半秒内将意念精准解码为一句不限字数的完整语句。同时,他们将单个受试者的训练时间从两三个月压缩至100分钟。
患者的脑中被植入了8~10根电极,仅需100分钟、54个汉字的中文单字训练,就可以覆盖近2000个汉字。
这背后的技术逻辑类似于在ChatGPT等基座模型上微调后形成垂类大模型,“我们所做的大模型相当于脑机接口的操作系统,将记录到的大脑活动原始数据翻译成可用于人机交互的有效信息。”李孟向《IT时报》记者解释,脑机接口第一步是从脑电中读出数据,但数据并不代表信息,就像黑胶唱片的针读取了振动,再将振动翻译成音乐,音乐才是我们想要的信息。
中文解码的难度远高于英文解码,因为中文分声母和韵母,有400多个自由度,而英文音标有40多个自由度。此外,大模型需要将脑机接口读取的关键词“脑补”成一句连续的语句,在半秒钟内输出,是当前最难的脑机接口应用之一。
“这一突破得益于全球最大的人类颅内脑电数据库。”李孟表示,在这一数据库的加持下,岩思类脑脑电大模型应运而生。
华山医院院长毛颖曾介绍,在上海市科委支持下,华山医院利用多年积累的临床资源,建立了一个高质量颅内脑电数据库。同时,华山医院与国内多家神经外科头部医院组建了iBRAIN脑电数据联盟。
由于脑电数据属于生物数据,岩思类脑等联盟成员单位必须经过伦理审查,才能有限度地共享该高质量颅内脑电数据集,用于脑机接口技术和产品研发。
在李孟的畅想中,不久的将来,脑电大模型不仅能将意念解码成句子,还能生成一幅图片或一个视频,不断提升脑机接口系统的信息解读通量,越来越接近脑机接口的终极愿景。
走不同的路才能超越马斯克
时下主流的脑机接口多是以Neuralink为代表的侵入式技术流派,对某位病人的某项脑机接口功能进行单独建模,该方式的天然缺陷在于底层不能泛化,比如给两位病人A和B分别做语言输出和运动输出两种任务,给A训练的模型不能给B用,做语言解码的模型不能做运动解码。更难的是,个体在时间上也不能泛化。
脑机接口模型不能泛化会带来什么障碍?李孟打了个比方,每天早上,植入脑中的“电脑”需要开机15分钟才能启动,因为每天需要重新标定。有了可泛化的基座大模型后,只需几分钟就能完成系统校准,使脑机接口系统进入工作状态。
“生成式AI孕育出基座大模型,这让垂类大模型之间实现互通,那为什么不能用大语言模型的逻辑来解决脑机接口模型的泛化性问题?”这个灵感冲进李孟的脑子。
解决了泛化性问题,还要解决精准性问题。大模型的精准性往往由数据规模与质量来决定。于是,华山医院高质量颅内脑电数据库iBRAIN成了脑电大模型的“养料”。
在五六年间,华山医院前瞻性地积累了数百位癫痫病人的脑电数据,李孟提到,一般医院会在病人结束治疗后删掉这些数据,因为数据量十分庞大,需要一定的数据清洗、建档、存储成本,但是华山医院很有战略眼光,将这些数据保存下来。
“虽然我们已经实现局部超越,比如用大模型解决泛化性问题,用数据建起精准性壁垒,但马斯克旗下的Neuralink仍是脑机接口界的天花板,他们团队的工程化能力很强,或许走不同的路来超越马斯克是一个明智之举。”李孟认为。
用意念通关《黑神话:悟空》
在同济大学附属上海市养志康复医院,一位31岁的男性患者因脊髓小脑性共济失调导致行动受限,曾是游戏发烧友的他首次体验脑控技术,佩戴满布电线的脑电采集“帽子”,经过5分钟简单标定后,屏幕中的悟空就能随着他大脑的“意念”灵活走位、连续出招,全程不使用鼠标、键盘或手柄等外设。这是国内首例罕见病患者非侵入式脑机接口全指令集操控国产3A游戏《黑神话:悟空》实验。
“没想到我还能用脑子玩游戏,太帅了!”体验者感慨。
“我们的全指令集有10个自由度,包括角色移动和8种出招,已经超越了Neuralink的4个自由度,而且他们用侵入式脑机接口玩游戏,我们用的是非侵入式。”在李孟看来,侵入式脑机接口应该要完成非侵入式脑机接口不能完成的任务,才有意义。
毕竟大众对大脑植入异物的接受度并不高,一次开颅手术的成本为数万元,而且侵入式脑机接口还有一个重要问题亟待解决——如何维修和更换放入脑中的电极。人体有一套负责任的免疫系统,会对侵入人体的物质进行攻击,导致电极周围会被包裹上一层神经胶质细胞。Neuralink采用的柔性电极,虽然能减少对脑组织的损伤,采集更多的数据,但很难进行维修和更换。
在《黑神话:悟空》发布3个多月后,岩思类脑就实现了非侵入式、全指令集的脑控游戏,但这绝非易事。首先是要降低游戏画面闪动对脑电解码算法的干扰,其次是实时连续出招,甚至要与人类玩家过招,不容有太长的反应时间。
从单机到对战,难度不断升级,在与自动匹配的同等水平人类玩家《艾尔登法环》对战中,脑机系统的胜率甚至超过了五成。
“脑控游戏的AlphaGo时刻很快要来了!”李孟表示,这不仅证明了脑控游戏从“可用”走向“好用”,更意味着脑机接口技术跨过了实用门槛。
3~5年后我们将拥有“超能力”
脑控游戏的技能也在泛化,李孟团队将脑机接口定义为“人机交互的脑控万能遥控器”。在一个智能家居场景中,一位头戴脑电采集设备和AR眼镜的男士,用意念打开了音响,调节空调温度,这是在岩思类脑实验室里真实发生的一幕。可以想象,以后残障人士乃至所有普通人都可以拥有“超能力”——用意念操控身边的世界。
当前走入寻常百姓家的脑控设备寥寥无几,人类到底何时才能拥有这种“超能力”?
现代人生活节奏之快,让许多人都备受失眠困扰。李孟团队计划在年底上市一款闭环神经调控睡眠管理产品,就像一个降噪耳机,实时感受人脑的瞬间变化,用声音来按摩脑波,从而帮助失眠者快速入睡,但它的最终形态应该是一个头戴设备。
AR眼镜是非侵入式脑机接口的辅助载体,在李孟看来,以后可以将脑机接口与AR眼镜结合起来,用于拓展应用场景,比如操控智能家电。“我们甚至可以拥有脑控机器狗用于救灾等场景。”李孟畅想的是,植入式的终极形态大概就是《黑客帝国》所描绘的状态。
从顶层设计来看,脑机接口的技术路线图正在清晰化。2025年1月,上海市科学技术委员会印发《上海市脑机接口未来产业培育行动方案(2025—2030)》。根据《方案》,2027年前,上海要实现高质量脑控,半侵入式脑机接口产品在国内率先实现临床应用,侵入式脑机接口研发取得突破,脑机接口创新生态初步构建。2030年前,上海实现高质量控脑,脑机接口产品全面实现临床应用,打造全球脑机接口产品创新高地,产业链核心环节实现自主可控,打造国家级脑机接口产业发展集聚区。
在美国学习并工作九年,又在德国工作两年后,李孟选择回国创业,吸引他的正是国内丰富的临床资源和脑电数据,而国内临床资源最丰富的要数上海和北京。如今,产业集聚正在逐步解决生态问题,各项政策的出台正在逐步解决植入式脑机接口验证周期长达10年等诸多困难。
上海将通过“三区联动”空间布局,推动浦东、闵行、嘉定三大高端医疗器械产业集聚区建设,攻克如脑机接口、诊疗一体化等前沿技术,这是上海打造更具全球影响力的高端医疗器械产业发展高地的关键举措。
“侵入式脑机接口商业化落地,最快也得5年,而非侵入式脑机接口即将迎来商业化,大概在1~3年。”李孟给团队设计的技术路径是,神经调控、非侵入式、侵入式脑机接口“三条线”并行推进。
起步只有短短数年的中国脑机接口行业正在迎来黄金发展期,成为全球科技竞争的战略高地之一。在李孟看来,国内脑机接口行业赶超速度很快,有底气在2027年达到世界最高水平,在2030年实现全球领先。
排版/ 季嘉颖
图片/ 采访对象
来源/《IT时报》公众号vittimes
E N D