从“脑电翻译”到“意念对话”:语音合成+脑机接口重塑人机交互新边界

发布时间:2026/2/7 11:55:49

语音合成与脑机接口的结合正引领人机交互迈向新纪元。在医疗领域,这一技术为失语症患者带来希望。加州大学戴维斯分校团队通过植入256通道微电极阵列,捕捉渐冻症患者大脑语言运动区信号,结合深度学习模型,实现仅8.5毫秒延迟的实时语音合成,患者甚至能哼唱旋律。中国“北脑一号”系统采用128通道柔性电极,帮助渐冻症患者恢复语言交流,且手术创伤更小。

技术突破体现在多维度:一是信号解码精度提升,荷兰团队开发的模型实现单字92%―100%的分类准确率;二是语音自然度优化,通过患者失语前录音训练AI,合成语音的音色、语调高度还原;三是跨语言支持,复旦团队针对汉语四声调开发的模型,单字解码正确率达91%。

未来,该技术将向“意图解码”深化。当前研究主要针对语言运动皮层,而未来需突破至更高阶脑区,结合大语言模型生成语义完整的表述,最终实现“所想即所得”的终极目标。

讯飞星火认知大模型

综合性能显著提升,整体对标OpenAI o3;复杂问题分步拆解,回答效果深入全面,参考信源丰富优质;深入垂直场景与核心需求,为个体和企业提供开箱即用的大模型应用;星火大模型API让您的应用快速拥有领先的AI大模型能力,接口丰富,价格灵活,支持在线调试

扒站工具