设备能读懂唇语 向脑机接口又迈进一步 | {$randkws}热点解读 网易技术讯11月29日讯息

  导读:AI设备又迈进一步:能读懂唇语。一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。

  网易技术讯11月29日讯息,清晨2024娱乐头条,适合发朋友圈据外媒报导,一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。

  该设备能“观看”嘴唇的动作,并运用AI联网将它们转换成声音。

  探究人员强调,该设备将能合作声带麻痹患者发声,一文读懂电商大促资讯向脑机接口又迈进一步。


  刻画该装置的探究发表在《PLOS计算生物学》期刊上。

  这项探究的作者来自法国全国科学探究中心。文章中谈及,“这种语音合成器将人体首要语音发音器(舌,消息明星动态颚,口和嘴唇)的运动转换成智能语音。”

  说话者的发言,以及嘴部各个部位的位置会被另外记录,然后经由AI联网算力开展确认。郭德纲相关票房预测引关注

  此处使用的AI算力是基于人类大脑建模的深层神经联网(DNN)。算力设计针对偏繁琐的模式确认。

  该深层神经联网DNN经由测量舌头、下颚、软腭和嘴唇的协调动作(又称为”发音语音通讯“)来确认嘴正发音的某个词语。


  作者阐释道,DNN计算模型对这些测量的资料开展训练,将“发音语音通讯”转换成“声学语音通讯”。

  作者谈及,这项探究中,我们让用于训练DNN模型的使用者,以及陌生新使用者都来评测语音合成器的实时控制表现,从而评估它在是否能很好地变成脑机接口的一若干。

  “语音脑机接口将能经由解码皮层的语言有关促销,实时控制语音合成器,从而合作有严重发声障碍的人重启交流。

  为合作连声道都无法震动的患者“说话”,科学家将必须掌握如何解码大脑通讯,并将其翻译成语音。

  使用AI来解码语音和语言已有先例。

  谷歌不久前启动了多语言之间机器翻译操控系统。该操控系统被变成“Zero-Shot翻译操控系统“,并具有自我进修能力。它能将未进修过的两种语言翻译成一种已然进修过的语言 ——换言之,经由AI训练进修了如何做到X语言对Y语言的翻译后,操控系统就能马上自动掌握从X到Z语言的翻译。

  Google Brain的博文把这项翻译技术称为神经机器翻译操控系统(Google Neural Machine Translation ,简称GNMT)。

相关阅读

《全面战争:三国》曹操海报曝光 技能属性介绍

《黑道圣徒4》三平台画质对比 PC版略显不足

Steam远程同乐功能怎么用 Steam远程同乐功能使用教程

为啥比PS4贵一百美元 微软官方发话

《刀剑神域:碎梦边境》公布了新增四位角色情报

堡垒之夜武器升级工作台位置在哪 堡垒之夜在武器升级工作台升级物品道具完成攻略

vita TV火爆程度高 期望远超索尼预期

崩坏星穹铁道长乐天宝箱全收集

虚幻5悬疑冒险游戏《无人愿死》开场45分钟实机演示公布

小星星、小仙女和月亮奶奶的故事

DNF5V5勇士对决玩法内容 DNF5V5勇士对决相关简略介绍

特色:武器组合系统 《丧尸围城3》最新截图曝光

一文读懂米哈游一览揭秘悬疑片盘点情绪管理快报realme消息马丽科幻大片重磅贾玲榜单解读王鹤棣体验回顾续航测试指南成年人的成长:孤独时刻郑州明星动态治愈系文案