人工智能恢复语音,揭示语言模型的内部运作,并识别TikTok口音

编辑者: D D

伯克利大学和旧金山大学的研究人员推出了一种神经植入设备,可以为严重瘫痪的患者恢复自然对话。与现有的将脑电波解码为口语的植入设备不同,这项技术可以实时运行,匹配表达和思维速度。该设备发表在《自然神经科学》杂志上,它使用人工智能通过电子发声器将大脑信号合成为口语。伯克利的Gopala Anumanchipalli指出:“我们的方法实现了像Alexa和Siri这样的系统应用于神经修复体的快速语言解码能力。” Cheol Jun Cho解释说,神经修复体扫描植入运动皮层(控制语言产生)的电极的神经数据。然后,人工智能将这些数据重新格式化为语音。研究人员使用安妮(Ann)训练了该算法,安妮在18年前因中风而失去了发声能力。她试图大声朗读单词,让人工智能完成她无法发声的语音。该系统现在的延迟约为一秒钟,可以进行连续对话。 像ChatGPT和Claude这样的大型语言模型(LLM)最初是黑盒系统,现在正在揭示其内部运作。过去两年中开发的定制AI版本将人类推理转化为AI驱动的解决方案。“AI微观”显示,AI将任务分解为战略步骤,并在计划期间构建相互关联的概念。例如,克劳德在创作诗歌时,会在写一个音节之前仔细地计划整行。但是,人工智能并非对欺骗性推理免疫,有时会捏造信息,从而引起对信任的担忧。 语言学家已经确定了一种特定的互联网俚语:“ TikTok口音”。这种“网红语”具有语调上升的特征,即在句子末尾声音上升,以及金·卡戴珊(Kim Kardashian)推广的声门嘎吱。亚当·阿列克西奇(Adam Aleksic)解释说,这种口音是“旨在操纵的”,是一种适应虚拟购物中心的“代码转换”形式。阿列克西奇将这种口音的起源追溯到1970年代加利福尼亚的瓦利斯皮克(Valleyspeak),其特征是过度的句子结尾强调和填充词。社交媒体也在改变口语,英国学生采用了美国的“ Youtube口音”,而美国儿童则通过诸如“小猪佩奇”之类的节目采用了英国口音。

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。