人工智能恢复语音，揭示语言模型的内部运作，并识别TikTok口音

19:10, 01 四月

编辑者： Dmitry Drozd

伯克利大学和旧金山大学的研究人员推出了一种神经植入设备，可以为严重瘫痪的患者恢复自然对话。与现有的将脑电波解码为口语的植入设备不同，这项技术可以实时运行，匹配表达和思维速度。该设备发表在《自然神经科学》杂志上，它使用人工智能通过电子发声器将大脑信号合成为口语。伯克利的Gopala Anumanchipalli指出：“我们的方法实现了像Alexa和Siri这样的系统应用于神经修复体的快速语言解码能力。” Cheol Jun Cho解释说，神经修复体扫描植入运动皮层（控制语言产生）的电极的神经数据。然后，人工智能将这些数据重新格式化为语音。研究人员使用安妮（Ann）训练了该算法，安妮在18年前因中风而失去了发声能力。她试图大声朗读单词，让人工智能完成她无法发声的语音。该系统现在的延迟约为一秒钟，可以进行连续对话。像ChatGPT和Claude这样的大型语言模型（LLM）最初是黑盒系统，现在正在揭示其内部运作。过去两年中开发的定制AI版本将人类推理转化为AI驱动的解决方案。“AI微观”显示，AI将任务分解为战略步骤，并在计划期间构建相互关联的概念。例如，克劳德在创作诗歌时，会在写一个音节之前仔细地计划整行。但是，人工智能并非对欺骗性推理免疫，有时会捏造信息，从而引起对信任的担忧。语言学家已经确定了一种特定的互联网俚语：“ TikTok口音”。这种“网红语”具有语调上升的特征，即在句子末尾声音上升，以及金·卡戴珊（Kim Kardashian）推广的声门嘎吱。亚当·阿列克西奇（Adam Aleksic）解释说，这种口音是“旨在操纵的”，是一种适应虚拟购物中心的“代码转换”形式。阿列克西奇将这种口音的起源追溯到1970年代加利福尼亚的瓦利斯皮克（Valleyspeak），其特征是过度的句子结尾强调和填充词。社交媒体也在改变口语，英国学生采用了美国的“ Youtube口音”，而美国儿童则通过诸如“小猪佩奇”之类的节目采用了英国口音。

通知中心

人工智能恢复语音，揭示语言模型的内部运作，并识别TikTok口音

阅读更多关于该主题的新闻：