バークレー大学とサンフランシスコ大学の研究者らは、重度の麻痺患者の自然な会話を回復させる神経インプラントを発表しました。脳波を音声に変換する既存のインプラントとは異なり、この技術はリアルタイムで動作し、表現と思考の速度を一致させます。 *Nature Neuroscience* に掲載されたこのデバイスは、AIを使用して脳信号を電子ボイスシンセサイザーを介して音声に合成します。バークレーのゴパラ・アヌマンチパッリは、「私たちのアプローチは、AlexaやSiriのようなシステムの迅速な言語デコード能力を神経補綴に適用したものです」と述べています。 チョル・ジュン・チョーは、このニューロプロテーゼが、言語生成を制御する運動皮質に埋め込まれた電極からの神経学的データをスキャンすると説明しています。次に、AIはこのデータを音声に再構成します。研究者らは、18年前に脳卒中により発声能力を失った患者であるアンを使用してアルゴリズムを訓練しました。彼女は言葉を声に出して読もうとし、AIが彼女が発声できなかったスピーチを完了できるようにしました。このシステムは現在、約1秒の遅延があり、継続的な会話を可能にしています。 ChatGPTやClaudeのような大規模言語モデル(LLM)は、当初はブラックボックスシステムでしたが、現在ではその内部構造を明らかにしています。過去2年間に開発されたカスタムAIバージョンは、人間の推論をAI主導のソリューションに変換します。「AI顕微鏡」は、AIがタスクを戦略的なステップに分割し、計画中に相互接続された概念を構築することを示しています。たとえば、Claudeは詩を作るときに、単一の音節を書く前に、行全体を綿密に計画します。ただし、AIは欺瞞的な推論に対して免疫がなく、情報を捏造することがあり、信頼に関する懸念が高まっています。 言語学者は、特定のインターネットスラングである「TikTokアクセント」を特定しました。この「インフルエンサースピーク」は、文末で声が上がるアップスピークと、キム・カーダシアンによって普及したボーカルフライを特徴としています。アダム・アレクシッチは、このアクセントは「操作するように設計されており」、仮想ショッピングモールに適応した「コードスイッチング」の一形態であると説明しています。アレクシッチは、このアクセントの起源を、過度の文末強調とフィラーワードを特徴とする1970年代のカリフォルニアのバレースピークにまで遡ります。ソーシャルメディアも話し言葉を変えており、イギリスの学生はアメリカの「Youtubeアクセント」を採用し、アメリカの子供たちは「Peppa Pig」のような番組を通じてイギリスのアクセントを採用しています。
AIが発話を回復、言語モデルの内部構造を明らかにし、TikTokアクセントを特定
編集者: D D
このトピックに関するさらに多くのニュースを読む:
エラーや不正確な情報を見つけましたか?
できるだけ早くコメントを考慮します。