GoogleのDolphinGemma AIがイルカの言語を解読:鯨類のコミュニケーション研究を支援するオープンソースモデル

Edited by: Vera Mo

Googleは、ジョージア工科大学およびワイルド・ドルフィン・プロジェクト(WDP)と共同で開発された、イルカのコミュニケーションを解読するために設計されたAIモデル、DolphinGemmaを発表しました。DolphinGemmaは、GoogleのGemmaモデルの背後にあるテクノロジーを使用し、イルカの発声シーケンスを分析し、イルカのクリック音、口笛、パルスのオートコンプリートのように、後続の音を予測します。 システムの中核はSoundStreamトークナイザーであり、イルカの音を音響ユニットに分割し、カスタムアーキテクチャによって処理してパターンを識別します。このモデルは、1985年以来WDPによって収集された、バハマのタイセイヨウマダライルカ(Stenella frontalis)を研究したデータを使用してトレーニングされました。 このデータは、母親と子供が使用する特徴的な口笛、緊張に関連する断続的な「キーキー」音、求愛中に観察される「ブーン」というクリック音など、特定の音と行動の間の相関関係を明らかにしました。DolphinGemmaは、もっともらしい発声シーケンスを認識して再現します。4億のパラメーターを備えており、現場の研究者が使用するGoogle Pixelデバイスで実行するように最適化されています。 WDPは、サルガッサムやスカーフなどのオブジェクトにリンクされた合成口笛に基づく共通の語彙を導入するように設計された水中コンピューターであるCHAT(Cetacean Hearing Augmentation Telemetry)システムを介して、イルカとのコミュニケーションを調査しています。目標は、イルカがオブジェクトを要求するために人工的な口笛を模倣する場合、象徴的な相互作用を確立することです。 当初Pixel 6で実行されていたCHATは、Pixel 9にアップグレードされ、同時ディープラーニングモデルとパターンマッチングアルゴリズムが可能になります。DolphinGemmaはCHATとともに使用して、模倣の試みを予測し、相互作用の有効性を高めることができます。Googleは、DolphinGemmaを2025年夏にオープンソースモデルとしてリリースする予定であり、バンドウイルカなどの他の種にも適応できます。目標は、科学的発見を加速し、研究者が音響データセットを分析し、海洋哺乳類の理解に貢献できるようにすることです。

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。