Google DolphinGemma AI 解碼海豚語言：開源模型助力鯨豚動物交流研究

06:39, 15 四月

Edited by: Vera Mo

Google 推出了 DolphinGemma，這是一款旨在解碼海豚交流的人工智慧模型，由 Google 與喬治亞理工學院和野生海豚計畫 (WDP) 合作開發。DolphinGemma 利用 Google Gemma 模型背後的技術，分析海豚的聲音序列並預測後續聲音，類似於海豚咔噠聲、口哨聲和脈衝的自動完成功能。該系統的核心是 SoundStream 分詞器，它將海豚的聲音分成聲學單元，由自定義架構處理以識別模式。該模型使用 WDP 自 1985 年以來收集的數據進行訓練，研究巴哈馬的大西洋斑點海豚 (Stenella frontalis)。這些數據揭示了特定聲音和行為之間的相關性，例如母親和小牛使用的標誌性口哨聲，與緊張相關的間歇性「吱吱」聲，以及在求愛期間觀察到的「嗡嗡」點擊聲。 DolphinGemma 可以識別和重現合理的聲音序列。該模型擁有 4 億個參數，經過優化可在研究人員在現場使用的 Google Pixel 裝置上運行。 WDP 正在探索通過 CHAT（鯨豚聽覺增強遙測）系統與海豚進行交流，這是一種水下電腦，旨在引入基於與馬尾藻或圍巾等物體相關的合成口哨聲的共享詞彙。目標是建立符號互動，如果海豚模仿人工口哨聲來請求物體。 CHAT 最初在 Pixel 6 上運行，將升級到 Pixel 9，從而能夠同時運行深度學習模型和模式匹配算法。DolphinGemma 可以與 CHAT 一起使用來預測模仿嘗試，從而提高互動效果。 Google 計劃在 2025 年夏季發布 DolphinGemma 作為開源模型，該模型可適應其他物種，如寬吻海豚。其目的是加速科學發現，使研究人員能夠分析聲學數據集並為理解海洋哺乳動物做出貢獻。

发现错误或不准确的地方吗？

我们会尽快处理您的评论。