Google 推出了 DolphinGemma,這是一款旨在解碼海豚交流的人工智慧模型,由 Google 與喬治亞理工學院和野生海豚計畫 (WDP) 合作開發。DolphinGemma 利用 Google Gemma 模型背後的技術,分析海豚的聲音序列並預測後續聲音,類似於海豚咔噠聲、口哨聲和脈衝的自動完成功能。 該系統的核心是 SoundStream 分詞器,它將海豚的聲音分成聲學單元,由自定義架構處理以識別模式。 該模型使用 WDP 自 1985 年以來收集的數據進行訓練,研究巴哈馬的大西洋斑點海豚 (Stenella frontalis)。這些數據揭示了特定聲音和行為之間的相關性,例如母親和小牛使用的標誌性口哨聲,與緊張相關的間歇性「吱吱」聲,以及在求愛期間觀察到的「嗡嗡」點擊聲。 DolphinGemma 可以識別和重現合理的聲音序列。該模型擁有 4 億個參數,經過優化可在研究人員在現場使用的 Google Pixel 裝置上運行。 WDP 正在探索通過 CHAT(鯨豚聽覺增強遙測)系統與海豚進行交流,這是一種水下電腦,旨在引入基於與馬尾藻或圍巾等物體相關的合成口哨聲的共享詞彙。目標是建立符號互動,如果海豚模仿人工口哨聲來請求物體。 CHAT 最初在 Pixel 6 上運行,將升級到 Pixel 9,從而能夠同時運行深度學習模型和模式匹配算法。DolphinGemma 可以與 CHAT 一起使用來預測模仿嘗試,從而提高互動效果。 Google 計劃在 2025 年夏季發布 DolphinGemma 作為開源模型,該模型可適應其他物種,如寬吻海豚。其目的是加速科學發現,使研究人員能夠分析聲學數據集並為理解海洋哺乳動物做出貢獻。
Google DolphinGemma AI 解碼海豚語言:開源模型助力鯨豚動物交流研究
Edited by: Vera Mo
发现错误或不准确的地方吗?
我们会尽快处理您的评论。