La IA DolphinGemma de Google decodifica el lenguaje de los delfines: modelo de código abierto para ayudar a la investigación de la comunicación de cetáceos

Edited by: Vera Mo

Google ha presentado DolphinGemma, un modelo de IA diseñado para decodificar la comunicación de los delfines, desarrollado en colaboración con el Georgia Institute of Technology y el Wild Dolphin Project (WDP). DolphinGemma utiliza la tecnología de los modelos Gemma de Google, analizando las secuencias vocales de los delfines y prediciendo los sonidos subsiguientes, de forma similar a la función de autocompletar para los clics, silbidos y pulsos de los delfines. El núcleo del sistema es el tokenizador SoundStream, que divide los sonidos de los delfines en unidades acústicas procesadas por una arquitectura personalizada para identificar patrones. El modelo se entrenó utilizando datos recopilados por el WDP desde 1985, estudiando delfines moteados del Atlántico (Stenella frontalis) en las Bahamas. Estos datos revelaron correlaciones entre sonidos y comportamientos específicos, como los silbidos de firma utilizados por las madres y las crías, los 'chillidos' intermitentes asociados con la tensión y los clics de 'zumbido' observados durante el cortejo. DolphinGemma reconoce y reproduce secuencias vocales plausibles. Con 400 millones de parámetros, está optimizado para funcionar en dispositivos Google Pixel utilizados por investigadores en el campo. El WDP está explorando la comunicación con los delfines a través del sistema CHAT (Cetacean Hearing Augmentation Telemetry), una computadora submarina diseñada para introducir un vocabulario compartido basado en silbidos sintéticos vinculados a objetos como el sargazo o las bufandas. El objetivo es establecer una interacción simbólica si los delfines imitan los silbidos artificiales para solicitar objetos. CHAT, que inicialmente se ejecutaba en un Pixel 6, se actualizará a Pixel 9, lo que permitirá modelos de aprendizaje profundo simultáneos y algoritmos de coincidencia de patrones. DolphinGemma se puede utilizar con CHAT para predecir intentos de imitación, mejorando la eficacia de la interacción. Google planea lanzar DolphinGemma como un modelo de código abierto en el verano de 2025, adaptable a otras especies como los delfines mulares. El objetivo es acelerar el descubrimiento científico, permitiendo a los investigadores analizar conjuntos de datos acústicos y contribuir a la comprensión de los mamíferos marinos.

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.