Google a présenté DolphinGemma, un modèle d'IA conçu pour décoder la communication des dauphins, développé en collaboration avec le Georgia Institute of Technology et le Wild Dolphin Project (WDP). DolphinGemma utilise la technologie des modèles Gemma de Google, analysant les séquences vocales des dauphins et prédisant les sons suivants, un peu comme la saisie semi-automatique pour les clics, les sifflements et les pulsations des dauphins. Au cœur du système se trouve le tokenizer SoundStream, qui divise les sons des dauphins en unités acoustiques traitées par une architecture personnalisée pour identifier les schémas. Ce modèle a été entraîné à l'aide de données collectées par le WDP depuis 1985, étudiant les dauphins tachetés de l'Atlantique (Stenella frontalis) aux Bahamas. Ces données ont révélé des corrélations entre des sons et des comportements spécifiques, tels que les sifflements de signature utilisés par les mères et les veaux, les « couinements » intermittents associés à la tension et les clics de « bourdonnement » observés pendant la parade nuptiale. DolphinGemma reconnaît et reproduit des séquences vocales plausibles. Avec 400 millions de paramètres, il est optimisé pour fonctionner sur les appareils Google Pixel utilisés par les chercheurs sur le terrain. Le WDP explore la communication avec les dauphins via le système CHAT (Cetacean Hearing Augmentation Telemetry), un ordinateur sous-marin conçu pour introduire un vocabulaire partagé basé sur des sifflements synthétiques liés à des objets comme le sargassum ou les écharpes. L'objectif est d'établir une interaction symbolique si les dauphins imitent les sifflements artificiels pour demander des objets. CHAT, initialement exécuté sur un Pixel 6, sera mis à niveau vers Pixel 9, permettant des modèles d'apprentissage profond simultanés et des algorithmes de correspondance de motifs. DolphinGemma peut être utilisé avec CHAT pour prédire les tentatives d'imitation, améliorant ainsi l'efficacité de l'interaction. Google prévoit de publier DolphinGemma en tant que modèle open source à l'été 2025, adaptable à d'autres espèces comme les grands dauphins. L'objectif est d'accélérer la découverte scientifique, permettant aux chercheurs d'analyser des ensembles de données acoustiques et de contribuer à la compréhension des mammifères marins.
L'IA DolphinGemma de Google décode le langage des dauphins : un modèle open source pour aider la recherche sur la communication des cétacés
Edited by: Vera Mo
Avez-vous trouvé une erreur ou une inexactitude ?
Nous étudierons vos commentaires dans les plus brefs délais.