Google IA : “Dauphin” avec DolphinGemma

C’est le type d’application d’intelligence artificielle qui attire vraiment l’attention. Des chercheurs ont développé DolphinGemma, le premier grand modèle de langage (LLM) conçu pour comprendre la communication des dauphins. Cette avancée pourrait accélérer considérablement notre capacité à traduire ce que disent ces créatures fascinantes, un travail qui, jusqu’à présent, a pris des décennies de recherches manuelles.
La vision du dauphin qui parle
Selon Dr. Denise Herzing, fondatrice du Wild Dolphin Project (WDP), « L’objectif est un jour de pouvoir parler dauphin. » Son organisation étudie exclusivement un groupe de dauphins tachetés de l’Atlantique vivant au large des côtes des Bahamas. Elle enregistre et organise leurs vocalisations depuis plus de 40 ans et a collaboré avec Dr. Thad Starner, chercheur chez Google DeepMind.
Ensemble, ils ont formé une IA avec une vaste bibliothèque de sons de dauphins. Le modèle peut être continuellement enrichi de nouvelles données et affiné pour représenter plus précisément ce que ces sons pourraient signifier. « Alimenter une IA avec des sons de dauphins comme DolphinGemma nous donnera une meilleure compréhension des motifs et des subtilités que les humains pourraient manquer », a expliqué Herzing.
Méthodes de communication des dauphins
Ces mammifères marins communiquent par divers sons, y compris des sifflements (dont certains servent de noms), des clics d’écholocation pour la chasse, et des sons en rafales pour les interactions sociales.

Depuis les années 1980, les scientifiques utilisent des microphones sous-marins (hydrophones) pour enregistrer ces sons, les analysant à l’aide de spectrogrammes. Ensuite, ils rejouent les sons pour observer les réactions des dauphins. Ce processus manuel est très laborieux, ce qui fait de l’utilisation de l’IA un véritable changement de jeu.

Le nouveau modèle linguistique de l’équipe, basé sur la même technologie que les modèles Gemini de Google et son chatbot populaire, représente les sons des dauphins sous forme de « tokens », ou unités sonores interprétatives. L’équipe l’a formé en utilisant la base de données acoustique du WDP, et il peut identifier des modèles et des structures dans les vocalisations des dauphins, prédire même quel sera le prochain son — tout comme les suggestions de recherche de Google ou le texte prédictif lors de la rédaction d’e-mails.
Aller encore plus loin : Tenter de communiquer avec les dauphins
Mais les chercheurs ne veulent pas seulement observer les dauphins se parler entre eux — ils cherchent à communiquer directement avec eux. Depuis les années 1990, l’équipe d’Herzing expérimente des moyens rudimentaires de “parler” aux dauphins. La première tentative impliquait un grand clavier de la taille d’un dauphin, fixé sur le côté d’un bateau, chaque touche correspondant à un sifflement artificiel associé à un jouet. L’idée était que les dauphins pointent les touches pour demander des jouets.
Au fil du temps, cela a évolué vers un clavier portable sous-marin. Bien que cela n’ait pas conduit à de véritables conversations, cela a montré que les dauphins étaient attentifs et disposés à apprendre. En 2010, l’équipe a commencé à collaborer avec le Georgia Institute of Technology, où Starner est professeur, pour développer des technologies de communication plus sophistiquées.
Cela a conduit à la création du système CHAT (Cetacean Hearing and Telemetry) — un dispositif portable avec des hydrophones, des haut-parleurs et une interface pour les plongeurs. Il détectait des sifflements spécifiques des dauphins et les associait à des objets ou des concepts. Les chercheurs pouvaient alors déclencher des sifflements artificiels pour “parler” aux dauphins.
Intégration des smartphones pour une communication améliorée
Plus récemment, l’équipe a intégré des smartphones (Google Pixel) dans le système, le rendant plus petit, plus efficace et plus facile à utiliser. L’idée est de démontrer une action, comme remettre un jouet, et de jouer un son pour que le dauphin puisse l’associer à l’objet. Si le dauphin imite le son, le système informe le chercheur, qui répond ensuite en fournissant l’objet demandé, renforçant ainsi la connexion.
Avec l’IA qui prédit les réponses et identifie les motifs plus rapidement, les scientifiques peuvent interagir de manière plus naturelle avec les dauphins. La nouvelle version de CHAT consomme moins d’énergie et peut être entretenue plus facilement que son prédécesseur.

L’équipe WDP déploiera DolphinGemma lors de la prochaine saison sur le terrain. Google a déclaré qu’elle rendra le modèle disponible publiquement d’ici la mi-année, permettant aux chercheurs du monde entier de l’utiliser. L’espoir est qu’avec quelques ajustements, le modèle puisse également être adapté à d’autres espèces de cétacés, comme les dauphins à gros nez ou les dauphins tournants.
Si les dauphins ont une langue, ils ont probablement aussi une culture, a souligné Starner. Comprendre de quoi ils parlent, quelles sont leurs priorités et comment leurs sociétés fonctionnent pourrait nous offrir une toute nouvelle perspective sur la communication et l’intelligence dans le règne animal.
Lire l’article original sur :New Atlas
Lire la suite : Dolphins in Gulf Found Contaminated with Fentanyl