Google IA : “Dauphin” avec DolphinGemma

Google IA : “Dauphin” avec DolphinGemma

Crédit : Depositphotos

C’est le type d’application d’intelligence artificielle qui attire vraiment l’attention. Des chercheurs ont développé DolphinGemma, le premier grand modèle de langage (LLM) conçu pour comprendre la communication des dauphins. Cette avancée pourrait accélérer considérablement notre capacité à traduire ce que disent ces créatures fascinantes, un travail qui, jusqu’à présent, a pris des décennies de recherches manuelles.

La vision du dauphin qui parle

Selon Dr. Denise Herzing, fondatrice du Wild Dolphin Project (WDP), « L’objectif est un jour de pouvoir parler dauphin. » Son organisation étudie exclusivement un groupe de dauphins tachetés de l’Atlantique vivant au large des côtes des Bahamas. Elle enregistre et organise leurs vocalisations depuis plus de 40 ans et a collaboré avec Dr. Thad Starner, chercheur chez Google DeepMind.

Ensemble, ils ont formé une IA avec une vaste bibliothèque de sons de dauphins. Le modèle peut être continuellement enrichi de nouvelles données et affiné pour représenter plus précisément ce que ces sons pourraient signifier. « Alimenter une IA avec des sons de dauphins comme DolphinGemma nous donnera une meilleure compréhension des motifs et des subtilités que les humains pourraient manquer », a expliqué Herzing.

Méthodes de communication des dauphins

Ces mammifères marins communiquent par divers sons, y compris des sifflements (dont certains servent de noms), des clics d’écholocation pour la chasse, et des sons en rafales pour les interactions sociales.

Un groupe de dauphins tachetés de l’Atlantique, comme ceux étudiés par le Wild Dolphin Project au large des côtes des Bahamas.

Depuis les années 1980, les scientifiques utilisent des microphones sous-marins (hydrophones) pour enregistrer ces sons, les analysant à l’aide de spectrogrammes. Ensuite, ils rejouent les sons pour observer les réactions des dauphins. Ce processus manuel est très laborieux, ce qui fait de l’utilisation de l’IA un véritable changement de jeu.

À gauche : Une mère dauphin tacheté observe son petit pendant la chasse ; elle utilisera son sifflement signature unique pour appeler son petit une fois qu’il a fini. À droite : Spectrogramme pour visualiser le sifflement.

Le nouveau modèle linguistique de l’équipe, basé sur la même technologie que les modèles Gemini de Google et son chatbot populaire, représente les sons des dauphins sous forme de « tokens », ou unités sonores interprétatives. L’équipe l’a formé en utilisant la base de données acoustique du WDP, et il peut identifier des modèles et des structures dans les vocalisations des dauphins, prédire même quel sera le prochain son — tout comme les suggestions de recherche de Google ou le texte prédictif lors de la rédaction d’e-mails.

DolphinGemma : Comment l’IA de Google aide à décoder la communication des dauphins

Aller encore plus loin : Tenter de communiquer avec les dauphins

Mais les chercheurs ne veulent pas seulement observer les dauphins se parler entre eux — ils cherchent à communiquer directement avec eux. Depuis les années 1990, l’équipe d’Herzing expérimente des moyens rudimentaires de “parler” aux dauphins. La première tentative impliquait un grand clavier de la taille d’un dauphin, fixé sur le côté d’un bateau, chaque touche correspondant à un sifflement artificiel associé à un jouet. L’idée était que les dauphins pointent les touches pour demander des jouets.

Pourrions-nous parler la langue des dauphins ? | Denise Herzing

Au fil du temps, cela a évolué vers un clavier portable sous-marin. Bien que cela n’ait pas conduit à de véritables conversations, cela a montré que les dauphins étaient attentifs et disposés à apprendre. En 2010, l’équipe a commencé à collaborer avec le Georgia Institute of Technology, où Starner est professeur, pour développer des technologies de communication plus sophistiquées.

Cela a conduit à la création du système CHAT (Cetacean Hearing and Telemetry) — un dispositif portable avec des hydrophones, des haut-parleurs et une interface pour les plongeurs. Il détectait des sifflements spécifiques des dauphins et les associait à des objets ou des concepts. Les chercheurs pouvaient alors déclencher des sifflements artificiels pour “parler” aux dauphins.

Intégration des smartphones pour une communication améliorée

Plus récemment, l’équipe a intégré des smartphones (Google Pixel) dans le système, le rendant plus petit, plus efficace et plus facile à utiliser. L’idée est de démontrer une action, comme remettre un jouet, et de jouer un son pour que le dauphin puisse l’associer à l’objet. Si le dauphin imite le son, le système informe le chercheur, qui répond ensuite en fournissant l’objet demandé, renforçant ainsi la connexion.

Avec l’IA qui prédit les réponses et identifie les motifs plus rapidement, les scientifiques peuvent interagir de manière plus naturelle avec les dauphins. La nouvelle version de CHAT consomme moins d’énergie et peut être entretenue plus facilement que son prédécesseur.

À gauche : Dr. Denise Herzing portant le « Chat Senior » en 2012 ; À droite : Charles Ramey, doctorant à Georgia Tech, portant le « Chat Junior » mis à jour en 2025.
Google

L’équipe WDP déploiera DolphinGemma lors de la prochaine saison sur le terrain. Google a déclaré qu’elle rendra le modèle disponible publiquement d’ici la mi-année, permettant aux chercheurs du monde entier de l’utiliser. L’espoir est qu’avec quelques ajustements, le modèle puisse également être adapté à d’autres espèces de cétacés, comme les dauphins à gros nez ou les dauphins tournants.

Si les dauphins ont une langue, ils ont probablement aussi une culture, a souligné Starner. Comprendre de quoi ils parlent, quelles sont leurs priorités et comment leurs sociétés fonctionnent pourrait nous offrir une toute nouvelle perspective sur la communication et l’intelligence dans le règne animal.


Lire l’article original sur :New Atlas

Lire la suite :  Dolphins in Gulf Found Contaminated with Fentanyl

Partager cette publication