L’IA décode la parole depuis le cerveau

L’IA décode la parole depuis le cerveau

Crédit : Pixabay

Une intelligence artificielle peut interpréter des mots et des phrases à partir de l’activité cérébrale avec une précision impressionnante, bien que limitée.

Basée sur de brèves enregistrements de l’activité cérébrale, l’IA peut prédire ce qu’une personne a entendu, en listant correctement la réponse parmi ses 10 premiers choix jusqu’à 73 % du temps, selon une étude préliminaire des chercheurs.

« La performance de l’IA a dépassé les attentes pour ce stade », a déclaré Giovanni Di Liberto, informaticien au Trinity College Dublin, qui n’a pas participé à l’étude.

Développée chez Meta, la société mère de Facebook, une IA avec des applications potentielles pour des milliers de personnes dans le monde entier qui ne peuvent pas communiquer par la parole, la frappe ou les gestes, a été rapportée le 25 août dans arXiv.org. Cela inclut les patients dans des états de conscience minimale, de syndrome d’enfermement ou de syndrome d’éveil non répondant.

Une nouvelle approche de l’IA pourrait offrir une alternative non invasive à la chirurgie cérébrale pour les déficits de communication.

Cependant, les technologies actuelles nécessitent souvent des procédures invasives comme la chirurgie cérébrale pour implanter des électrodes. Cette nouvelle approche, selon le neuroscientifique Jean-Rémi King, chercheur en IA chez Meta à l’École Normale Supérieure à Paris, pourrait offrir une alternative non invasive pour aider les patients ayant des déficits de communication.

King et son équipe ont entraîné un modèle linguistique sur 56 000 heures d’enregistrements de discours dans 53 langues. Ce modèle a appris à reconnaître des caractéristiques linguistiques à différents niveaux, des lettres et syllabes aux mots et phrases.

Ils ont ensuite appliqué une IA utilisant ce modèle aux données d’activité cérébrale de 169 volontaires qui écoutaient des histoires tout en subissant des scans par magnétoencéphalographie ou électroencéphalographie.

L’IA atteint jusqu’à 73 % de précision dans le décodage de la parole à partir de 3 secondes de données d’activité cérébrale utilisant la magnétoencéphalographie.

L’IA a décodé ce que les participants ont entendu en utilisant seulement trois secondes de données d’activité cérébrale, atteignant jusqu’à 73 % de précision pour prédire la bonne réponse parmi plus de 1 000 possibilités avec la magnétoencéphalographie.

Cependant, des défis persistent, comme la taille encombrante et le coût élevé des machines de magnétoencéphalographie, limitant l’application pratique dans les environnements cliniques.

De plus, l’étude actuelle s’est concentrée sur le décodage de la perception de la parole plutôt que sur sa production, soulignant la distance encore nécessaire pour développer des outils de communication significatifs pour les patients non verbaux.


Lisez l’article original sur :  Science News

Pour en savoir plus : How to Improve Focus and Attention: Insights from Neurobiology

Partager cette publication