Casque à Écoute Sélective : Entendez Clairement dans la Foule
Des chercheurs ont intégré l’IA à des casques standard pour isoler la voix d’un seul interlocuteur dans une foule bruyante simplement en le regardant. Le code de ce système avancé de réduction de bruit est librement accessible à quiconque souhaite construire sa propre version.
Entendre une personne dans un environnement bruyant et bondé où beaucoup de gens parlent peut être difficile, surtout pour ceux qui ont des problèmes d’audition. Bien que les appareils auditifs modernes utilisent la technologie de réduction de bruit, ils ne peuvent pas complètement éliminer le bruit de fond.
Améliorer l’Audition dans les Environnements Bruyants
Des chercheurs de l’Université de Washington (UW) ont créé une solution pour améliorer l’audition dans des environnements bruyants. En équipant des casques anti-bruit classiques d’une IA, ils ont développé un système capable de se concentrer sur la voix d’un interlocuteur lorsque le porteur le regarde.
« De nos jours, nous associons souvent l’IA aux chatbots en ligne qui répondent aux questions », a déclaré Shyam Gollakota, professeur à l’École d’informatique et d’ingénierie Paul G. Allen de l’UW et auteur principal de l’étude. « Cependant, dans ce projet, nous avons développé une IA pour améliorer la perception auditive de toute personne portant des casques selon ses préférences. Nos appareils vous permettent d’entendre clairement un seul interlocuteur même dans un environnement bruyant où de nombreuses personnes parlent. »
Le système “Target Speech Hearing” (THS) créé par les chercheurs est simple mais très efficace. Les écouteurs standard sont équipés de deux microphones, un sur chaque oreillette.
Lorsque le porteur regarde la personne qu’il veut entendre et appuie pendant trois à cinq secondes sur un bouton situé sur le côté du casque, les ondes sonores de la voix de cette personne atteignent les deux microphones simultanément (avec une marge d’erreur de 16 degrés).
Analyse du signal et isolation de la voix
Ces signaux sont envoyés à un ordinateur embarqué, où un logiciel d’apprentissage automatique analyse les modèles vocaux du locuteur. Le système isole ensuite la voix de l’orateur et la transmet au casque, même si celui-ci se déplace, tout en filtrant les bruits de fond.
La vidéo ci-dessous démontre l’efficacité des écouteurs, en mettant en évidence leur capacité à éliminer rapidement les bruits ambiants et à se concentrer sur l’orateur. Il élimine notamment le bruit d’une personne proche qui parle au téléphone à l’intérieur et le son d’une fontaine très bruyante à l’extérieur.
À quelle vitesse l’IA peut-elle traiter la voix du locuteur et éliminer les sons indésirables ? Lors de tests, les chercheurs ont découvert que leur système présentait une latence de bout en bout de 18,24 millisecondes. À titre de comparaison, un clignement d’œil dure généralement entre 300 et 400 millisecondes.
Cela signifie qu’il n’y a pratiquement aucun délai entre le moment où vous regardez une personne que vous voulez entendre et celui où vous n’entendez que sa voix dans vos écouteurs ; le processus se déroule en temps réel.
Évaluation par les participants
Les chercheurs ont fourni leur système THS à 21 participants, qui ont évalué les capacités de suppression du bruit des casques dans des environnements intérieurs et extérieurs réels.
En moyenne, les participants ont évalué la clarté de la voix de l’orateur près de deux fois plus élevée que lorsqu’elle n’était pas traitée.
Le système THS s’appuie sur la technologie de l'”audition sémantique” développée précédemment par les chercheurs de l’UW. Comme le THS, cette technologie utilise un algorithme d’intelligence artificielle fonctionnant sur un smartphone connecté sans fil à un casque anti-bruit. Le système d’audition sémantique pouvait identifier des bruits spécifiques tels que le chant des oiseaux, les sirènes et les alarmes.
Actuellement, le nouveau système ne peut filtrer qu’un seul locuteur cible à la fois et uniquement lorsqu’il n’y a pas d’autre voix forte émanant de la même direction que le locuteur. Toutefois, si l’utilisateur du casque n’est pas satisfait de la qualité du son, il a la possibilité de rééchantillonner la voix du locuteur pour en améliorer la clarté.
Les chercheurs travaillent activement à l’extension de leur système aux oreillettes et aux appareils auditifs. En outre, ils ont rendu leur code THS accessible au public sur GitHub afin d’encourager les développements ultérieurs. Il est important de noter que le système n’est pas encore disponible à la vente.
Les chercheurs ont présenté leurs résultats au début du mois lors de la conférence Computer-Human Interaction (CHI) de l’Association of Computing Machinery (ACM) sur les facteurs humains dans les systèmes informatiques à Honolulu (Hawaï), où ils ont reçu une mention honorable. Le document de recherche non publié peut être consulté ici.
Lire l’article original sur : Nouvel Atlas
Lire la suite : Le Jeu De Société Elden Ring Arrive Sur Kickstarter