Regroupement de couple : l’IA autonome approche

Image générée par DALL-E
Toutes les dix minutes environ, un nouvel article sur une percée « révolutionnaire » en IA apparaît sur mon écran. Une nouvelle méthode, une nouvelle capacité, des milliards investis ici, des agents IA là. Le cycle est implacable depuis un an, s’accélérant chaque jour. Aujourd’hui ne fait pas exception.
Lorsque je regarde la mer en face de chez moi, l’horizon semble être à environ six kilomètres—là où la courbure de la Terre commence à se faire sentir. Ce n’est pas une grande distance. L’IA « totalement » autonome est-elle vraiment si proche ?
J’en doute, mais la dernière avancée en IA de l’Université de Technologie de Sydney pourrait bien me faire changer d’avis.
L’Université de Technologie de Sydney dévoile Torque Clustering, une méthode d’entraînement de l’IA inspirée par la fusion des galaxies.
Des chercheurs de l’Université de Technologie de Sydney ont présenté une nouvelle méthode d’entraînement de l’IA appelée Torque Clustering. Inspirée par la dynamique gravitationnelle des galaxies en fusion, cette approche permet de traiter efficacement et de manière autonome d’immenses ensembles de données, sans intervention humaine ni paramètres prédéfinis—une rupture nette avec les techniques de regroupement traditionnelles en IA.
Selon le professeur Chin-Teng Lin, ce processus reflète l’apprentissage naturel, où « les animaux apprennent en observant, en explorant et en interagissant avec leur environnement, sans instructions explicites ».
Imaginez un regroupement comme une fête. Vous observez la salle et remarquez que les gens se rassemblent en fonction de leurs intérêts communs—sport, barbecue, jardinage—tandis qu’une personne reste seule dans un coin. C’est une manière simple de comprendre le fonctionnement du clustering.
Lorsqu’une IA analyse un ensemble de données, elle regroupe les éléments similaires en motifs pour un traitement plus efficace. Il existe plusieurs méthodes de regroupement, les plus courantes étant K-Means, DBSCAN et le clustering hiérarchique. Chacune présente des avantages et des limites selon la complexité des données et les coûts de traitement.
Cependant, toutes ces méthodes nécessitent une intervention humaine—qu’il s’agisse de définir le nombre de groupes, de fixer des distances epsilon, d’établir un minimum de points par cluster ou de configurer des métriques hiérarchiques. Si ces paramètres sont mal ajustés, les résultats de l’IA peuvent être fortement biaisés, voire totalement erronés.

Adobe Stock par alones
Les hallucinations de l’IA—lorsque les LLM génèrent des réponses fausses ou trompeuses—peuvent en partie découler d’erreurs de regroupement, comme l’association incorrecte de mots similaires. Imaginez quelqu’un rejoignant une discussion sur le sport après avoir entendu « shovel pass », alors qu’il connaît mieux les truelles que les touchdowns.
Torque Clustering supprime la supervision humaine, permettant à l’IA d’apprendre et de prédire des motifs de manière autonome.
L’apprentissage supervisé, qui repose sur des données étiquetées par des humains et des paramètres prédéfinis, est coûteux et inefficace pour les ensembles de données complexes. Torque Clustering élimine la supervision humaine, permettant à l’IA d’identifier des motifs et de faire des prédictions de manière plus efficace.
Les chercheurs ont testé l’algorithme Torque Clustering sur 1 000 ensembles de données variés, obtenant un score AMI (Adjusted Mutual Information) de 97,7 %. Cette métrique évalue la qualité des regroupements—associant par exemple le sport avec le sport et le jardinage avec le jardinage, même lorsque des mots comme « pelle », « gazon » ou « graine » sont communs aux deux domaines.
En comparaison, les méthodes de regroupement les plus avancées atteignent généralement des scores autour de 80 %.
« Ce qui rend Torque Clustering unique, c’est son ancrage dans le concept physique de couple, lui permettant d’identifier des groupes de manière autonome et de s’adapter à différents types de données aux formes, densités et niveaux de bruit variés », explique le Dr Jie Yang, premier auteur de l’étude. « Il s’inspire de l’équilibre du couple dans les fusions de galaxies et repose sur deux propriétés fondamentales de l’univers : la masse et la distance. »
Cette approche suggère des avancées vers l’intelligence artificielle générale (AGI), mais des questions subsistent. L’IA peut-elle vraiment apprendre sans paramètres, ou des heuristiques cachées guident-elles son fonctionnement ?
Le projet Torque Clustering—désormais sous les projecteurs—est open-source et disponible sur GitHub. Les réponses émergeront peut-être à mesure que les chercheurs l’exploreront. Toutefois, depuis sa sortie en mai 2024, il n’a pas encore été largement adopté pour l’entraînement de l’IA, ce qui pourrait déjà en dire long.
Lisez l’article original sur : New Atlas
À lire aussi : Images of Artificial Intelligence Tend to Exaggerate Stereotypes
Laisser un commentaire