OpenAI lance des outils pour agents IA

OpenAI lance des outils pour agents IA

Crédit : Depositphotos

Mardi, OpenAI a dévoilé de nouveaux outils destinés aux développeurs et aux entreprises pour créer des agents IA, des systèmes automatisés capables d’exécuter des tâches de manière autonome en utilisant ses modèles et cadres d’IA.

Ces outils font partie de la nouvelle API Responses, qui permet aux entreprises de développer des agents IA personnalisés pouvant effectuer des recherches en ligne, analyser des fichiers internes et naviguer sur des sites Web, à l’image du produit Operator d’OpenAI. L’API Responses remplace l’API Assistants, qu’OpenAI prévoit de supprimer d’ici mi-2026.

Les défis de l’autonomie de l’IA

Malgré l’engouement croissant pour les agents IA, l’industrie peine à définir leur réelle utilité et à en démontrer la valeur pratique. Un exemple récent est Manus, la plateforme de la startup chinoise Butterfly Effect, qui a fait le buzz mais n’a pas répondu aux attentes des utilisateurs, soulignant les défis de l’autonomie réelle de l’IA.

OpenAI cherche à surmonter ces obstacles. « Il est assez facile de faire une démonstration de son agent », a déclaré Olivier Godemont, responsable produit API chez OpenAI, à TechCrunch. « Le faire évoluer est bien plus difficile, et amener les gens à l’utiliser régulièrement l’est encore plus. »

Plus tôt cette année, OpenAI a introduit deux agents IA dans ChatGPT : Operator, qui navigue sur les sites Web, et Deep Research, qui compile des rapports. Bien qu’ils aient démontré des capacités agentiques, ils ne possédaient pas une autonomie complète.

Avec l’API Responses, OpenAI met désormais à disposition des entreprises les composants essentiels de ses agents IA, leur permettant de développer leurs propres applications, potentiellement plus autonomes et performantes.

Grâce à cette API, les développeurs ont accès aux mêmes modèles d’IA qui alimentent l’outil ChatGPT Search d’OpenAI : GPT-4o search et GPT-4o mini search. Ces modèles peuvent parcourir le Web pour répondre aux questions tout en citant leurs sources.

OpenAI affirme que ces modèles sont très précis. Sur son benchmark SimpleQA, qui évalue la réponse aux questions factuelles, GPT-4o search obtient un score de 90 %, et GPT-4o mini search 88 %, surpassant le récent GPT-4.5, qui atteint seulement 63 %.

Limitations de la recherche par IA

Les outils de recherche alimentés par l’IA surpassent généralement les modèles d’IA traditionnels en précision, car ils peuvent rechercher directement des informations. Cependant, ils rencontrent encore certains défis, notamment des hallucinations et des difficultés avec des requêtes courtes et de navigation, comme « score des Lakers aujourd’hui ». Des rapports indiquent également que les citations de ChatGPT ne sont pas toujours fiables.

L’API Responses propose également un outil de recherche de fichiers permettant de récupérer rapidement des informations depuis les bases de données d’une entreprise. OpenAI assure que ces fichiers ne seront pas utilisés pour l’entraînement des modèles. De plus, les développeurs peuvent intégrer le modèle Computer-Using Agent (CUA) d’OpenAI, qui alimente l’outil Operator. Ce modèle génère des actions de souris et de clavier, permettant l’automatisation de tâches telles que la saisie de données et la gestion des flux de travail.

Les entreprises peuvent choisir d’exécuter le modèle CUA localement sur leurs systèmes, car il est lancé en avant-première pour la recherche. Cependant, la version grand public disponible via Operator est limitée aux actions basées sur le Web.

Malgré ces avancées, l’API Responses ne supprime pas tous les obstacles techniques liés aux agents d’IA. La recherche GPT-4o fournit encore des réponses incorrectes dans 10 % des cas, et OpenAI reconnaît que son modèle CUA n’est pas encore totalement fiable pour automatiser les tâches des systèmes d’exploitation, car il peut générer des erreurs involontaires.

Pour soutenir les développeurs, OpenAI lance également l’Agents SDK, un kit open-source facilitant l’intégration des modèles d’IA aux systèmes internes, la mise en place de garde-fous et la surveillance du comportement des agents pour le débogage et l’optimisation. Ce SDK s’appuie sur le cadre Swarm d’OpenAI, sorti l’an dernier pour l’orchestration multi-agents.

Olivier Godemont, responsable des produits API d’OpenAI, estime que cette année sera décisive pour faire passer les agents d’IA des démonstrations à des outils pratiques. Le PDG Sam Altman a également prédit que 2025 sera l’année où les agents d’IA intégreront le monde du travail. Reste à voir si cette vision se concrétisera, mais les dernières avancées d’OpenAI marquent un tournant vers des agents d’IA plus fonctionnels et impactants.


Lis l’article original sur :  TechCrunch

En savoir plus : iOS 18.4 will introduce Apple Intelligence-Powered Priority Notifications

Partager cette publication