Manus, pas le prochain DeepSeek chinois

By Ana Manuel Applications et Logiciels, Infor Et Électronique, Intelligence Artificielle, Technologie 0 Comments

Le responsable produit de Hugging Face a qualifié Manus de « l’outil d’IA le plus impressionnant que j’aie jamais essayé », tandis que le chercheur en politique de l’IA Dean Ball l’a décrit comme « l’ordinateur le plus sophistiqué utilisant l’IA ». Pendant ce temps, son serveur Discord officiel a rapidement dépassé les 138 000 membres, et des codes d’invitation se vendraient pour des milliers de dollars sur l’application chinoise de revente Xianyu.

Cependant, il reste incertain si cet engouement est justifié.

Manus n’a pas été entièrement conçu à partir de zéro. Des rapports sur les réseaux sociaux suggèrent que la plateforme repose sur un mélange de modèles d’IA existants et optimisés, notamment Claude d’Anthropic et Qwen d’Alibaba, pour accomplir des tâches comme la rédaction de rapports de recherche et l’analyse de documents financiers.

Malgré cela, The Butterfly Effect — l’entreprise chinoise derrière Manus — affirme sur son site web que la plateforme peut réaliser des exploits bien plus ambitieux, comme l’achat de biens immobiliers et le développement de jeux vidéo.

Manus présenté comme supérieur aux autres agents d’IA, mais ses performances aux benchmarks sont remises en question

Dans une vidéo largement partagée sur X, Yichao « Peak » Ji, responsable de la recherche pour Manus, a suggéré que la plateforme dépasse des outils agentiques comme Deep Research et Operator d’OpenAI. Ji a affirmé que Manus surpasse Deep Research sur GAIA, un benchmark évaluant la capacité d’une IA à naviguer sur le web, utiliser des logiciels et accomplir des tâches complexes.

« [Manus] n’est pas juste un autre chatbot ou un simple flux de travail », a déclaré Ji dans la vidéo. « C’est un agent entièrement autonome qui comble le fossé entre la conception et l’exécution […] Nous le voyons comme le prochain paradigme de la collaboration humain-machine. »

Cependant, les premiers utilisateurs rapportent que Manus présente des défauts.

Alexander Doria, cofondateur de la startup d’IA Pleias, a partagé sur X qu’il avait rencontré des messages d’erreur et des boucles infinies en testant la plateforme. D’autres utilisateurs ont noté que Manus peine avec l’exactitude des faits, cite rarement ses sources et omet parfois des informations facilement accessibles.

Mon expérience avec Manus a été loin d’être impressionnante.

Manus peine avec des tâches simples et échoue à passer une commande de repas

Je lui ai donné une tâche qui semblait simple : commander un sandwich au poulet frit dans un restaurant de fast-food bien noté et disponible dans ma zone de livraison. Après environ dix minutes, la plateforme a planté. Lors de ma deuxième tentative, Manus a réussi à identifier un article correspondant à ma demande, mais il n’a pas pu finaliser la commande—ni même générer un lien de paiement.

Tenter de commander des sandwiches au poulet frit avec Manus est une expérience frustrante.
Crédits d’image : Manus

Manus a également rencontré des difficultés lorsque je lui ai demandé de réserver un vol de New York vers le Japon. Malgré des instructions claires — comme privilégier le prix et des dates flexibles pour un billet en classe affaires — la plateforme s’est contentée de générer des liens vers divers sites de compagnies aériennes et moteurs de recherche de vols comme Kayak, dont certains étaient inaccessibles.

Manus ne peut pas encore réserver de vols pour Tokyo pour vous.
Crédits d’image : Manus

Espérant de meilleurs résultats, j’ai demandé à Manus de réserver une table pour une personne dans un restaurant à proximité. Après quelques minutes, il a échoué. J’ai ensuite tenté de lui faire créer un jeu de combat inspiré de Naruto, mais la plateforme a rencontré une erreur après une demi-heure—c’est à ce moment-là que j’ai décidé d’abandonner.

Un porte-parole de Manus a fourni la déclaration suivante à TechCrunch via message direct :

« En tant que petite équipe, notre priorité est d’améliorer continuellement Manus et de développer des agents d’IA qui aident réellement les utilisateurs à résoudre des problèmes […] L’objectif principal de la bêta fermée actuelle est de tester les différentes composantes du système et d’identifier les problèmes. Nous apprécions grandement les retours précieux de chacun. »

Alors, si Manus ne tient pas vraiment ses promesses techniques, pourquoi attire-t-il autant d’attention ? Plusieurs facteurs y contribuent, notamment l’exclusivité créée par la disponibilité limitée des invitations.

L’engouement dépasse la réalité alors que les médias chinois et les influenceurs de l’IA exagèrent les capacités de Manus

Les médias chinois ont rapidement qualifié Manus de percée majeure en intelligence artificielle, QQ News le décrivant comme « la fierté des produits nationaux ». Parallèlement, des influenceurs de l’IA sur les réseaux sociaux ont diffusé des affirmations exagérées sur ses capacités. Une vidéo largement partagée semblait montrer Manus en train d’utiliser plusieurs applications mobiles, mais Ji a ensuite confirmé qu’il ne s’agissait pas d’une véritable démonstration de la plateforme.

De plus, certains comptes influents sur X ont comparé Manus à DeepSeek, une entreprise chinoise d’IA, bien que cette comparaison ne soit pas tout à fait exacte. Contrairement à DeepSeek, The Butterfly Effect n’a développé aucun modèle d’IA propriétaire. DeepSeek a également rendu plusieurs de ses technologies publiques, alors que Manus ne l’a pas encore fait.

Pour être juste, Manus est encore en accès anticipé. L’entreprise affirme travailler à l’extension de sa capacité de calcul et à la résolution des problèmes signalés. Cependant, à ce stade, la plateforme semble illustrer un cas où l’engouement a dépassé les avancées technologiques réelles.

Mise à jour à 18 h 02 (Pacifique) : ajout d’une déclaration d’un porte-parole de Manus et correction d’une erreur d’identification de l’entreprise derrière Manus.

Lisez l’article original sur : TechCrunch

En savoir plus : Apple iPhone 16e Review: A18 Chip and Apple Intelligence for $599

Cookie	Durée	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Manus, pas le prochain DeepSeek chinois