xAI dévoile Grok 3

xAI dévoile Grok 3

Des membres de l’équipe xAI, dont Musk (à l’extrême droite), lors de la présentation en direct de Grok 3. Crédit image : xAI

La société d’IA d’Elon Musk, xAI, a dévoilé lundi soir son dernier modèle phare, Grok 3, ainsi que de nouvelles fonctionnalités pour les applications Grok sur iOS et le web.

Conçu pour rivaliser avec des modèles comme GPT-4o d’OpenAI et Gemini de Google, Grok peut analyser des images, répondre à des questions et alimenter diverses fonctionnalités sur X, le réseau social de Musk. Grok 3 était en développement depuis plusieurs mois et devait initialement être lancé en 2024, mais son déploiement a été retardé.

Ce lancement marque une étape ambitieuse pour xAI. L’entreprise a entraîné Grok 3 dans un immense centre de données à Memphis, équipé d’environ 200 000 GPU. Dans un post sur X, Musk a déclaré que Grok 3 avait été développé avec environ dix fois plus de puissance de calcul que son prédécesseur, Grok 2, et entraîné sur un ensemble de données élargi incluant des dossiers judiciaires.

« Grok 3 est nettement plus performant que Grok 2 », a affirmé Musk lors d’une présentation en direct lundi. Il l’a décrit comme une IA « recherchant la vérité de manière maximale », même si ses conclusions peuvent parfois aller à l’encontre du politiquement correct.

La famille de modèles Grok 3 comprend une version plus légère, Grok 3 Mini, qui offre des réponses plus rapides au détriment d’une certaine précision. Bien que toutes les fonctionnalités de Grok 3 ne soient pas encore disponibles—certaines restant en phase de test—le déploiement a commencé lundi.

Les performances de Grok 3 surpassent celles des concurrents sur des benchmarks clés

Selon xAI, Grok 3 surpasse GPT-4o sur des benchmarks comme AIME, qui évalue la résolution de problèmes mathématiques, et GPQA, qui teste des connaissances de niveau doctorat en physique, biologie et chimie. Une version préliminaire de Grok 3 s’est également distinguée dans Chatbot Arena, une compétition collaborative où les utilisateurs comparent des modèles d’IA et votent pour les meilleures réponses.

Crédit image : xAI

Les modèles de raisonnement de Grok 3 visent une précision accrue

Deux modèles de la famille Grok 3, Grok 3 Reasoning et Grok 3 Mini Reasoning, sont conçus pour traiter les problèmes de manière méthodique, à l’instar des modèles axés sur le raisonnement comme o3-mini d’OpenAI et R1 de DeepSeek. Ces modèles tentent de vérifier leurs propres réponses avant de les fournir, réduisant ainsi les erreurs fréquentes des systèmes d’IA.

Selon xAI, Grok 3 Reasoning surpasse la meilleure variante d’o3-mini d’OpenAI, o3-mini-high, sur plusieurs benchmarks industriels, notamment le test de mathématiques AIME 2025 récemment introduit.

Crédit image : xAI

Ces modèles de raisonnement sont accessibles via l’application Grok, où les utilisateurs peuvent demander à Grok 3 de « réfléchir » ou activer le mode « Big Brain » pour des requêtes complexes, exploitant ainsi une puissance de calcul accrue. xAI souligne leur efficacité particulière pour les tâches en mathématiques, sciences et programmation.

Musk a précisé que certains processus internes de ces modèles restent cachés dans l’application Grok afin d’empêcher la distillation, une technique permettant aux développeurs d’IA d’extraire des connaissances de modèles concurrents. Cette décision fait suite à des accusations récentes selon lesquelles DeepSeek aurait utilisé cette méthode pour reproduire les modèles d’OpenAI.

Les modèles de raisonnement de Grok prennent également en charge une nouvelle fonctionnalité appelée DeepSearch, la réponse de xAI aux outils de recherche assistée par IA comme Deep Research d’OpenAI. DeepSearch explore le web et X, résumant les informations en un abstract concis.

Accès à Grok 3 et détails de l’abonnement SuperGrok

L’accès à Grok 3 sera d’abord réservé aux abonnés Premium+ de X (50 $ par mois), tandis que des fonctionnalités supplémentaires seront incluses dans un nouveau plan nommé SuperGrok. Si les tarifs divulgués se confirment, SuperGrok coûtera 30 $ par mois ou 300 $ par an, offrant des capacités de raisonnement étendues, plus de requêtes DeepSearch et une génération d’images illimitée.

Crédit image : xAI

Musk a annoncé que Grok disposera bientôt d’un « mode vocal », prévu dès la semaine prochaine, tandis que les modèles Grok 3 et DeepSearch seront lancés via l’API entreprise de xAI peu après.

xAI prévoit également d’open-sourcer Grok 2 une fois que Grok 3 sera stable.

Initialement présenté comme une IA non filtrée et politiquement indépendante, les premiers modèles de Grok abordaient des sujets controversés mais restaient prudents sur les discussions politiques. Une étude a suggéré qu’ils penchaient à gauche sur des questions comme les droits des personnes transgenres et la diversité. Musk a attribué cela aux données d’entraînement et promis de rendre Grok plus neutre—reste à voir si xAI y est parvenu.


Lisez l’article original sur :  TechCrunch

En savoir plus : Why Did Technology Fail to Prevent the Fatal Air Collision Over Washington?

Share this post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *