DeepSeek propulse la Chine dans l'ère de l'IA à mille milliards

DeepSeek propulse la Chine dans l’ère de l’IA à mille milliards

By Jorge Paka Infor Et Électronique, Intelligence Artificielle, Technologie Commentaires fermés

Le modèle open-source de DeepSeek montre que la voie américaine n’est pas la seule en IA
Depositphotos

Cette semaine, les géants américains de l’IA ont reçu un signal d’alarme brutal lorsque la société chinoise émergente DeepSeek a effacé un trillion de dollars des évaluations des leaders de l’industrie comme Nvidia et OpenAI. Les acteurs technologiques établis sont secoués – et à juste titre – car le modèle R1 de DeepSeek prouve que la voie traditionnelle et coûteuse n’est plus la seule option pour progresser.

Ce moment révolutionnaire intervient après la sortie du dernier modèle IA de la société, DeepSeek-R1, désormais disponible sur smartphones dans le monde entier, après sa sortie sur ordinateur de bureau le 10 janvier.

DeepSeek est sur nos radars depuis quelques semaines, après la sortie de son chatbot V3 le 26 décembre, qui aurait performé au même niveau que les GPT américains leaders (transformateurs pré-entraînés génératifs). Étonnamment, cet exploit a reçu peu de couverture à l’époque – y compris de notre part. Alors que les pionniers américains de l’IA s’empressaient de sortir de nouvelles fonctionnalités, il semblait peu probable qu’un modèle de langage de grande taille (LLM), aussi prometteur ou fondamentalement différent qu’il apparaisse sur le papier, puisse perturber l’industrie.

L’ascension fulgurante de DeepSeek

Cette perception a radicalement changé du jour au lendemain, le 27 janvier 2025. Alors que la Chine se préparait pour la veille du Nouvel An lunaire, DeepSeek a explosé pour devenir l’application n°1 dans l’espace IA/GPT, provoquant un bouleversement majeur sur le marché. L’ascension de l’entreprise a secoué l’industrie, effaçant des milliards de dollars de valeur boursière des acteurs majeurs tels que Nvidia, OpenAI, Meta, Alphabet (la société mère de Google), Oracle, partenaire de Nvidia, et de nombreuses entreprises d’énergie et de centres de données. Elon Musk a échappé de peu aux conséquences, car X n’est plus coté en bourse.

Bien que la chute du marché soit probablement temporaire, DeepSeek a irrévocablement changé la trajectoire du développement de l’IA. Jusqu’à présent, les États-Unis dominaient tellement le domaine que la plupart s’attendaient à ce que d’autres pays produisent uniquement des imitations médiocres de leurs modèles dits « standards d’or ». L’approche de DeepSeek, cependant, a tracé une nouvelle voie, positionnant la Chine comme un concurrent redoutable dans ce que beaucoup appellent désormais une course aux armements numériques.

Le LLM de l’entreprise a été conçu en utilisant de vieux chips Nvidia pour une fraction du coût investi par des entreprises comme Anthropic et OpenAI dans leurs modèles respectifs.
Depositphotos

L’avantage économique et open-source de DeepSeek

DeepSeek se distingue en utilisant des puces plus anciennes et moins chères, tout en évitant des étapes coûteuses dans le développement de chatbots, réduisant ainsi son coût de formation à seulement 5,6 millions de dollars, bien loin des 60 millions de Llama 3.1 ou des plus de 100 millions de GPT-4. Contrairement aux modèles propriétaires, R1 est open-source, lui permettant de contourner les restrictions régionales et de démocratiser le développement de l’IA.

Cela a bouleversé l’industrie de l’IA dominée par les États-Unis, soulevant des questions sur la capacité des modèles efficaces et à faible coût à rivaliser avec les systèmes de pointe. Casey Newton a noté la taille massive de R1 — 680 milliards de paramètres — et son coût de formation révolutionnaire, le qualifiant de “game-changer”.

Les origines de DeepSeek ajoutent à son intrigue. Le fondateur Liang Wenfung, d’abord ignoré par ses pairs, a commencé à développer le modèle en 2021 en utilisant des puces Nvidia plus anciennes. En 2023, DeepSeek a été fondé, et le même matériel a contribué à la plus grande perte de valeur boursière de Nvidia. L’innovation de R1 réside dans sa formation, qui évite le réglage supervisé en faveur de l’apprentissage par renforcement, réduisant les coûts tout en améliorant les performances.

La sortie open-weight de R1 le distingue davantage, offrant aux chercheurs avec des ressources limitées un accès à l’IA de pointe. Des versions mini “distillées” rendent l’expérimentation encore plus accessible. Cependant, DeepSeek a rencontré des défis, notamment des cyberattaques, des critiques de censure et un accès restreint pour les utilisateurs hors de Chine.

Malgré ces problèmes, les experts considèrent DeepSeek comme un tournant. Le professeur Geoff Webb a souligné son potentiel à perturber la monopolisation de l’IA par les géants technologiques américains, favorisant la concurrence et réduisant les coûts. Il a également mis en avant l’opportunité d’une plus grande diversité et accessibilité mondiales dans les applications de l’IA.

En quelques semaines, DeepSeek a redéfini le développement de l’IA, prouvant que l’innovation ne nécessite pas de budgets énormes ni de technologies exclusives, ouvrant la voie à un avenir de l’IA plus inclusif.

Lire l’article original sur : New Atlas

Lire la suite : ZenRobotics 4.0 Enhances Intelligence in Waste Sorting Automation

Cookie	Durée	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

DeepSeek propulse la Chine dans l’ère de l’IA à mille milliards