DeepSeek propulse la Chine dans l’ère de l’IA à mille milliards

DeepSeek propulse la Chine dans l’ère de l’IA à mille milliards

Le modèle open-source de DeepSeek montre que la voie américaine n’est pas la seule en IA
Depositphotos

Cette semaine, les géants américains de l’IA ont reçu un signal d’alarme brutal lorsque la société chinoise émergente DeepSeek a effacé un trillion de dollars des évaluations des leaders de l’industrie comme Nvidia et OpenAI. Les acteurs technologiques établis sont secoués – et à juste titre – car le modèle R1 de DeepSeek prouve que la voie traditionnelle et coûteuse n’est plus la seule option pour progresser.

Ce moment révolutionnaire intervient après la sortie du dernier modèle IA de la société, DeepSeek-R1, désormais disponible sur smartphones dans le monde entier, après sa sortie sur ordinateur de bureau le 10 janvier.

DeepSeek est sur nos radars depuis quelques semaines, après la sortie de son chatbot V3 le 26 décembre, qui aurait performé au même niveau que les GPT américains leaders (transformateurs pré-entraînés génératifs). Étonnamment, cet exploit a reçu peu de couverture à l’époque – y compris de notre part. Alors que les pionniers américains de l’IA s’empressaient de sortir de nouvelles fonctionnalités, il semblait peu probable qu’un modèle de langage de grande taille (LLM), aussi prometteur ou fondamentalement différent qu’il apparaisse sur le papier, puisse perturber l’industrie.

L’ascension fulgurante de DeepSeek

Cette perception a radicalement changé du jour au lendemain, le 27 janvier 2025. Alors que la Chine se préparait pour la veille du Nouvel An lunaire, DeepSeek a explosé pour devenir l’application n°1 dans l’espace IA/GPT, provoquant un bouleversement majeur sur le marché. L’ascension de l’entreprise a secoué l’industrie, effaçant des milliards de dollars de valeur boursière des acteurs majeurs tels que Nvidia, OpenAI, Meta, Alphabet (la société mère de Google), Oracle, partenaire de Nvidia, et de nombreuses entreprises d’énergie et de centres de données. Elon Musk a échappé de peu aux conséquences, car X n’est plus coté en bourse.

Bien que la chute du marché soit probablement temporaire, DeepSeek a irrévocablement changé la trajectoire du développement de l’IA. Jusqu’à présent, les États-Unis dominaient tellement le domaine que la plupart s’attendaient à ce que d’autres pays produisent uniquement des imitations médiocres de leurs modèles dits « standards d’or ». L’approche de DeepSeek, cependant, a tracé une nouvelle voie, positionnant la Chine comme un concurrent redoutable dans ce que beaucoup appellent désormais une course aux armements numériques.

Le LLM de l’entreprise a été conçu en utilisant de vieux chips Nvidia pour une fraction du coût investi par des entreprises comme Anthropic et OpenAI dans leurs modèles respectifs.
Depositphotos

L’avantage économique et open-source de DeepSeek

DeepSeek se distingue en utilisant des puces plus anciennes et moins chères, tout en évitant des étapes coûteuses dans le développement de chatbots, réduisant ainsi son coût de formation à seulement 5,6 millions de dollars, bien loin des 60 millions de Llama 3.1 ou des plus de 100 millions de GPT-4. Contrairement aux modèles propriétaires, R1 est open-source, lui permettant de contourner les restrictions régionales et de démocratiser le développement de l’IA.

Cela a bouleversé l’industrie de l’IA dominée par les États-Unis, soulevant des questions sur la capacité des modèles efficaces et à faible coût à rivaliser avec les systèmes de pointe. Casey Newton a noté la taille massive de R1 — 680 milliards de paramètres — et son coût de formation révolutionnaire, le qualifiant de “game-changer”.

Les origines de DeepSeek ajoutent à son intrigue. Le fondateur Liang Wenfung, d’abord ignoré par ses pairs, a commencé à développer le modèle en 2021 en utilisant des puces Nvidia plus anciennes. En 2023, DeepSeek a été fondé, et le même matériel a contribué à la plus grande perte de valeur boursière de Nvidia. L’innovation de R1 réside dans sa formation, qui évite le réglage supervisé en faveur de l’apprentissage par renforcement, réduisant les coûts tout en améliorant les performances.

La sortie open-weight de R1 le distingue davantage, offrant aux chercheurs avec des ressources limitées un accès à l’IA de pointe. Des versions mini “distillées” rendent l’expérimentation encore plus accessible. Cependant, DeepSeek a rencontré des défis, notamment des cyberattaques, des critiques de censure et un accès restreint pour les utilisateurs hors de Chine.

Malgré ces problèmes, les experts considèrent DeepSeek comme un tournant. Le professeur Geoff Webb a souligné son potentiel à perturber la monopolisation de l’IA par les géants technologiques américains, favorisant la concurrence et réduisant les coûts. Il a également mis en avant l’opportunité d’une plus grande diversité et accessibilité mondiales dans les applications de l’IA.

En quelques semaines, DeepSeek a redéfini le développement de l’IA, prouvant que l’innovation ne nécessite pas de budgets énormes ni de technologies exclusives, ouvrant la voie à un avenir de l’IA plus inclusif.


Lire l’article original sur : New Atlas

Lire la suite : ZenRobotics 4.0 Enhances Intelligence in Waste Sorting Automation

Share this post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *