DeepSeek : Guide de l’app AI

DeepSeek fait sensation. Cette semaine, le laboratoire chinois d’IA DeepSeek a attiré l’attention après que son application de chatbot a dominé les classements de l’Apple App Store et de Google Play. Entraînés avec des techniques de calcul efficaces, les modèles d’IA de DeepSeek ont suscité des discussions parmi les analystes de Wall Street et les experts technologiques sur la capacité des États-Unis à maintenir leur domination en IA et la demande à long terme de puces d’IA.
Mais comment DeepSeek a-t-il émergé et qu’est-ce qui a conduit à sa rapide ascension vers la reconnaissance mondiale ?
DeepSeek est soutenu par High-Flyer Capital Management, un fonds spéculatif quantitatif chinois qui utilise l’IA pour ses stratégies de trading.
L’enthousiaste de l’IA Liang Wenfeng a cofondé High-Flyer en 2015. Pendant ses études à l’Université de Zhejiang, il a commencé à explorer le trading, lançant finalement High-Flyer Capital Management en 2019 pour se concentrer sur les algorithmes financiers basés sur l’IA.
En 2023, High-Flyer a créé DeepSeek en tant que laboratoire de recherche en IA distinct de ses opérations financières. Soutenu par High-Flyer, DeepSeek est ensuite devenu une entreprise indépendante.
Surmonter les restrictions matérielles
Dès le départ, DeepSeek a construit ses propres clusters de centres de données pour l’entraînement des modèles d’IA. Cependant, comme d’autres entreprises chinoises d’IA, elle a rencontré des défis en raison des restrictions américaines sur le matériel avancé. Pour entraîner l’un de ses modèles récents, l’entreprise a dû se tourner vers les puces H800 de Nvidia, une alternative moins puissante aux H100, qui reste disponible pour les entreprises américaines.
L’équipe technique de DeepSeek est composée principalement de jeunes talents, l’entreprise recrutant activement des chercheurs en IA titulaires d’un doctorat dans des universités chinoises de premier plan. Selon le New York Times, DeepSeek intègre également des individus sans formation en informatique pour améliorer la compréhension de son IA dans divers domaines.
DeepSeek a lancé ses premiers modèles — DeepSeek Coder, DeepSeek LLM et DeepSeek Chat — en novembre 2023. Cependant, ce n’est qu’avec la sortie de ses modèles de nouvelle génération DeepSeek-V2 au printemps 2024 que l’industrie de l’IA a vraiment pris note.
Perturber le marché de l’IA
DeepSeek-V2, un modèle polyvalent capable d’analyser à la fois du texte et des images, a obtenu de bons résultats sur les benchmarks de l’IA tout en étant significativement plus rentable que les modèles concurrents à l’époque. Son arrivée a poussé des rivaux nationaux comme ByteDance et Alibaba à réduire les frais d’utilisation de certains de leurs modèles et même à en proposer gratuitement.
DeepSeek-V3, lancé en décembre 2024, a encore renforcé la réputation de l’entreprise.
Des tests internes de benchmark suggèrent que DeepSeek V3 surpasse à la fois des modèles open-source comme Llama de Meta et des modèles propriétaires accessibles uniquement via API, comme GPT-4o d’OpenAI.
Un autre modèle remarquable est le modèle de raisonnement R1 de DeepSeek, lancé en janvier 2025. Selon DeepSeek, le R1 rivalise avec le modèle o1 d’OpenAI dans les principaux tests de performance. Contrairement aux modèles d’IA standard, les modèles de raisonnement comme le R1 peuvent auto-vérifier leurs résultats, réduisant ainsi les erreurs courantes. Bien qu’ils prennent plus de temps—parfois quelques secondes ou minutes de plus—pour générer des réponses, ils tendent à être plus précis, notamment dans des domaines comme la physique, les sciences et les mathématiques.
Contraintes réglementaires sur DeepSeek
Cependant, les modèles de DeepSeek présentent certaines limitations. En tant qu’IA développée en Chine, ils doivent se conformer aux régulations de l’autorité de surveillance d’Internet chinoise, garantissant que leurs réponses soient alignées avec les « valeurs socialistes fondamentales ». Par exemple, dans l’application de chatbot de DeepSeek, le modèle R1 refuse de répondre à des questions sur des sujets tels que la place Tiananmen ou le statut politique de Taïwan.
Le modèle économique de DeepSeek reste flou, offrant des produits à des prix inférieurs aux tarifs du marché et évitant les investissements extérieurs malgré l’intérêt des fonds de capital-risque. L’entreprise affirme que ses percées en matière d’efficacité expliquent son avantage en termes de coûts, bien que certains experts ne soient pas d’accord.
Les développeurs ont largement adopté les modèles de DeepSeek sous des licences permissives, avec plus de 500 dérivés de R1 sur Hugging Face et 2,5 millions de téléchargements. Sa montée rapide a suscité à la fois des éloges et des scepticismes, contribuant à une chute de 18 % du stock de Nvidia et attirant les critiques d’OpenAI, qui l’a qualifiée de “subventionnée par l’État” et a appelé à une interdiction par les États-Unis.
Microsoft a ajouté DeepSeek à Azure AI Foundry, tandis que Meta a réaffirmé ses dépenses en infrastructure IA en réponse. Le PDG de Nvidia, Jensen Huang, a salué son innovation, notant que ses modèles de raisonnement nécessitent une puissance de calcul significative.
Malgré son succès, DeepSeek fait face à des restrictions croissantes, avec des interdictions en Corée du Sud, dans l’État de New York et une action potentielle du gouvernement américain concernant les préoccupations liées à l’IA étrangère.
Lire l’article original sur : TechCrunch
Lire la suite : Manus is Unlikely to Be China’s Next DeepSeek Moment
Laisser un commentaire