Table of Contents
DeepSeek a récemment lancé son nouveau modèle de raisonnement en IA, R1, qui a provoqué une vente massive des actions de Nvidia et propulsé son application grand public en tête des classements des magasins d’applications.
Un modèle révolutionnaire à faible coût
Le mois dernier, DeepSeek a annoncé avoir formé son modèle en utilisant un centre de données composé d’environ 2 000 GPU H800 de Nvidia en seulement deux mois, pour un coût d’environ 5 millions d’euros. La semaine dernière, l’entreprise a publié un document montrant que les performances de son dernier modèle rivalisent avec les modèles de raisonnement les plus avancés au monde, qui sont généralement entraînés dans des centres de données investissant des milliards dans des puces IA coûteuses et rapides de Nvidia.
Réactions dans l’industrie technologique
La réaction à travers l’industrie technologique face à ce modèle à haute performance et à coût réduit de DeepSeek a été intense. Pat Gelsinger, l’ancien PDG d’Intel, a exprimé sa satisfaction sur X (anciennement Twitter) en écrivant : « Merci DeepSeek ».
Gelsinger, également président de sa startup Gloo, une plateforme de messagerie pour les églises, a quitté Intel après quatre ans, période durant laquelle il a tenté de rivaliser avec Nvidia en développant des GPU IA alternatifs, les Gaudi 3.
Les leçons du modèle R1
Dans son message, Gelsinger souligne que DeepSeek rappelle à l’industrie technologique trois leçons importantes : des coûts plus bas signifient une adoption plus large, l’ingéniosité prospère sous des contraintes, et « l’open gagne ». Selon lui, DeepSeek contribuera à réinitialiser le monde de plus en plus fermé du développement de modèles fondamentaux en IA, en opposition à des entreprises comme OpenAI et Anthropic, qui fonctionnent sous un modèle fermé.
Implications pour l’avenir de l’IA
Gelsinger a également déclaré que R1 est si impressionnant que Gloo a décidé de ne pas adopter OpenAI. L’entreprise développe un service IA appelé Kallm, qui proposera un chatbot et d’autres services. « Mes ingénieurs de Gloo utilisent R1 aujourd’hui », a-t-il expliqué, ajoutant que Kallm sera reconstruit à partir de zéro avec leur propre modèle fondamental entièrement open source.
Il estime que DeepSeek rendra l’IA si abordable qu’elle sera omniprésente, avec une qualité améliorée. « Je veux une meilleure IA dans ma bague Oura, dans mes appareils auditifs, dans mon téléphone et dans mes dispositifs intégrés, comme la reconnaissance vocale de ma voiture électrique », a-t-il ajouté.
Critiques et défis
Cependant, la réaction positive de Gelsinger contraste avec d’autres opinions moins enthousiastes. Plusieurs experts ont insinué que DeepSeek aurait manipulé ses chiffres, suggérant que l’entraînement aurait été plus coûteux que déclaré. Certains ont remis en question l’utilisation de puces haut de gamme en raison des restrictions d’exportation américaines sur les puces IA vers la Chine.
D’autres ont trouvé que certaines performances de modèles concurrents étaient supérieures, tandis que d’autres estiment qu’OpenAI, avec son prochain modèle o3, pourrait rapidement restaurer l’ordre établi face à R1. Gelsinger, quant à lui, ne se laisse pas abattre par ces critiques, affirmant que toutes les preuves montrent que DeepSeek est 10 à 50 fois moins cher en termes d’entraînement que les modèles concurrents.
Un appel à l’innovation ouverte
DeepSeek démontre que l’IA peut avancer grâce à la créativité technique, plutôt qu’en augmentant simplement la puissance matérielle. « C’est palpitant », conclut Gelsinger. Concernant le fait qu’un développeur chinois soit à l’origine de cette innovation, il considère que cela pourrait être embarrassant pour la communauté technologique occidentale, qui devrait se rappeler le pouvoir des écosystèmes ouverts.