DeepSeek : anatomie d’un tsunami
Panique à Wall Street, réactions politiques en chaîne et interrogations sur la souveraineté numérique... Retour sur une semaine folle qui a vu l'émergence de DeepSeek R1 - un modèle d'IA générative open source chinois capable de rivaliser à moindre coût avec les géants occidentaux comme ChatGPT - semer la panique dans la tech mondiale.
«
DeepSeek R1 est le moment Spoutnik de l'IA. » La formule, lâchée par Marc Andreessen
sur X, investisseur réputé de la Silicon Valley, fait référence au 4 octobre 1957, lorsque les Russes mirent en orbite Spoutnik, le premier satellite de l'histoire. Une véritable humiliation pour les États-Unis qui a marqué le début de la course à l'espace. Près de 70 ans plus tard, la compétition se déroule désormais sur le terrain de l'intelligence artificielle et la Chine a remplacé l'URSS. «
DeepSeek R1 est l'une des percées les plus incroyables que j'ai jamais vues – et en open source, c'est un cadeau majeur pour le monde », ajoute ce proche de Donald Trump,
toujours via son compte X. Le président américain qui, face aux remous générés par l'apparition de cette IA chinoise, s'est lui aussi senti obligé de réagir devant des élus du Parti républicain rassemblés en Floride : «
J'espère que le lancement de l'intelligence artificielle DeepSeek par une société chinoise sera un signal d'alarme pour nos industriels et leur rappellera qu'il faut rester très concentrés sur la concurrence pour gagner. » Mais qu'est-ce que DeepSeek au juste ? Et pourquoi un tel buzz planétaire ? Commençons par le commencement...
Lundi noir à Wall Street
Le 20 janvier dernier, soit 24 h avant
l'annonce du projet Stargate – un plan à 500 milliards de dollars pour bâtir les énomres centres de données de la future génération d'IA élaborée par les géants de la tech américaine – formulée par Trump en direct depuis la Maison Blanche, une petite start-up chinoise, créée en avril 2023 et jusqu'ici inconnue du grand public, lance son propre chatbot. Son nom : DeepSeek. Et R1, son grand modèle de langage (LLM) publié en open source, est capable de rivaliser en termes de performances avec les ChatGPT, Claude, Copilot et autres Gemini. Le tout avec un développement à bas coût (seulement 5,6 millions de dollars, revendique l'entreprise, un chiffre largement contesté par de nombreux experts du secteur) et en consommant nettement moins de puces informatiques que ses concurrents occidentaux. «
On a vu l'écart gigantesque entre le côté américain, avec des effets d'annonce et une surenchère de chiffres, et la modestie, voire le côté presque frugal des annonces de DeepSeek, dont le modèle rivalise pourtant avec ceux des géants américains, qui ont nécessité des milliards de dollars d'investissements », observe
Alexandre Baradez, analyste marchés au sein du courtier IG France,
dans les colonnes du Figaro. Résultat : sept jours plus tard, Wall Street plonge dans un lundi noir historique. 1000 milliards de dollars de capitalisation boursière effacés en quelques heures pour les valeurs technologiques américaines, dont 589 milliards rien que pour Nvidia, leader mondial sur le marché de ces fameuses « super puces ». Soit l'une des pires pertes de l'histoire, selon la presse américaine. «
L'entreprise avait déjà fait des communications en novembre et en décembre derniers. On savait déjà qu'elle développait un modèle d'IA générative. [...] Les marchés n'y ont pas accordé d'importance particulière, le catalyseur a été l'annonce la semaine dernière du plan "Stargate" de Donald Trump », situe Alexandre Baradez.
« Coup de canif dans le narratif de la Silicon Valley »
De Sam Altman, le patron d'OpenAI, qui juge «
impressionnant » son nouveau concurrent
sur X, «
surtout étant donné ce qu'ils sont capables de fournir pour le prix », à un
Elon Musk plus dubitatif et moqueur, en passant par Jack Clark, ancien d'OpenAI et d'Anthropic qui désigne les chercheurs de DeepSeek comme un groupe de «
sorciers mystérieux », les pontes de la tech mondiale se sont tous exprimés sur ce raz de marée. «
C'est un gros coup de canif dans le narratif de la Silicon Valley »,
estime pour le Figaro Jean-Baptiste Bouzige, cofondateur et directeur de la société française spécialisée dans l'IA Ekimetrics, avant de citer la phrase lancée par Alex Karp, cofondateur de Palantir, lors d'une conférence : «
La révolution de l'IA n'est pas mondiale, elle est américaine. »
«
DeepSeek confirme qu'il y a de la place pour d'autres modèles – car la taille ne fera pas tout – et d'autres approches », poursuit cet expert français de l'IA. «
DeepSeek-R1 bouscule l'ordre technologique mondial tout en soulevant des questions de souveraineté et d'éthique numérique, avance de son côté
Julie Martinez, juriste et directrice générale du think tank France Positive, dans une tribune
publiée sur le site du Monde. DeepSeek-R1 semble s'appuyer sur des infrastructures de cloud contrôlées par des entreprises chinoises, elles-mêmes soumises aux obligations de la loi locale sur la cybersécurité. Cela signifie que toutes les données collectées et générées par ces outils – qu'il s'agisse de communications, de transactions économiques ou d'informations gouvernementales – pourraient être partagées avec les autorités chinoises sous prétexte d'assurer la "sécurité nationale", au détriment de notre souveraineté. Deuxièmement, l'intégration de DeepSeek-R1 pourrait finir par créer une dépendance structurelle économique, les pays hôtes pouvant à terme devenir captifs de mises à jour, de standards techniques et d'infrastructures définis par la Chine. Ce type de dépendance technologique va bien au-delà des outils eux-mêmes : il implique une subordination progressive des systèmes nationaux à des plateformes étrangères, de pays autoritaires, laissant peu de marge de manœuvre aux entités pour se retirer ou diversifier leurs partenaires technologiques. Ces deux dynamiques – la captation des données et la dépendance structurelle – peuvent conférer à la Chine un levier d'influence sans précédent. »
Numéro un sur l'App Store !
Ce qui explique aussi pourquoi les autorités américaines n'ont pas tardé à remettre en cause les prouesses avancées par la start-up basée à Hangzhou. David Sacks, surnommé le «
tsar de l'IA » en charge de l'intelligence artificielle et des cryptomonnaies au sein de l'administration Trump, a par exemple qualifié DeepSeek de voleur sur Fox News : «
Il existe une technique d'IA appelée distillation, dont vous allez beaucoup entendre parler, qui consiste à apprendre d'un modèle à partir d'un autre modèle. Il y a des preuves tangibles du fait que DeepSeek a distillé la connaissance des modèles d'OpenAI. Et je ne pense pas qu'OpenAI en soit très satisfait... » Ce que tend à confirmer
Julien Floch, expert en IA générative chez Wavestone,
dans cet article des Echos : «
Plusieurs éléments penchent pour cette thèse. Quand on creuse le fonctionnement de R1, on constate qu'il n'a pas été entraîné uniquement sur le web chinois, très censuré. Il y a aussi des ressemblances troublantes avec le modèle o1 d'OpenAI, les formes de raisonnement sont similaires. » Toujours est-il que DeepSeek vient de dépasser ChatGPT en nombre de téléchargements et se classe désormais numéro un sur l'App Store. L'entreprise chinoise a également indiqué lundi 27 janvier qu'elle subissait une «
cyberattaque malveillante à grande échelle » qui lui imposait de limiter temporairement les inscriptions de nouveaux utilisateurs. La rançon du succès ? Pas si sûr, selon
Julien Launay, cofondateur d'Adaptive ML, start-up qui permet aux entreprises de tester, choisir et adapter leurs grands modèles de langage. «
Certains de nos clients veulent travailler avec DeepSeek et d'autres sont inquiets car ce sont des modèles chinois,
précise-t-il aux Echos. Après, est-ce que R1 est mieux que o1 ? Il est difficile d'évaluer un modèle de manière générale. Ce sont des modèles de bonne qualité, très prometteurs. » Mais avec des enjeux bien différents...
«
L'IA ouverte porte l'espoir d'une autre voie face à la domination du secteur par les géants du numérique américains comme OpenAI et son partenaire Microsoft ou Anthropic et ses partenaires Amazon ou Google. Souvent ouverts à leurs débuts, ceux-ci ont évolué, au nom de la rentabilisation de leurs investissements, vers des modèles fermés, dont les détails sont opaques, propriétaires (privés), et dont l'accès est exclusivement payant,
souligne le journaliste tech du Monde, Alexandre Piquard. L'IA ouverte permet aussi en théorie aux entreprises ou aux administrations de maîtriser leur technologie. En obtenant des performances similaires avec moins de calculs informatiques, donc d'énergie et de ressources, DeepSeek renforce en principe l'espoir d'une IA plus frugale. Derrière cette start-up et le prochain sommet de Paris se cache l'enjeu d'une IA plus ouverte et plus sobre. Mais elle n'est pas garantie. Le débat comporte des subtilités et des défis. »