X

DEEPSEEK : RETOUR SUR SIX MOIS CONTROVERSES

Janvier 2025. Une date à retenir.

Le 27 janvier, précisément. Ce jour-là, près de 1 000 milliards de dollars s’évaporent de la bourse américaine. Le cours de Nvidia, symbole de l’IA de haute volée, plonge brutalement. Pourquoi ? À cause d’une startup chinoise encore méconnue du grand public : DeepSeek.

Une IA open source, ultra-puissante, annoncée comme dix fois moins coûteuse à entraîner que ses homologues occidentales. Le tout dans un modèle accessible à tous. Il n’en fallait pas plus pour déclencher la panique à Wall Street.

Mais six mois plus tard, où en est-on réellement ? DeepSeek est-elle à la hauteur de sa promesse révolutionnaire ? Ou bien était-ce une hype bien orchestrée, masquant des choix technologiques et politiques discutables ?

Spoiler : les deux affirmations sont vraies.

De l’ombre à la lumière : DeepSeek la montée éclair d’un outsider chinois

Jusqu’à début 2025, DeepSeek était totalement inconnue en dehors de la Chine. Et puis, du jour au lendemain, son modèle V3 devient le sujet de toutes les conversations sur X, Reddit et dans les forums d’IA. Les vidéos YouTube s’enchaînent, toutes avec le même refrain : “ChatGPT est mort, vive DeepSeek !”

Mais ce n’est pas qu’un buzz artificiel. Car derrière cette percée médiatique se cache une véritable avancée technologique.

DeepSeek a réussi là où beaucoup échouent encore : entraîner un modèle très performant à bas coût. L’astuce ? Une combinaison de trois éléments clés :

  • un pré-entraînement massivement optimisé,
  • un fine-tuning par raisonnement (inspiré des chaînes de pensée),
  • et surtout, une méthode d’apprentissage par renforcement inédite, baptisée GRPO.

Cette dernière technique leur permettrait de rivaliser avec OpenAI pour une fraction du coût énergétique et matériel.

Sur le papier : une révolution.

MoE, GRPO, RLVR : la techno qui fait peur à la Silicon Valley

Le modèle DeepSeek V3 repose sur une architecture Mixture of Experts (MoE). Un principe malin : le modèle n’active que certains « experts » selon la tâche, ce qui limite l’utilisation des ressources à 37 milliards de paramètres, malgré une taille théorique de 671 milliards.

Mais ce n’est pas tout. L’entraînement repose sur GRPO, une forme de RLHF qui évalue les réponses par rapport à une moyenne pondérée de groupe.

En résumé, une IA qui apprend en collaborant plutôt qu’en étant notée à la dure.

À cela s’ajoute une technique de raisonnement structuré, où l’IA apprend à se poser des questions, à vérifier ses propres réponses. Un peu comme un élève qui révise en s’auto-interrogeant.

Mais alors, pourquoi tant de doutes ?

Parce qu’à bien y regarder, tout n’est pas si net.

D’abord, les benchmarks sont flatteurs… mais biaisés. DeepSeek se compare à des versions anciennes de GPT-4o (mai 2023), en évitant soigneusement la confrontation avec les dernières itérations d’OpenAI ou d’Anthropic.

Ensuite, les hallucinations sont fréquentes. De simples requêtes météo peuvent générer des réponses erronées. Pire encore : sur des contenus scientifiques ou historiques sensibles, l’IA marche sur des œufs ou botte en touche.

Autre sujet sensible : les sujets géopolitiques. Tian’anmen, Hong Kong, politique intérieure… autant de zones grises où DeepSeek affiche un silence gênant.

En clair : la transparence est encore à prouver.

DeepSeek, Open Source… mais pas trop

Oui, DeepSeek est open source. Enfin… en apparence.

Le code est là, sur GitHub. Mais aucune information n’est fournie sur les données d’entraînement. C’est un peu comme si un chef vous donnait la recette sans vous dire ce qu’il a mis dans la sauce.

Impossible donc de vérifier les biais éventuels, ni de comprendre la diversité (ou l’absence) des corpus utilisés. Ce manque de transparence alimente les soupçons… et les accusations.

Sécurité des données : le vrai point noir

C’est ici que les critiques deviennent frontales.

DeepSeek V3 est régie par le droit chinois. Sa politique de confidentialité est vague, aucun DPO n’est identifié pour l’Europe, et le modèle ne respecte que partiellement le RGPD.

Et les inquiétudes ne s’arrêtent pas là.

Selon une enquête publiée par La Tribune, plusieurs analystes en cybersécurité affirment que DeepSeek aurait des liens directs avec les agences militaires et de renseignement chinoises.

Pire : des chercheurs affirment que certains modules du modèle sont capables de traduire, résumer et restructurer des contenus à des fins de désinformation ou de surveillance automatisée.

Autrement dit : si vous êtes une entreprise européenne, utiliser DeepSeek met potentiellement vos données en danger.

Et ce n’est pas de la paranoïa : début juillet 2025, la République tchèque interdit officiellement l’usage de DeepSeek dans les administrations, évoquant un risque « critique » pour la sécurité nationale. La startup est désormais dans le collimateur de plusieurs États européens.

La tarification de DeepSeek : un coût imbattable… mais à quel prix ?

Là où DeepSeek frappe fort, c’est sur le prix :

  • 0,14 € pour 1 million de tokens en entrée
  • 0,28 € pour 1 million de tokens en sortie

En comparaison, GPT-4o tourne autour de 3 $ les 1M tokens, Claude 3 Opus dépasse souvent 10 $. Résultat : pour un développeur ou une PME, le choix est vite fait.

Mais cette accessibilité pose aussi question : est-ce que cette IA est délibérément bradée pour s’imposer massivement ? Un peu comme Huawei à ses débuts, avant de devenir indésirable pour de nombreux pays.

Une IA puissante, mais incomplète

Sur le terrain, DeepSeek tient la route : très bon en rédaction, résumé, structuration. En revanche, il reste en retrait sur :

  • la personnalisation du ton,
  • la mémoire longue,
  • la génération d’images native,
  • les fonctions multimodales (vision, code, etc.).

Bref, un excellent copilote pour vos projets IA… mais pas encore un remplaçant crédible des géants américains. Surtout en entreprise.

De la techno au champ de bataille : une arme d’influence made in China ?

Et si l’enjeu réel n’était pas technique, mais géopolitique ?

Car DeepSeek n’est plus seulement un outil. C’est un levier d’influence, une vitrine technologique, et potentiellement, une arme d’ingérence.

Des soupçons de double usage (civil/militaire) se précisent. Des sources diplomatiques citées par Les News parlent même d’un “réservoir d’analyses stratégiques” conçu pour servir le ministère chinois de la Sécurité d’État.

Les États-Unis ont répliqué en annonçant le plan Stargate, un programme de souveraineté IA à 12 milliards de dollars. L’Europe, elle, est encore hésitante, mais plusieurs institutions recommandent déjà la suspension préventive des outils dérivés de DeepSeek dans les secteurs sensibles.

DeepSeek : catalyseur de fracture numérique ?

Six mois après le tremblement de terre, le paysage s’est transformé.

DeepSeek a bousculé l’ordre établi. En prouvant qu’il est possible de concevoir un modèle à haute performance pour un coût 10x inférieur, la startup a forcé l’industrie à se réinventer.

Mais ce qui inquiète, c’est le flou autour de ses intentions réelles. Est-ce une initiative technologique brillante ? Ou un cheval de Troie numérique dans la guerre froide version 2025 ?

DeepSeek : fascination, défiance, et un parfum de guerre d’influence

DeepSeek, c’est à la fois :

  • une prouesse technologique bluffante,
  • un signal d’alarme pour les États,
  • et un objet de controverse grandissante.

En open source, mais opaque. Performant, mais potentiellement dangereux. Moins cher, mais peut-être trop pour être honnête.

Le débat ne fait que commencer.

Articles similaires