L’intelligence artificielle (IA) est au cœur de la transformation numérique mondiale, et avec DeepSeek AI, la Chine vient de créer un séisme qui bouleverse le monde de l’IA à jamais, remettant gravement en cause le leadership américain dans ce domaine.
Cette prouesse chinoise est d’une envergure telle que le président américain Donald Trump a qualifié les avancées de la start-up chinoise d’IA, DeepSeek, de « signal d’alarme » pour la Silicon Valley et le secteur technologique américain.
On parle d’une révolution similaire à celle créée par l’avènement du PC dans l’Informatique ou bien, à la révolution menée par l’avènement du Cloud computing concernant les infrastructures informatiques.
Bien que jusqu’ici souvent déclassée par des entreprises américaines comme OpenAI, DeepSeek AI a explosé sur la scène internationale au début du mois de janvier 2025 avec ses modèles à grande échelle, abordables, rentables voire même gratuits.
Issue de la finance quantitative chinoise, DeepSeek AI se concentre sur l’efficacité et l’innovation en open source, attirant l’attention du monde entier.
Dans cet article, je te présente des statistiques et des faits clés sur l’ascension rapide et séismique de DeepSeek. J’examine aussi dans cet article, sa position par rapport aux géants américains de la Silicon Valley dans le domaine de l’IA.
Table des matières
Qu’est-ce que DeepSeek Ai ?
DeepSeek AI est un laboratoire de recherche indépendant sur l’intelligence artificielle qui opère sous l’égide de High-Flyer, un fonds spéculatif quantitatif chinois de premier plan.
📥 Utilise l'IA pour générer des ventes avec ce logiciel de cold outreach (outbound sales) >> Clique ici !
Fondée en 2023 par Liang Wenfeng, DeepSeek s’est concentrée sur la construction de grands modèles de langage (LLM) et d’outils de codage avancés, privilégiant la recherche pure, l’ouverture – open source – et l’efficacité algorithmique à la commercialisation immédiate.
DeepSeek est en fait le bras AI de High-Flyer dont Liang Wenfeng est le Co-fondateur.
Développe tes compétences et deviens un spécialiste AI/Cloud dès aujourd’hui ! ⬇️
DeepSeek AI : 27 statistiques clés
- Ancienneté : Cela fait à peine 20 mois que DeepSeek existe (fondée en mai 2023 en Chine).
- Principalement des jeunes diplômés : La plupart des chercheurs de DeepSeek ont terminé leurs études au cours des deux dernières années, ce qui favorise l’innovation rapide grâce à des perspectives nouvelles et à un minimum d’expérience en entreprise.
- Reconnaissance mondiale : Le lancement en janvier 2025 de DeepSeek Ai a attiré l’attention internationale (et a provoqué une baisse de 13 % du cours des actions de Nvidia avant l’ouverture du marché)
NVIDIA, qui a prospéré en vendant des GPU à forte marge essentiels au Machine Learning (l’apprentissage de l’IA), est désormais confrontée à une menace sérieuse.
Si le modèle à faible coût – quasiment gratuit – de DeepSeek est largement adopté, la demande de matériel haut de gamme pourrait diminuer, ce qui remettrait en cause la position dominante de NVIDIA sur le marché et pourrait avoir une incidence sur sa capitalisation boursière de 3 000 milliards de dollars.
Ce qui fait trembler et terrifie les investisseurs américains dans l’intelligence artificielle ainsi que tous les exécutifs évoluant dans la Silicon Valley aujourd’hui.
DeepSeek, l’IA chinoise, a marqué les esprits avec le lancement de son modèle R1, qui rivalise en précision et en performance avec les modèles américains tout en nécessitant moins de ressources et de puissance de calcul.
Ce succès remet en question la dépendance aux puces haut de gamme, notamment celles produites par NVIDIA.
À la suite de cette annonce, l’action de NVIDIA a chuté de 16,9 % en deux jours, entraînant une perte de près de 600 milliards de dollars de capitalisation boursière.
DeepSeek R1 démontre qu’il est possible de concevoir des modèles d’IA performants sans recourir aux puces les plus coûteuses, ce qui pourrait réduire la demande pour les produits de Nvidia comme je venais de le dire plus tôt.
Mais NVIDIA n’est pas la seule entreprise américaine à être impactée.
En effet, Larry Ellison, d’Oracle, a perdu 22,6 milliards de dollars, soit 12 % de sa valeur nette.
Michael Dell, de Dell, a quant à lui perdu 13 milliards de dollars, et Changpeng Zhao, de Binance, a enregistré une baisse de 12,1 milliards de dollars.
Les valeurs technologiques ont souffert : l’indice composite Nasdaq a perdu 3,1 % et l’indice S&P 500 1,5 %. Près de 85 % de l’érosion de la richesse provient du secteur technologique, ce qui révèle une réévaluation plus large des fortunes liées à Al.
L’autre fait incroyable est que la Chine réussit un tel exploit au moment où les USA ont essayé de tout mettre en oeuvre pour la bloquer dans l’accélération de ses développements dans l’intelligence artificielle puisque des restrictions sur l’exportation de puces avancées des États-Unis vers des pays comme la Chine, ont été initiées par un décret instauré par Joe Biden.
Cependant, Donald Trump a annulé cette mesure pour lancer le “Stargate Project“, un programme de 500 milliards de dollars destiné à investir dans les data centers d’IA aux États-Unis.
📥 Utilise l'IA pour générer des ventes avec ce logiciel de cold outreach (outbound sales) >> Clique ici !
- À l’heure où j’écris ce post, DeepSeek a supplanté OpenAI (ChatGPT) en devenant l’application numéro 1 la plus téléchargée de l’App Store aux USA. 2,6 millions de téléchargements (28 janvier 2025).
- Coûts d’entraînement de modèles : ~ 1/10 de ceux des modèles occidentaux similaires (Wired, janvier 2025)
- Prix : Le prix est 30 fois inférieur à celui des modèles similaires d’OpenAI, soit 2,19 $ par million de jetons de sortie contre 60,00 $ pour le modèle 01 d’OpenAI
- Taille de l’équipe : ~ 300 employés chez DeepSeek contre 3 500 chez OpenAI
- Échelle des modèles : Jusqu’à 671 milliards de paramètres (DeepSeek-V3) dont 37 milliards activés par défaut.
- Open Source : licence ouverte contrairement aux géants IA américains comme ChatGPT (OpenAI), Claude AI. En plus, jusqu’ici, DeepSeek AI est totalement gratuite contrairement à ses concurrents américains.
- Apprentissage par renforcement complet pour R1-Zero : DeepSeek s’appuie sur le RL plutôt que sur un ajustement fin (fine-tuning) supervisé important, ce qui produit des compétences de raisonnement avancées (en particulier en mathématiques et en codage informatique)
- Attention latente multi-tête (MLA) : Cela subdivise les mécanismes d’attention pour accélérer l’entraînement de modèles et améliorer la qualité des outputs, en compensant le manque de GPUs.
- 10 000 GPU Nvidia H100 contre 100 000 GPUs pour les concurrents américains : DeepSeek a rassemblé ces puces de manière préventive, puis s’est concentrée sur l’efficacité logicielle pour rivaliser avec les plus grands laboratoires occidentaux lorsque les sanctions sur les importations sont tombées.
- Mixture of Experts (MoE) : Seul un ensemble ciblé de paramètres est activé par tâche, ce qui réduit considérablement les coûts de calcul tout en maintenant des performances élevées.
- 671 milliards de paramètres dans DeepSeek-V3 : Rivalisant avec les LLM occidentaux de premier plan, il coûte toujours beaucoup moins cher à entraîner en raison des optimisations de ressources de DeepSeek.
- Coût d’entraînement estimé à 5,5 millions de dollars : Les dépenses de DeepSeek-V3 sont beaucoup plus faibles ridiculisant celles des modèles des grandes entreprises technologiques américaines comme OpenAI, ce qui souligne l’efficacité du RL et des choix architecturaux du laboratoire.
- Variantes de modèles distillés : « R1-Distill » compresse les grands modèles, ce qui rend l’intelligence artificielle avancée accessible à ceux qui disposent d’un matériel limité.
- Publications sous licence MIT // Open Source : DeepSeek accorde une totale liberté d’adaptation et de commercialisation, attirant des contributeurs mondiaux pour améliorer ses modèles.
- 0,55 $ par million de jetons d’entrée : L’API de DeepSeek-R1 réduit considérablement les coûts par rapport aux 15 $ ou plus de certains concurrents américains, ce qui alimente une guerre des prix plus large en Chine.
- Impact majeur sur le marché chinois de l’IA : La concurrence des prix de DeepSeek a forcé Alibaba, Baidu et Tencent à baisser leurs tarifs, ce qui a stimulé une adoption plus large de l’IA.
- Accent mis sur la recherche fondamentale : Rejetant un objectif purement applicatif, DeepSeek investit dans des stratégies « moonshot », qui rappellent les ambitions audacieuses des débuts d’OpenAI.
- Contrer les contrôles à l’exportation américains : Malgré les embargos sur les puces, DeepSeek innove avec des optimisations de communication GPU et de mémoire personnalisées, remettant en question l’efficacité de la politique américaine vis-à-vis de la Chine.
- Motivation patriotique : Les chercheurs considèrent souvent leur travail comme un moyen de renforcer la position de la Chine dans le domaine de l’IA au niveau mondial, en associant fierté nationale et rigueur scientifique.
- Couverture mondiale : Wired et Forbes ont mis en évidence les percées de DeepSeek, validant l’efficacité de son modèle et son approche open source.
- Énorme potentiel futur : La poursuite des efforts de DeepSeek dans le domaine du RL, de la mise à l’échelle et des architectures rentables pourrait remodeler le marché mondial des LLM si les gains actuels persistent.
- Utilisateurs : on estime de 5 à 6 millions d’utilisateurs déjà (analyse des utilisateurs de DeepSeek).
- Articles de recherche : 68 articles de recherche sur arXiv.
- Impact technologique : Le dernier modèle d’IA de DeepSeek a déclenché une vente massive d’actions technologiques à l’échelle mondiale, risquant une capitalisation boursière de 1 000 milliards de dollars (Bloomberg, janvier 2025)
- Abonnés X.com : 349 800 abonnés (27 janvier 2025)
Combien d’utilisateurs pour DeepSeek AI ?
Il est estimé que DeepSeek compte entre 5 et 6 millions d’utilisateurs dans le monde selon certaines sources sur Internet.
Cependant, au 28 janvier 2025, il n’existe pas de données publiques sur le nombre exact d’utilisateurs de DeepSeek AI.
Toutefois, d’après les chiffres de téléchargement disponibles sur Google Play Store et le classement de l’App Store d’Apple (numéro 1 dans de nombreux pays au 28 janvier 2025), on estime qu’elle a été téléchargée au moins 2,6 millions de fois, un chiffre qui augmente rapidement en raison de l’attention généralisée et virale dont jouit DeepSeek en ce moment.
DeepSeek AI a fait irruption sur la scène internationale en janvier 2025, voici un graphe Google Trends.
OpenAI contre DeepSeek AI : quelle est la différence ?
Bien que les deux entreprises développent des modèles de langage de grande taille, DeepSeek et OpenAI divergent en matière de financement, de structure des coûts et de philosophie de la recherche.
DeepSeek AI a une approche qui ridiculise littéralement celle d’OpenAi et d’autres de ses concurrents américains dans ce sens que DeepSeek arrive à produire une IA aussi puissante – voire même plus puissante – que ses concurrents en faisant usage de bien moins de ressources.
On parle de plusieurs centaines de milliards de dollars pour ChatGPT d’OpenAI contre à peine 5-6 millions de dollars pour DeepSeek AI.
Alors que l’API d’OpenAI pourrait coûter environ 15 $ par million de jetons / tokens en entrée et 60 $ par million de jetons / tokens en sortie, le coût comparable de DeepSeek-R1 est de 0,55 $ et 2,19 $, respectivement par million de jetons / tokens.
DeepSeek utilise également l’apprentissage par renforcement pur (RL) dans certains de ses modèles (comme R1-Zero), tandis qu’OpenAI s’appuie fortement sur du fine-tuning supervisé et basé sur les instructions.
Résultat : les modèles de DeepSeek sont plus efficaces en termes de ressources et en open source, offrant une voie alternative vers des capacités d’IA très avancées.
Timeline de DeepSeek AI
Mai 2023 : DeepSeek AI est fondée par Liang Wenfeng, suite à une transition de la branche de recherche Fire-Flyer AI de High-Flyer.
Novembre 2023 : Sortie de DeepSeek Coder, le premier modèle open source du laboratoire axé sur le code, la programmation informatique, le développement d’applications.
Début 2024 : Introduction de DeepSeek LLM (67 milliards de paramètres). DeepSeek LLM est un modèle linguistique avancé disponible en 7 milliards et 67 milliards de paramètres.
Mai 2024 : Lancement de DeepSeek-V2, salué pour ses performances et son faible coût d’entraînement.
Fin 2024 : DeepSeek-Coder-V2 (236 milliards de paramètres) apparaît, offrant une fenêtre de contexte élevée (128 000 jetons).
Début 2025 : Lancement de DeepSeek-V3 (671 milliards de paramètres) et de DeepSeek-R1, ce dernier étant axé sur les tâches de raisonnement avancées et défiant le modèle o1 d’OpenAI.
DeepSeek AI : Questions fréquemment posées
DeepSeek AI est-elle gratuite ?
Les modèles de base de DeepSeek sont open source sous licence MIT, ce qui signifie que les utilisateurs peuvent les télécharger et les modifier gratuitement.
Cependant, l’entreprise facture l’utilisation de son API, avec des tarifs à partir de 0,55 $ par million de jetons en entrée – largement moins cher que les concurrents américains.
DeepSeek est-elle une entreprise chinoise ?
Oui, elle a été fondée en mai 2023 en Chine, financée par le fonds spéculatif High-Flyer. DeepSeek maintient son siège dans le pays et emploie environ 200 membres du personnel.
DeepSeek AI est-elle performante ?
Le dernier modèle de DeepSeek, DeepSeek-R1, aurait dépassé ses principaux concurrents en matière de mathématiques et de raisonnement.
Avec jusqu’à 671 milliards de paramètres dans ses versions phares, il est à égalité (ou surpasse) avec certains des LLM les plus avancés au monde.
DeepSeek est-elle sûre ?
Entreprise chinoise ou pas, il n’existe pas de sécurité absolue en informatique. Toutefois, ce lundi 27 janvier 2025, il a été reporté que DeepSeek limitait les inscriptions à sa plateforme en réponses à de nombreuses attaques malicieuses sur ses services.
Les américains seraient-ils à l’œuvre pour essayer de se consoler de cette claque chinoise qu’ils ont reçue en pleine face ?
je n’en sais absolument rien mais cela ne m’étonnerait pas venant d’eux.
Comment DeepSeek a-t-elle atteint des performances d’IA compétitives avec moins de GPU ?
Ils ont adopté des innovations telles que l’attention latente multi-tête (MLA) et le Mixture of Experts (MoE), qui optimisent la façon dont les données sont traitées et limitent les paramètres utilisés par requête.
Par conséquent, DeepSeek tire davantage profit de ses quelque 10 000 GPUs H10010.
Qu’est-ce qui fait que les modèles de DeepSeek sont moins chers à entraîner et à utiliser que ceux de ses concurrents américains ?
DeepSeek tire parti de l’apprentissage par renforcement pour réduire la nécessité d’un fine-tuning supervisé constant.
Ils pratiquent également des prix inférieurs à ceux du marché, avec des API coûtant 0,55 $ par million de jetons en entrée, contre 15 $ ou plus pour d’autres fournisseurs américains en particulier.
Pourquoi DeepSeek se concentre-t-elle sur les publications open source malgré les pertes de profits potentielles ?
En proposant des modèles sous licence MIT, DeepSeek encourage les contributions de la communauté et accélère l’innovation.
Cette approche renforce la notoriété de la marque et une base d’utilisateurs mondiale, ce qui conduit souvent à des opportunités plus larges et plus lucratives à long terme.
Les méthodes d’efficacité de DeepSeek pourraient-elles remodeler les relations technologiques entre les États-Unis et la Chine ?
Oui, car les optimisations avancées de DeepSeek démontrent une certaine incompétence dans leur gestion de cette relation avec la Chine : sanctions, embargos et la Chine continue de leur priver de sommeil.
Développe tes compétences et deviens un spécialiste AI/Cloud dès aujourd’hui ! ⬇️
📥 Utilise l'IA pour générer des ventes avec ce logiciel de cold outreach (outbound sales) >> Clique ici !
Conclusion
Je suis sincèrement et personnellement impressionné par l’approche de DeepSeek. En tout cas, il est indéniable que DeepSeek AI est en train de révolutionner et de “disrupter” l’intelligence artificielle.
Traditionnellement, développer des modèles d’IA de pointe comme GPT-4 ou Llama coûtait une fortune, dépassant souvent les 100 millions de dollars et nécessitant des dizaines de milliers de GPU haut de gamme.
Ces coûts exorbitants créaient une barrière quasi infranchissable que DeepSeek venait de briser créant une panique générale dans la Silicon Valley et la tech américaine.
Ainsi, l’innovation en IA n’est plus réservée aux grandes entreprises grâce à DeepSeek qui a brisé ce paradigme grâce à une efficacité radicale qui change la donne.
Leur premier coup de génie ?
Réduire la précision numérique de 32 à 8 décimales, ce qui diminue l’utilisation de la mémoire de 75 % sans impacter significativement les performances.
Ensuite, leur capacité de lecture multi-tokens, qui traite le texte par blocs plutôt que mot par mot, double la vitesse de traitement avec une perte de précision minime. Mais ce qui est encore plus impressionnant, c’est leur système de Mixture of Experts (MoE) qui active intelligemment des modules spécialisés uniquement lorsque nécessaire.
Résultat : sur 671 milliards de paramètres totaux, seulement 37 milliards sont actifs par défaut.
Ces optimisations ingénieuses de DeepSeek ont réduit les coûts d’entraînement de modèles AI de plus de 100 millions de dollars à environ 5 millions de dollars divisant aussi, les besoins matériels de 100 000 GPU à seulement 2 000 ou 10 000.
C’est un peu comme si tu t’imaginais pouvoir entraîner un modèle d’IA avec des clusters de PS5 !
En plus de cela, DeepSeek adopte une approche open-source, rendant leur code et leurs méthodologies accessibles à tous.
Cette transparence abaisse les barrières à l’entrée, permettant aux petites entreprises et aux développeurs indépendants de rivaliser sans avoir besoin de budgets en milliards.
Cette philosophie favorise la collaboration et accélère l’innovation à travers l’industrie.
NVIDIA, qui a prospéré en vendant des GPU haut de gamme essentiels à l’entraînement de l’IA, pourrait bien voir son hégémonie menacée.
Si le modèle low-cost de DeepSeek est largement adopté, la demande pour du matériel ultra-performant pourrait diminuer, remettant en question la position dominante de NVIDIA et son impressionnante capitalisation boursière de 3 000 milliards de dollars qui est d’ores et déjà très négativement impactée.
En somme, les innovations de DeepSeek sont en passe de bouleverser l’industrie de l’IA, tout comme les ordinateurs personnels ont révolutionné l’informatique ou le cloud a transformé les infrastructures IT.
L’approche de DeepSeek rend l’IA plus abordable, plus accessible et ouvre la voie à une concurrence diversifiée, accélérant les avancées technologiques.
📥 Utilise l'IA pour générer des ventes avec ce logiciel de cold outreach (outbound sales) >> Clique ici !
Grâce à DeepSeek, nous assistons à l’émergence d’un écosystème IA plus dynamique et inclusif, où l’innovation n’est plus l’apanage des géants technologiques, mais une opportunité pour tous ceux qui osent explorer son potentiel.
Aucun Commentaire