La Chine dépasse-t-elle les États-Unis dans la course à l’IA ?

La Chine dépasse-t-elle les États-Unis dans la course à l’IA ?

Alors que Deep Seek lance discrètement un nouveau modèle d’IA, une question s’impose de plus en plus dans le paysage technologique mondial : la Chine est-elle en train de surpasser les États-Unis en matière d’intelligence artificielle ?

La montée en puissance de l’IA chinoise en 2025

L’un des grands thèmes qui domine la conversation autour de l’IA en 2025 concerne la compétition entre la Chine et les États-Unis. Avec un nouveau modèle de Deep Seek, des puces haute performance innovantes et le retour de scientifiques de premier plan en Chine, de nombreux experts se demandent sérieusement si la Chine n’est pas en train de prendre l’avantage dans la course à l’IA.

Jusqu’à présent, la nouvelle administration Trump n’a proposé que très peu de politiques concrètes en matière d’IA, hormis celle de « ne pas faire obstacle » aux entreprises d’IA américaines. Dans la mesure où il existe un objectif politique clair, c’est que la Chine ne doit pas gagner cette course technologique.

Le moment « Spoutnik de l’IA »

La sortie du modèle Deep Seek R1 a provoqué une véritable prise de conscience à Washington, forçant les décideurs politiques et le grand public à faire face à l’idée que la Chine était en train de rattraper son retard. Cet événement a été suffisamment marquant pour que Mark Andre le qualifie de « moment Spoutnik de l’IA ».

Quelques mois plus tard seulement, il semble que la Chine, si elle n’a pas pris la tête, avance à un rythme beaucoup plus rapide que ses concurrents américains. Si Deep Seek a été un signal d’alarme en Occident, il est devenu un véritable phénomène en Chine. Les mois qui ont suivi ont été remplis d’histoires d’adoption et ce qui semble être une initiative nationale visant à intégrer Deep Seek dans absolument tout.

Les dernières avancées qui alimentent ce débat

Le nouveau modèle Deep Seek V3

Le premier élément marquant est l’arrivée d’un nouveau modèle Deep Seek, leur modèle de fondation V3 MOD. Ce modèle open source a été lancé sans cérémonie sur Hugging Face hier, sans aucune forme d’annonce. La publication est même arrivée avec un fichier README complètement vide, uniquement des poids de modèle et une licence d’utilisation commerciale.

Les benchmarks montrent des capacités améliorées en raisonnement et en codage. Zapon a écrit : « J’ai testé le nouveau Deep Seek V3 sur mon benchmark interne et il présente un énorme bond dans toutes les métriques sur tous les tests. C’est maintenant le meilleur modèle non-raisonnement, détrônant Sonet 3.5. »

C’est un point important à noter alors que certains deviennent un peu hystériques : il ne s’agit pas du prochain modèle de raisonnement de Deep Seek, qui sera probablement appelé R2 et que les gens attendent avec impatience.

Efficacité et vitesse impressionnantes

Ce qui fait vraiment les gros titres, c’est l’importante amélioration de l’efficacité et de la vitesse. Le chercheur en apprentissage automatique d’Apple, Ani Hannan, a testé le modèle sur son studio M3 Ultra avec 512 Go de RAM et l’a fait fonctionner à 20 tokens par seconde. Certes, c’est seulement en mode 4 bits, et l’ordinateur Apple à 9 500 $ n’est pas tout à fait un matériel grand public, mais il s’agit tout de même d’un modèle de pointe de 685 milliards de paramètres fonctionnant sur un matériel qui coûte moins qu’une voiture d’occasion bon marché.

VentureBeat écrit : « Cela représente un changement potentiellement significatif dans le déploiement de l’IA. Alors que l’infrastructure d’IA traditionnelle s’appuie généralement sur plusieurs GPU Nvidia consommant plusieurs kilowatts d’énergie, le Mac Studio consomme moins de 200 watts pendant l’inférence. Ce fossé d’efficacité suggère que l’industrie de l’IA devra peut-être repenser ses hypothèses concernant les exigences d’infrastructure pour les performances des modèles haut de gamme. »

Différences stratégiques entre l’Est et l’Ouest

Le reportage de VentureBeat s’est également concentré sur la différence de stratégie en matière d’IA entre l’Est et l’Ouest. Ils ont noté que les leaders américains comme OpenAI et Anthropic ont gardé leurs modèles derrière des paywalls, tandis que l’approche chinoise a été d’open-sourcer autant que possible.

« Cette approche transforme rapidement l’écosystème de l’IA en Chine. La disponibilité ouverte de modèles de pointe crée un effet multiplicateur permettant aux startups, chercheurs et développeurs de s’appuyer sur une technologie d’IA sophistiquée sans dépenses en capital massives. Cela a accéléré les capacités d’IA de la Chine à un rythme qui a choqué les observateurs occidentaux. »

Ils ont ajouté : « Cette philosophie réduit rapidement l’écart perçu en matière d’IA entre la Chine et les États-Unis. Il y a quelques mois à peine, la plupart des analystes estimaient que la Chine avait un retard d’un à deux ans sur les capacités d’IA américaines. Aujourd’hui, cet écart s’est considérablement réduit, peut-être à 3 à 6 mois, certains domaines approchant la parité ou même le leadership chinois. »

En effet, si Deep Seek suit son schéma de publication précédent, nous pourrions voir une nouvelle version de leur modèle de raisonnement dans les prochaines semaines. Le moulin à rumeurs tourne déjà à plein régime, avec Smoke Away répandant la rumeur que Deep Seek R2 aurait obtenu un score de 90 % sur le benchmark RCGI, ce qui battrait le score de 87 % d’OpenAI O3.

Chubby écrit : « Ce serait absolument fou et propulserait la Chine. Si c’est vrai, je ne vois pas comment le modèle fermé va gagner la course à l’IA maintenant. »

Beaucoup ont souligné cependant que c’est une rumeur sans aucune source et qu’elle est très peu susceptible d’être vraie. Mais en même temps, la résonance de cette rumeur est peut-être l’histoire en termes de rapidité avec laquelle les attitudes changent concernant la position de la Chine dans la course à l’IA.

La Chine rattrape son retard sur les puces

Sur le front des puces, la Chine semble également rattraper son retard. Bloomberg rapporte que la société mère d’Alibaba, Ant Group, a développé une technique pour réduire les coûts de formation de 20 % en utilisant les puces d’IA de Huawei.

L’entreprise a adopté une architecture de mélange d’experts, qui est la même architecture utilisée par Deep Seek. Cependant, la grande nouvelle est qu’Ant Group a obtenu ces résultats sur des séries d’entraînement utilisant les puces H800 de Nvidia, qui sont les puces déclassées conçues pour se conformer aux contrôles à l’exportation. Cela suggère que les puces de Huawei peuvent se substituer aux GPU américains si nécessaire et que les contrôles à l’exportation ne constituent pas un obstacle majeur à la formation de modèles avancés.

Ant Group a exposé son processus dans un article de recherche plus tôt ce mois-ci, qui soulignait leur objectif de mettre à l’échelle un LLM de frontière sans utiliser de GPU premium. Ils ont déclaré qu’il coûtait environ 880 000 dollars pour entraîner un modèle d’un billion de tokens sur du matériel haute performance. Ils s’attendaient à réduire ce coût à 700 000 dollars sur du matériel moins performant en utilisant leur méthode.

Robert Lee, analyste principal de Bloomberg, a déclaré : « L’article d’Ant Group met en évidence l’innovation croissante et l’accélération du progrès technologique dans le secteur de l’IA en Chine. Les affirmations des entreprises soulignent que la Chine est en bonne voie de devenir autonome en matière d’IA, alors que le pays se tourne vers des modèles moins coûteux et efficaces sur le plan informatique pour contourner les contrôles à l’exportation sur les puces Nvidia. »

L’ancien investisseur quantitatif Jeffrey Emanuel a commenté : « Eh bien, cela n’a pas pris trop de temps. Ces puces d’entraînement d’IA de Huawei sont à peine sur le radar des entreprises américaines et des investisseurs en bourse, mais elles devraient vraiment l’être si bien plus de 40 % des véritables ventes de Nvidia proviennent de Chine, y compris Singapour et le Vietnam, en raison de la contrebande. »

Huawei est cependant sur le radar du PDG de Nvidia, Jensen Huang. Dans des remarques la semaine dernière, il a déclaré : « Huawei est l’entreprise technologique la plus redoutable de Chine. Ils ont conquis chaque marché dans lequel ils se sont engagés. Je pense que leur présence dans l’IA croît chaque année. Nous ne pouvons pas supposer qu’ils ne seront pas un facteur. »

La lutte pour retenir les talents

L’autre dimension de la compétition Chine-États-Unis qui prend un tournant troublant est la lutte pour retenir les talents. Plus tôt ce mois-ci, le projet de loi républicain visant à interdire les étudiants chinois a fait des vagues, beaucoup croyant qu’une telle mesure étoufferait le pipeline de talents.

Mais un problème peut-être encore plus pressant est que certains des principaux scientifiques chinois en IA commencent à s’auto-déporter. Guan Chi, 43 ans, ancien chercheur de Microsoft, a rejoint l’Université de Westlake à Hangzhou après une carrière de dix ans aux États-Unis. Pendant cette période, il a été scientifique en chef de l’IA chez Huawei Research USA et a également remporté plusieurs prix prestigieux, notamment la bourse Microsoft, la bourse IBM et le prix du meilleur article à la Conférence internationale de l’Association for Computing Machinery sur le multimédia.

Chi a déclaré : « J’ai été attiré par l’atmosphère libre de l’Université de Westlake et je voulais revenir poursuivre quelque chose que je voulais vraiment faire. »

Un chercheur britannique en IA médicale basé en Chine, se présentant sous le nom de Luke, a commenté : « Grandes nouvelles en IA en Chine. Le Dr Chi est une légende absolue de l’IA qui a travaillé aux États-Unis pendant 10 ans et a décidé de revenir en Chine. Pour lui, quitter les États-Unis et se diriger vers la Chine doit être un énorme signal d’alarme pour les amis de la recherche en IA. »

Dai WW, s’identifiant uniquement comme un ressortissant chinois intéressé par la géopolitique, a posté : « L’industrie américaine de l’IA est maintenant confrontée à un dilemme. Si elle n’utilise pas d’ingénieurs chinois, son IA sera à la traîne de celle de la Chine. Si elle utilise des ingénieurs chinois, ils retourneront en Chine. »

Même si l’on pourrait supposer qu’il s’agissait d’un geste politique pour rappeler un chercheur de premier plan en IA et générer du matériel de propagande, la compétition pour les talents reste réelle. En 2022, la Chine a formé 47 % des meilleurs étudiants en IA du monde (quintile supérieur), tandis que les États-Unis en ont diplômé environ 18 %.

Le commentateur libéral Matt Yglesias a écrit : « Personne ne veut l’entendre, mais il est difficile pour l’Amérique d’avoir plus de personnes que la Chine travaillant sur l’IA, les batteries, les drones ou tout autre domaine clé tant qu’il y a quatre fois plus de Chinois que d’Américains. Vous avez besoin d’une abondance de personnes. »

Un changement de dynamique dans la compétition

En fin de compte, la question de savoir si la Chine est en tête ou rattrape simplement son retard est secondaire par rapport au fait que toute la teneur de la compétition a changé en quelques mois seulement. De nombreux reportages suggèrent que l’open source et le déploiement à grande échelle de l’IA sont désormais une politique gouvernementale officielle, et bien que nous n’en soyons pas encore au stade où les modèles chinois sont poussés à l’étranger dans une initiative de « ceinture et route numérique », beaucoup à Washington croient que cela pourrait être la prochaine étape.

L’investisseur B. Shavasan a écrit un long fil sur ce qu’il voit se produire. Il l’a appelé « surproduction d’IA » et a écrit : « La Chine cherche à banaliser ses compléments. Au cours des prochains mois, je m’attends à un blitz complet de modèles d’IA open source chinois pour tout, de la vision par ordinateur à la robotique en passant par la génération d’images. »

« Pourquoi ? Je ne fais qu’inférer cela à partir de déclarations publiques, mais leur objectif apparent est de supprimer les profits des logiciels d’IA puisqu’ils gagnent de l’argent sur le matériel compatible avec l’IA. Fondamentalement, ils veulent faire à la technologie américaine, le dernier bastion, ce qu’ils ont déjà fait à la fabrication américaine, à savoir la copier, l’optimiser, la mettre à l’échelle, puis ruiner l’original occidental avec des prix bas. »

« La Chine pense qu’elle a l’opportunité de frapper les entreprises technologiques américaines, d’augmenter son influence, d’aider son économie interne et de supprimer les marges des logiciels d’IA à l’échelle mondiale, du moins au niveau des modèles. Je ne sais pas s’ils réussiront au niveau des applications, mais il pourrait être difficile pour les développeurs de modèles d’IA à code fermé de récupérer les coûts fixes élevés associés à la formation de modèles de pointe lorsque d’excellents modèles open source sont disponibles. »

« Je suis d’accord que c’est surprenant que le pays du Grand Pare-feu soit soudainement le pays de l’IA open source, mais c’est cohérent d’une autre manière, à savoir que la Chine se concentre simplement sur faire tout ce qu’il faut pour gagner, même jusqu’au point de copier des valeurs occidentales partiellement abandonnées comme l’open source, qui semblent être la chose la plus difficile à adopter. »

Et quand il s’agit de cette idée que la Chine fait tout pour gagner, c’est fondamentalement le point que les analystes de Morgan Stanley font également. Ils écrivent : « L’émergence de Deep Seek est plus qu’une simple étape importante de l’IA, c’est un symbole opportun de l’ambition de la Chine de revendiquer un rôle de leadership dans la révolution technologique. Au-delà des marchés financiers, l’émergence de Deep Seek intervient à un moment de fierté nationale. Le triomphe au box-office de ‘Ninja 2’ et du jeu vidéo ‘Black Myth: Wukong’ a donné naissance à une confiance populaire plutôt qu’à une directive descendante de Pékin, renforçant une nouvelle croyance en l’identité nationale et la tradition. »

Kai-Fu Lee, le fondateur de la startup chinoise 01.AI, est prêt à revendiquer l’avance, déclarant : « Je pense qu’il y avait un écart de 6 à 9 mois et un retard dans tout, et maintenant je pense que c’est probablement 3 mois de retard dans certaines des technologies de base, mais en fait en avance dans certains domaines spécifiques. »

Il a soutenu que les contrôles à l’exportation américains avaient été une arme à double tranchant, forçant l’innovation à s’accélérer en Chine, en disant : « Le fait que Deep Seek ait pu comprendre la chaîne de pensée avec une nouvelle façon de faire de l’apprentissage par renforcement est soit en train de rattraper les États-Unis en apprenant rapidement, soit peut-être même plus innovant maintenant. »

La Chine est-elle vraiment en tête ?

Quant à cette question de savoir si la Chine est en avance, je pense qu’en termes pratiques, la réponse reste non. Bindu Ready écrit : « Un mythe circule selon lequel la Chine est en avance sur les États-Unis en IA. Non, ce n’est pas le cas. Voici les meilleurs modèles : Reasoner (01), Coder (Sonet 3.7), modèle d’instruction (GPT-4.5), OCR (Gemini Flash), temps réel (Grock 3), vidéo (VO), image (Flux Ultra Zero). Aucun de ces modèles ne vient de Chine. Presque tous viennent des États-Unis. Certes, la Chine a de bons modèles open source, mais ils sont utilisés par moins de 1 % dans le monde réel. »

Je pense que c’est une maigre consolation. Ce que les gens observent, ce n’est pas l’analyse statique de la situation actuelle, mais les tendances. En ce moment, l’impression est que la Chine surpasse les États-Unis en matière d’IA, et même s’ils n’ont pas dépassé l’état de l’art, c’est la tendance qu’ils suivent.

De plus, qui peut dire que la seule chose qui compte dans la compétition de l’IA est de posséder l’état de l’art ? Bindu écrit qu’ils sont utilisés par moins de 1 % dans le monde réel, mais cela pourrait changer rapidement si la Chine peut totalement modifier le profil des coûts et évangéliser ses propres modèles. Il y aura beaucoup d’applications d’IA qui se contenteront d’une solution « suffisamment bonne » qui est juste 5 à 10 % moins performante que la version leader.

Cette compétition continue d’être une dimension fascinante de cette histoire. Elle ajoute certainement une couche supplémentaire de dynamisme à l’ensemble du domaine. Pour l’instant, c’est tout pour aujourd’hui. Merci de votre écoute ou de votre visionnage comme toujours, et jusqu’à la prochaine fois, paix.

Featured image by Li Yang on Unsplash