Comment la Guerre des Prix de l’IA va Vous Impacter
Aujourd’hui, nous allons parler de la guerre des prix dans le domaine de l’intelligence artificielle, qui s’est considérablement intensifiée au cours des derniers mois, et de ce que cela pourrait signifier pour vous et votre entreprise.
L’émergence des modèles chinois à bas coût
Le sujet d’aujourd’hui est particulièrement d’actualité. Le géant chinois Baidu vient de lancer deux nouveaux modèles d’IA qui, selon leurs affirmations, offrent des performances égales ou proches des grands modèles américains, notamment GPT, mais à un prix nettement inférieur.
Et quand on parle de prix bas, il s’agit de prix vraiment bas. Baidu affirme que son nouveau modèle Ernie égale ou dépasse les performances de GPT-4.5 pour environ 1% de son prix : 55 cents par million de tokens d’entrée, contre 75 dollars pour GPT-4.5. L’autre modèle lancé par Baidu, Ernie X1, leur modèle de raisonnement, est proposé à un prix encore plus agressif, 50% moins cher que celui de DeepSeek, déjà considéré comme très abordable.
Beaucoup y voient une intensification sérieuse de la guerre des prix dans le secteur de l’IA.
L’évolution rapide des prix de l’IA
Indépendamment de l’arrivée des modèles chinois, il y avait déjà un sentiment général que le prix de l’IA allait chuter de façon spectaculaire. L’intelligence devient moins chère à un rythme qui dépasse largement la loi de Moore, qui était auparavant la référence pour mesurer la vitesse à laquelle la technologie devenait moins coûteuse.
Sam Altman, PDG d’OpenAI, utilise souvent l’expression « intelligence trop peu coûteuse pour être mesurée ». En juillet, lors de l’introduction de GPT-4.0 Mini, il a souligné qu’à peine deux ans auparavant, le meilleur modèle au monde était non seulement bien moins performant que les modèles actuels, mais aussi 100 fois plus coûteux.
Nous avons également vu que même parmi les grandes entreprises technologiques, le prix est devenu un argument concurrentiel majeur :
- Amazon, qui n’a pas encore vraiment trouvé sa place avec ses propres modèles, a lancé sa famille Nova Foundation en décembre, avec une stratégie clairement axée sur la compétitivité des prix.
- Google a également tenté d’utiliser le prix comme avantage concurrentiel. En février, lors du lancement de Gemini 2.0 Flash et Flashlight, l’accent était mis sur leur coût nettement inférieur.
Globalement, le prix des LLMs (grands modèles de langage) et de l’intelligence qu’ils représentent s’est littéralement effondré.
Le moment DeepSeek : un tournant dans la course à l’IA
Cette tendance a pris une nouvelle dimension lorsque DeepSeek a lancé son modèle, affirmant qu’il offrait des performances très similaires aux modèles d’OpenAI mais avait été entraîné pour moins de 6 millions de dollars.
Cette révélation, bien que non confirmée, a secoué les marchés. Lorsque DeepSeek Claude-1 est sorti, beaucoup l’ont qualifié de « moment Spoutnik », déclenchant une course mondiale vers une IA toujours moins chère.
L’impact psychologique de DeepSeek a été si profond, en termes de recalibrage de la perception de la position de la Chine dans la compétition de l’IA, que chaque développement ultérieur est évalué à l’aune de cette question : « Est-ce le prochain moment DeepSeek ? »
La semaine dernière, nous avons parlé de l’agent IA Manis, que beaucoup ont qualifié de « second moment DeepSeek » pour la Chine. Et maintenant, nous avons des gens qui qualifient cette sortie de Baidu de nouveau « moment DeepSeek ».
Les nouveaux modèles de Baidu et leur positionnement
Baidu a dévoilé Ernie 4.5 et X1, décrit comme « un modèle de raisonnement et de réflexion approfondie avec des capacités multimodales ». Selon l’entreprise, Ernie X1 offre des performances comparables à DeepSeek Garan, mais à seulement la moitié du prix, tandis qu’Ernie 4.5 est leur dernier modèle fondamental et un nouveau modèle multimodal natif de nouvelle génération.
En termes de capacités, ces modèles offrent tout ce que l’on pourrait attendre : ils peuvent analyser et résumer des documents, résoudre des problèmes complexes… mais c’est vraiment le prix qui fait parler.
Certains ont souligné que, si le modèle Ernie X1 coûte environ la moitié du prix du modèle de raisonnement R1 de DeepSeek, le modèle V3 non-raisonnement de DeepSeek reste environ deux fois moins cher qu’Ernie 4.5. Néanmoins, ces deux modèles sont considérablement moins chers que GPT-4.0 et GPT-4.5.
Les réactions du marché
En réponse à ces annonces, les mèmes ont rapidement circulé, notamment une vidéo d’un carambolage multiple. Jeffrey Townsen écrit : « Une vue en temps réel des investisseurs dans les modèles de fondation Gen : DeepSeek à bas coût a choqué OpenAI, maintenant Baidu a lancé Ernie 4.5 à super bas coût. La Chine fait chuter le coût de l’IA. C’est brutal. »
S. Modane ajoute : « Les entreprises chinoises d’IA ne construisent pas seulement de meilleurs modèles fondamentaux (ex. DeepSeek), elles construisent des modèles fondamentalement moins chers (ex. Baidu). L’Amérique ne peut pas rivaliser avec cela s’il continue. C’est une innovation radicale, financée par l’État ou autrement. »
Les implications de cette guerre des prix
Impact sur le marché boursier
L’émergence de ces modèles et l’idée qu’ils pourraient utiliser beaucoup moins de puissance de calcul pour obtenir ce type de performances menacent le narratif d’entreprises comme Nvidia, qui ont porté le rallye boursier pendant quelques années.
Il est important d’apporter quelques nuances :
- Il se passe beaucoup plus de choses que DeepSeek sur le marché boursier. Nous sommes actuellement dans une période de volatilité extrême et d’avenirs imprévisibles, et les marchés ne traitent pas seulement de la Chine et de l’IA, mais aussi des tarifs douaniers et du réalignement géopolitique.
- Il est difficile de déterminer dans quelle mesure la sous-performance des actions technologiques est liée à cela plutôt qu’à une simple correction après deux années de croissance pratiquement sans entrave.
L’autre question, plus structurelle, concerne le coût d’inférence. Le narratif de Wall Street reste en quelque sorte bloqué sur l’idée que la seule utilisation de la puissance de calcul est d’entraîner de nouveaux modèles, plutôt que de livrer ces modèles en pratique.
Le contre-argument, celui que des entreprises comme Nvidia avancent, est que plus les modèles deviennent bon marché, plus les gens les utilisent. Plus les gens utilisent les modèles, plus ils encourent des coûts d’inférence, et ainsi la charge de calcul se déplace vers une partie différente de la pile, mais reste néanmoins présente.
Quoi qu’il en soit, cela rend les choses moins claires en tant que pari, ce qui pourrait avoir des implications pour le financement en aval.
Impact sur les modèles d’affaires des startups
Pour les startups, c’est un tableau mitigé. À court terme, il y a beaucoup d’aspects positifs à cette pression à la baisse sur les prix : toutes les startups peuvent faire et offrir beaucoup plus pour beaucoup moins cher. Plus l’intelligence devient disponible de manière rentable, plus les startups trouveront des moyens de l’utiliser, et c’est une très bonne chose.
À long terme, cela pourrait être un peu plus difficile. Si la compression des prix continue d’être aussi sévère qu’elle le semble, cela pourrait contraindre et limiter la fourchette de prix que les startups peuvent effectivement proposer.
Un domaine où cela se fera particulièrement sentir est celui des agents IA. Actuellement, il existe de nombreux modèles de tarification différents pour les agents. Les entreprises expérimentent des prix basés sur les résultats et essaient généralement de penser les choses de nouvelles façons, en dehors du modèle SaaS traditionnel.
Mais, globalement, elles se comparent encore au travail humain équivalent. Si vous avez un agent commercial ou SDR, la promesse de cet agent est que vous allez payer moins que ce qu’aurait coûté le temps humain équivalent. Cependant, en termes de « combien moins », les entreprises se comparent encore à l’humain qui aurait fait le travail auparavant, ce qui les rend encore assez coûteuses.
Il semble très probable que quelqu’un va essayer d’inverser ce flux et, au lieu de fixer le prix sur la base de ce qu’aurait été le temps humain comparatif, ils vont le fixer sur la base du coût des biens et avoir un prix radicalement moins cher qui sape tout le principe de l’autre modèle.
Encore une fois, la pression contraire ici est que si, à l’avenir, nous n’embauchons pas seulement un agent pour faire ce qu’une personne avait l’habitude de faire, mais mille agents pour le faire d’une manière totalement différente, peut-être que tout cela finira par s’équilibrer. Mais le point est que la guerre des prix aura des impacts à la fois du côté des startups en termes de ce qu’elles peuvent offrir, et du côté des entreprises en termes de ce qu’elles s’attendent à acheter.
La dimension géopolitique
Et puis il y a la dimension géopolitique. Une des questions est de savoir dans quelle mesure cette guerre des prix est intentionnelle. Est-ce que la Chine et les entreprises chinoises font quelque chose d’insoutenable et d’anti-économique pour nuire aux concurrents américains ?
La réponse est probablement que cela n’a pas d’importance tant que les entreprises engagées dans la guerre des prix ont des poches assez profondes pour continuer. Certainement, les entreprises américaines n’apprécient pas cette situation. Dans la proposition d’OpenAI pour le plan d’action USAI, ils argumentent essentiellement que DeepSeek et l’IA chinoise devraient être interdits, ce qui est bien sûr une façon de limiter la concurrence.
Il existe d’autres stratégies. Robert Scoville, par exemple, a écrit ce week-end : « Si j’étais Mark Zuckerberg, je lancerais un modèle d’IA impressionnant gratuitement et mettrais fin à cette guerre des prix une fois pour toutes. Pourquoi ? Parce que le modèle qui gagne collectera plus de données en temps réel de tous ses 3 milliards d’utilisateurs, ce qui rendra ses lunettes et services meilleurs et plus rentables. »
Et en effet, il y a un sentiment que c’est peut-être la voie à suivre. Mark Jeffrey écrit : « L’intelligence de l’IA tend vers l’infini, le prix de l’IA tend vers la gratuité. Les fournisseurs de style open source de services additionnels et de verticales construites autour de l’IA gagnent, et l’incarnation de l’IA dans le monde des atomes gagne et devient géométriquement plus précieuse avec les augmentations d’intelligence. »
Conclusion : un avenir en rapide évolution
Il y a beaucoup d’incertitudes actuellement quant à l’avenir du modèle économique de l’IA. À ce stade, tout ce qui semble clair, c’est que le côté commercial va changer presque aussi rapidement que le côté technologique.
J’espère vous avoir convaincu qu’il y a des implications significatives à cette guerre des prix pour l’IA avec laquelle vous interagissez, le prix que vous payez pour elle, et les opportunités qu’elle crée pour vous.
Bien entendu, je continuerai à suivre l’évolution de ces tendances au fil du temps. Pour l’instant, c’est tout pour le briefing quotidien sur l’IA d’aujourd’hui. À la prochaine fois !
Featured image by Artem Beliaikin on Unsplash

