Comment tarifer les agents d’IA : Stratégies de prix et tendances du marché

Comment tarifer les agents d’IA : Stratégies de prix et tendances du marché

Aujourd’hui, nous abordons une question plus intéressante qu’elle n’y paraît au premier abord : comment tarifer les agents d’intelligence artificielle. Cette discussion n’est pas seulement pertinente pour les startups qui essaient de trouver leur voie, mais elle a des implications beaucoup plus larges pour l’ensemble du secteur technologique.

Pourquoi la tarification des agents d’IA est cruciale

La conversation sur la tarification des agents ne concerne pas uniquement la façon dont les startups et les entreprises technologiques envisagent leur modèle économique. Elle implique également la manière dont les grandes entreprises imaginent et considèrent ces agents. Les questions fondamentales sont :

  • Les agents sont-ils des logiciels à acquérir de la même manière que les solutions SaaS auparavant ?
  • Sont-ils plutôt des « employés numériques » à embaucher ?
  • Comment les réponses à ces questions influencent-elles la façon dont les entreprises devraient payer pour ces services ?

Il est absolument certain que la tarification des agents aura un impact déterminant sur les modèles économiques des entreprises d’IA, ce qui influencera également la conception même de ces entreprises. En somme, c’est une conversation d’une importance capitale.

La guerre des prix entre Windsurf et Cursor

Le contexte spécifique qui nous amène à avoir cette conversation aujourd’hui est que Windsurf a déclenché une guerre des prix dans le domaine des assistants de codage IA. Leur offre standard Pro est désormais proposée à 15 $ par mois, avec une allocation de 500 prompts avant de nécessiter un rechargement. Ils suppriment également leur système de crédits d’action de flux qui facturait les appels d’outils dans un workflow d’agent.

L’entreprise affirme que cela signifie que vous ne payez que par prompt utilisateur. Les abonnements Tech et Enterprise ont également vu leur prix baisser à respectivement 30 $ et 60 $ par mois.

Le PDG Robu a clairement indiqué qu’il s’agissait d’une attaque directe contre Cursor, bien qu’il n’ait pas mentionné l’entreprise rivale par son nom. Dans son annonce, il a déclaré : « Avec la mise à jour tarifaire d’aujourd’hui, Windsurf propose désormais de loin la structure de prix la plus abordable de tous les outils de codage IA sur le marché. »

Et dans une comparaison très pointue, il a ajouté : « Comparez cela à n’importe quel autre outil où 20 $ par mois vous donnent moins de prompts, des requêtes confuses et des frais cachés pour les appels d’outils, ou dans le pire des cas, un paiement par token. »

Ne pas facturer les appels d’outils est un avantage considérable, car à mesure que le codage se complexifie, Windsurf facture un tarif forfaitaire tandis que les prompts complexes de Cursor peuvent facilement atteindre un ou deux dollars chacun.

Le PDG Rob fait preuve d’un grand dynamisme commercial. Il a passé des heures cette semaine à répondre aux clients potentiels, commentant leurs attentes concernant la structure et le prix du service. Tout cela se déroule dans le contexte d’une acquisition rumeur par OpenAI. L’accord n’est pas finalisé, mais selon des sources bien informées, OpenAI envisagerait un prix de 3 milliards de dollars pour acheter l’entreprise.

Parallèlement aux baisses de prix, Windsurf a annoncé que les utilisateurs bénéficieraient d’une semaine supplémentaire d’utilisation gratuite et illimitée des nouveaux modèles GPT-4 et Claude-3 Mini. On peut se demander si Windsurf reste rentable à ces niveaux de prix ou s’ils subventionnent les utilisateurs pour gagner des parts de marché. Dans leur annonce, l’entreprise a déclaré que leurs ingénieurs d’infrastructure ont réussi à optimiser l’utilisation des GPU et qu’ils tiennent leur promesse de « répercuter les économies sur nos utilisateurs finaux ».

Nous observons maintenant attentivement si Cursor va riposter pour déclencher une guerre des prix à grande échelle dans l’un des secteurs à la croissance la plus rapide de l’histoire de la technologie.

Les dynamiques de la tarification de l’IA

Comme je l’ai mentionné, c’est la genèse spécifique de notre conversation aujourd’hui, mais cette discussion sur la tarification des agents se déroule plus largement dans tout le secteur.

Aaron Levy de Box a récemment écrit : « Réussir la tarification des agents d’IA est un sujet extrêmement important pour les entreprises d’IA actuellement. Il y a deux dynamiques en jeu dans le domaine de la tarification de l’IA :

  1. La première dynamique est que les modèles eux-mêmes deviennent de moins en moins coûteux à exécuter.
  2. Mais l’autre tendance est que les cas d’utilisation pour les clients nécessitent de plus en plus d’inférence. »

Nous avons vu des exemples de recherche approfondie utilisant jusqu’à 100 fois plus de puissance de calcul qu’une requête standard. Les agents de codage IA peuvent également consommer d’énormes ressources selon la tâche. Ainsi, même si l’inférence devient moins chère par token, l’inférence totale augmente considérablement.

Une approche normale avec la tarification des ressources consiste à répercuter efficacement le coût de la ressource sur le client. C’est un modèle simple, mais il existe de nombreux domaines où un cas d’utilisation client clé peut être techniquement possible mais inabordable aujourd’hui, même s’il deviendra abordable demain.

Alors, attendez-vous de résoudre le problème lorsqu’il sera économiquement viable à l’échelle, ou vous engagez-vous maintenant en pariant sur l’amélioration des coûts ? La réponse serait probablement différente dans n’importe quelle autre catégorie technologique de l’histoire, mais les implications des améliorations d’efficacité des modèles d’IA sont que les entreprises de logiciels peuvent se permettre de tarifer l’IA d’une manière qui anticipe la courbe des coûts dans le temps.

Cela permet de débloquer aujourd’hui des cas d’utilisation qui pourraient autrement être moins économiquement attrayants, mais dont vous savez qu’ils le seront bientôt. C’est certainement un pari, mais qui semble de plus en plus susceptible de porter ses fruits. Tout cela grâce aux percées constantes en IA provenant des laboratoires de pointe ainsi que des fournisseurs de modèles à poids ouverts, et cela ne semble pas ralentir de sitôt.

Cadres de tarification pour les agents d’IA

Au début du mois d’avril, Manny Medina, fondateur de Outreach, a écrit un article sur le blog Growth Unhinged intitulé « Un nouveau cadre pour la tarification des agents d’IA ». Cette analyse fait suite à l’examen de dizaines de startups d’agents d’IA différentes et divise principalement leurs modèles de tarification en quatre quadrants :

  1. Par workflow : vous payez par workflow complété
  2. Par résultat d’agent : vous payez par objectif complété (ces deux premiers sont basés sur les résultats)
  3. Basé sur l’activité : par exemple, des frais mensuels fixes par agent (modèle de remplacement d’ETP)
  4. Paiement à l’usage : par action d’agent ou modèle de consommation

Comme le souligne Manny, ces différents modèles conviennent à différents types d’entreprises :

  • Le modèle de remplacement d’ETP (prix par agent) est idéal pour les agents d’IA qui gèrent de larges responsabilités ou des fonctions professionnelles entières avec des charges de travail cohérentes et prévisibles. L’avantage est que vous puisez dans le budget des effectifs ou de la main-d’œuvre, qui est au moins 10 fois plus important que le budget logiciel, mais cela vous expose à la concurrence d’entreprises qui facturent simplement moins cher.

  • Le modèle de consommation ou prix par action d’agent convient mieux aux agents effectuant des tâches discrètes variées avec une fréquence ou un volume imprévisibles.

  • Le prix par workflow d’agent (modèle d’automatisation des processus) est optimal pour les agents qui exécutent des processus à plusieurs étapes avec des livrables intermédiaires clairs.

  • Le prix par résultat d’agent (modèle basé sur les résultats) convient aux applications d’IA avec des performances prévisibles et des critères de réussite clairement définis, dans des marchés qui s’y attendent déjà.

Agents verticaux d’IA : potentiellement 10 fois plus importants que le SaaS

Je veux revenir à sa comparaison de remplacement d’ETP avec un article de l’année dernière de Y Combinator intitulé « Les agents verticaux d’IA pourraient être 10 fois plus importants que le SaaS ». Cela a été discuté sur leur podcast, et l’argument de base est que si les agents remplacent effectivement de grandes parties du travail humain, alors ils concurrencent les budgets de main-d’œuvre, pas les budgets logiciels, les budgets de main-d’œuvre étant radicalement plus élevés.

La tension intéressante que nous observons déjà chez Super Intelligent, lorsque les entreprises découvrent les agents, est de savoir s’ils seront tarifés en référence au travail humain équivalent ou en référence au coût des biens vendus avec une certaine marge.

Je pense que les entreprises d’agents essaient généralement de maintenir la comparaison avec le travail humain comparatif, et cela a du sens car ces budgets sont beaucoup plus importants. Le défi comporte plusieurs aspects :

  1. Si vous essayez de dire « mon agent fait le travail d’un développeur junior, et un développeur junior coûterait 100 000 $, mais mon agent ne coûtera que 40 000 $ », il est presque certain que quelqu’un qui peut fournir cet agent pour beaucoup moins cher dira : « Peu importe que l’équivalent humain coûtait 100 000 $, la chose ne me coûte que quelques milliers de dollars à exécuter, donc pour 5 000 $ vous pouvez l’avoir ». Il y a probablement une pression concurrentielle qui pousse les prix à la baisse.

  2. Certains cas d’utilisation des agents ne pourront pas être tarifés par rapport au travail humain car, a priori, le coût du travail humain aurait été si élevé auparavant que personne n’aurait jamais envisagé de faire la chose.

J’ai un exemple très spécifique de nos audits de préparation aux agents. Dans le cadre des audits, nous effectuons des entretiens avec des agents vocaux qui peuvent concerner quelques dirigeants ou chaque personne d’un département. Actuellement, nous travaillons avec une grande entreprise pharmaceutique avec les 200 membres d’un département spécifique.

Le problème, si nous avions essayé de fixer le prix par rapport à ce qu’il en aurait coûté à McKinsey pour interroger les 200 personnes de ce département, est que nous savons a priori que le coût de McKinsey interrogeant 200 personnes serait si astronomique qu’ils n’envisageraient même jamais cela. Nous ne pouvons donc pas dire : « Si vous demandiez à McKinsey de le faire, ce serait 300 000 $, et nous ne voulons vous facturer que 100 000 $ », car ils répondraient : « Oui, mais nous n’envisagerions jamais de payer cela car c’est tellement hors de portée que c’est sans importance pour notre planification réelle. »

Et donc, dans notre situation, nous devons fixer le prix plus près du point de référence du coût des biens vendus, car ce que nous faisons est fondamentalement d’ouvrir de nouvelles opportunités qui n’étaient tout simplement pas possibles avant les agents.

Le plafond infini de la tarification des agents

Une note intéressante à contre-courant vient de Signal. Ils ont écrit : « Je parlais à quelqu’un d’autre profondément impliqué dans l’IA et nous avons commencé à réfléchir à la façon dont la tarification des agents pourrait entrer dans un territoire totalement inexploré. Par exemple, si quelqu’un construit un agent ‘parfait’ pour la diligence juridique en biotechnologie et qu’il est protégé par de véritables barrières à l’entrée, des cadres d’évaluation des données, un verrouillage du flux de travail et la confiance, ils pourraient facturer au-dessus des tarifs humains et rester le choix évident : disponibilité 24/7, peu d’erreurs, échelle infinie… C’est assez ridicule que le plancher pour le travail de l’IA se dirige peut-être vers zéro, mais le plafond pourrait potentiellement être infini, du moins à court terme. »

C’est l’une de ces choses qui nécessite beaucoup d’imagination concernant les barrières à l’entrée qui justifieraient même cela, mais je pense qu’un enseignement pertinent, quoi qu’il en soit, est que les agents ne vont pas seulement être en concurrence sur les coûts. Leur disponibilité permanente et perpétuelle, leur évolutivité massive, ce sont des choses qui les rendent meilleurs que leur équivalent humain, pas seulement un meilleur choix parce qu’ils sont moins chers.

Pour reprendre le même exemple des entretiens avec des agents vocaux que nous utilisons pour les audits de préparation aux agents : si vous vous réveillez avec une insomnie à 1h30 du matin, vous êtes libre de faire votre entretien à ce moment-là. Vous n’avez pas besoin de le planifier avec nous, vous pouvez le faire à votre convenance, et c’est une expérience nettement meilleure que si nous faisions des entretiens vocaux traditionnels avec nos analystes.

Conclusion

Tout cela est intéressant, non seulement d’un point de vue théorique, mais d’une manière qui façonnera l’avenir de l’espace de l’IA et des agents. La façon dont nous décidons de tarifer ces technologies émergentes aura des répercussions profondes sur leur adoption, leur développement et leur intégration dans nos entreprises et nos vies.

La guerre des prix entre Windsurf et Cursor n’est que le début d’une transformation plus large du marché, où les entreprises devront naviguer entre la valeur perçue de leurs agents, le coût réel de fonctionnement, et les attentes d’un marché en évolution rapide. Les modèles qui émergeront de cette période formative définiront probablement l’économie de l’IA pour les années à venir.

Featured image by Alexander Faé on Unsplash