L’Ère de l’Orchestrateur d’Agents IA : Pourquoi la Gestion des Essaims d’IA Sera Votre Seul Emploi
De temps en temps, un article émerge qui semble prédire avec justesse l’avenir de notre relation avec la technologie. C’est exactement le cas de « L’Âge de l’Orchestrateur d’Agents », rédigé par Shyamal, qui travaille dans l’IA appliquée chez OpenAI. Cet article, qui risque de faire grand bruit, aborde une question cruciale : quelles compétences seront nécessaires dans un futur où l’IA s’intègre dans de plus en plus de professions ?
Le Futur du Travail : Un Jeu de Gestion de Ressources
J’ai toujours imaginé le futur du travail comme une partie de Factorio. Pour ceux qui ne connaissent pas, Factorio est une simulation 2D de construction d’usine. Vous commencez par extraire du minerai de fer avec une pioche, puis vous construisez progressivement des foreuses, des fonderies, des centrales électriques, des gares, des convoyeurs… La complexité augmente exponentiellement.
Votre objectif est de concevoir des systèmes, d’observer leur comportement et de les optimiser continuellement pour améliorer la production. Vous modélisez, vous ajoutez de la complexité, vous identifiez les goulots d’étranglement et vous les corrigez.
De plus en plus de chercheurs en IA suggèrent que les personnes qui réussiront dans l’ère de l’IA seront celles qui possèdent ce type de compétences. Will Depuse, « maître du désordre » chez OpenAI (un titre intrigant), affirme :
« Je pense que le futur du travail ressemblera à Starcraft ou Age of Empires. Vous dirigerez 200 micro-agents pour résoudre des problèmes, recueillir des informations, contacter des personnes, concevoir de nouveaux systèmes, etc. »
C’est pourquoi « L’Âge de l’Orchestrateur d’Agents » est un titre si pertinent – il décompose cette idée complexe en concepts plus accessibles.
La Rareté Définit la Valeur
La question fondamentale est : à quoi ressemblera le monde lorsque les agents IA pourront tout faire ? Nous n’en sommes pas encore là, mais les capacités de ces agents s’améliorent rapidement.
Une excellente façon d’y réfléchir est de se demander : qu’est-ce qui sera rare ? Les marchés s’organisent généralement autour de ce qui est en quantité limitée.
Pendant longtemps, la ressource rare était la connaissance de la programmation. Si vous saviez coder, vous créiez une valeur immense. Quand Excel est apparu, la compétence rare était de savoir l’utiliser. Si vous maîtrisiez Excel, vous pouviez modéliser une entreprise, et vos talents, étant rares, étaient très demandés et bien rémunérés.
Maintenant que les modèles d’IA s’améliorent pour effectuer le travail, le vérifier et l’améliorer, quelle sera la nouvelle ressource rare ? Ce ne sera pas de savoir comment effectuer une tâche manuellement. La ressource rare deviendra la capacité à orchestrer efficacement les ressources : puissance de calcul, capital, accès aux données et jugement humain/expert.
L’Expertise Démocratisée
Pour illustrer ce point, l’auteur partage une expérience personnelle. Il voulait extraire des données d’un site web pour analyser la relation entre deux ensembles de chiffres. En utilisant GPT-4, il a découvert que le site disposait d’une API gratuite, évitant ainsi le scraping. En 5 minutes, il a obtenu les données nécessaires, les a téléchargées dans un tableur, puis a demandé à ChatGPT d’effectuer une régression linéaire.
Le modèle a réalisé l’analyse, créé un graphique, calculé la relation et même suggéré d’examiner des tendances non linéaires. Il a ensuite effectué un test quadratique pour vérifier l’existence d’une relation parabolique.
Il y a peu de temps, pour atteindre ce même résultat, il aurait fallu posséder de nombreuses compétences : programmer en Python pour extraire les données, utiliser l’API, organiser les données dans un tableur, créer des graphiques et effectuer diverses analyses statistiques.
Aujourd’hui, vous n’avez plus besoin de ces compétences spécifiques. Vous devez simplement savoir que vous pouvez demander à ChatGPT de le faire et être conscient de ses capacités.
Comme le dit Shyamal, « l’expertise se démocratise ». Si vous avez passé 10 000 heures à apprendre Excel, c’est formidable, mais cet avantage s’aplanit désormais. La plupart des gens peuvent simplement télécharger un tableur dans ChatGPT et lui faire faire tout le travail.
La prime se déplace donc de « je connais le code fiscal » à « je peux concevoir la boucle qui obtient la bonne réponse et fonctionne à moindre coût ».
La Transformation du Rôle de l’Expert
Actuellement, vous pouvez engager un expert pour faire vos impôts car les erreurs potentielles sont nombreuses et coûteuses. Mais si vous pouvez construire ou louer un agent capable de faire un bon travail, de demander des retours, de vérifier les cas particuliers et de s’améliorer avec le temps, alors la « fonction de gardien » de l’expert disparaît.
C’est une façon intéressante de voir les choses. D’un côté, les experts sont des personnes qui apprennent à faire quelque chose et vous apportent de la valeur. D’un autre côté, si vous voulez faire quelque chose que vous ne savez pas faire vous-même, vous êtes souvent obligé de payer un expert pour ses services. Et plus c’est compliqué, moins il y a de personnes qualifiées, plus c’est cher.
Pour de nombreuses tâches, l’IA supprimera cette barrière. Il sera plus facile de créer des images et des vidéos, d’effectuer diverses opérations mathématiques, d’agréger des connaissances, de faire des recherches et bien d’autres choses encore. La plupart des tâches réalisables devant un ordinateur seront affectées par l’IA d’une manière ou d’une autre.
Il y aura toujours des experts, mais ce sera une nouvelle catégorie. Il s’agira de personnes qui fourniront un jugement, qui définiront la stratégie générale, qui géreront les cas particuliers. Par exemple, connaître les détails du code fiscal sera moins précieux que savoir comment mettre en place un flux de travail autonome qui produit une déclaration correcte, signale les parties ambiguës pour qu’un humain les examine et coûte 5 centimes en puissance de calcul au lieu de 5 dollars.
L’Exemple Concret de l’Analyse Médicale
L’auteur partage une utilisation personnelle de ChatGPT : télécharger ses résultats d’analyses sanguines et demander au modèle de les expliquer ligne par ligne. Pour la plupart d’entre nous, ces acronymes et chiffres étranges sur les analyses de sang sont incompréhensibles. ChatGPT peut non seulement tout expliquer, mais aussi indiquer ce que cela signifie et même donner des conseils d’amélioration si nécessaire.
On pourrait facilement mettre en place une boucle où les gens téléchargent simplement un PDF de leurs analyses et reçoivent automatiquement les réponses les plus pertinentes, avec un aperçu ciblé sur des conditions spécifiques comme la fatigue ou le manque d’énergie.
Ce n’est qu’un exemple parmi d’innombrables autres où ces modèles peuvent fournir d’excellentes réponses.
Le Malaise de la Transition
Cette évolution sera inconfortable pour ceux dont le statut est lié au fait d’être les seuls à pouvoir faire quelque chose. Non seulement leur statut, mais aussi leurs salaires seront probablement affectés.
Si vous vous formez pour une carrière parce que vous croyez que l’information est rare, demandez-vous ce qui se passera quand elle ne le sera plus. Si vous vous formez pour être la personne capable de transformer toutes ces informations bon marché en un résultat précieux, vous êtes sur un terrain plus solide.
L’optimisation des ressources devient beaucoup plus importante. Le savoir et la capacité à faire les choses étaient rares, mais à l’avenir, ce ne sera plus le cas. Nous aurons une abondance massive de capacités. La question sera : comment en tirer le meilleur parti ? Comment transformer toutes ces capacités potentielles en valeur pour les gens en utilisant le moins de ressources possible ?
Le Nouveau Métier : Orchestrateur d’Agents
Concrètement, nous devrons devenir très habiles à attribuer des ressources (puissance de calcul, liquidité, temps de laboratoire, révision humaine, etc.) à des flux de travail/agents autonomes. C’est un nouveau métier.
Si vous voulez faire une grande analyse marketing, vous l’envoyez à votre analyste et elle vous dit que ce sera fait dans deux semaines. Elle a d’autres choses à faire et une idée du temps que cela lui prendra.
Mais dans le monde où nous vivrons probablement bientôt, vous pourrez lancer 10 000 agents pour faire 10 000 analyses. Vos goulots d’étranglement deviennent très différents.
Il ne s’agit plus de l’idée que vous avez entre 9h et 17h pour faire le travail. Il s’agit plutôt de réduire les coûts par tâche et d’optimiser les ressources. Votre cluster de calcul peut être limité, votre budget est limité, le nombre d’heures de vos experts-réviseurs est limité.
Vous voudrez donc faire plus du côté informatique. Vous aurez toujours besoin de personnes pour le vérifier, mais existe-t-il des moyens de réduire la quantité de révision qu’elles doivent faire ?
Si vos agents informatiques produisent du code et que vous avez besoin de quelqu’un pour y jeter un dernier coup d’œil, existe-t-il des vérifications automatisées que vous pouvez faire qui valident ou rejettent ce code avant que l’humain n’ait à l’examiner ? Ou peut-être des outils pour faciliter la révision humaine, comme un petit rapport indiquant les potentiels drapeaux rouges à examiner.
Vous devrez penser à des choses comme la mise en file d’attente d’un million de tâches pendant la nuit, lorsque l’énergie est moins chère.
L’Optimisation des Ressources : L’Exemple d’AlphaEvolve
Dans le passé, diverses startups et entreprises devaient allouer soigneusement leur capital. Dans ce nouveau régime, vous devez également allouer soigneusement votre puissance de calcul. Ce n’est pas une situation où l’on peut simplement configurer et oublier.
Les modèles s’amélioreront. Les coûts baisseront. De nouvelles tâches apparaîtront. Vous aurez besoin de personnes dont le travail consiste littéralement à orchestrer des flottes d’agents IA et les ressources rares dont ils ont besoin. Pensez-y comme à un contrôleur aérien ou un chef d’orchestre pour les agents.
Les meilleures entreprises font déjà une partie de ce travail. Elles optimisent leurs dépenses cloud. Elles planifient les tâches. Elles réfléchissent à l’efficacité du capital. Mais elles restent extrêmement gaspilleuses, tant en temps humain qu’en temps machine.
Un exemple frappant est AlphaEvolve de DeepMind (Google). Ce modèle d’IA a été utilisé pour optimiser les vastes centres de données de Google, appelés Borg. Cette nouvelle solution, en production depuis plus d’un an, récupère en moyenne 0,7% des ressources informatiques mondiales de Google. Ce gain d’efficacité soutenu signifie qu’à tout moment, davantage de tâches peuvent être accomplies sur la même empreinte informatique.
Réduire le gaspillage signifie que vous pouvez en faire plus. Les personnes qui gagneront sont celles qui peuvent optimiser et améliorer les processus.
Les Limites Actuelles : La Cohérence à Long Terme
Vous vous demandez peut-être : « Si l’IA a optimisé les centres de données de Google mieux que les humains, cela signifie-t-il que tous ces agents seront également orchestrés par une IA ? »
C’est là que nous rencontrons l’un des obstacles au développement de l’IA actuellement. De nombreux agents IA en cours de développement ont un problème de cohérence à long terme. Lorsque vous essayez de les faire fonctionner de manière autonome pour des tâches à long horizon, ils finissent par se désintégrer après un certain temps.
AlphaEvolve, fait intéressant, n’était pas un agent IA entièrement autonome. C’était plutôt un LLM (grand modèle de langage) qui servait de pilote. Il y avait une certaine structure autour, y compris des évaluations automatiques des résultats. Mais beaucoup d’entrées provenaient des scientifiques/ingénieurs humains. Ils ont élaboré les prompts et configurations initiales, choisi les LLM à intégrer, écrit des évaluateurs pour les sorties et fourni la base de données initiale.
Les humains ont mis en place tout cela. AlphaEvolve a ensuite effectué une recherche évolutive intense, éliminé les mauvaises idées, et les bonnes idées qui semblaient prometteuses se sont propagées aux générations futures. À la fin, ils ont trouvé le meilleur programme, la meilleure solution.
Mais encore une fois, on pourrait presque considérer ces personnes comme des orchestrateurs d’agents. Ils contrôlent et vérifient, surveillent ce système d’IA incroyable et le guident. Ce système ne fonctionne pas de manière totalement autonome.
Pour l’instant, il semble y avoir un obstacle à des agents entièrement autonomes gérant d’autres agents : cette cohérence à long terme. Beaucoup de gens luttent avec ce problème, et qui sait, peut-être qu’un article sortira demain annonçant sa résolution.
La Nouvelle Compétence Fondamentale
La maîtrise de la gestion des agents devient le nouvel Excel. Savoir comment décomposer une tâche, définir une récompense, auditer une exécution sera la compétence de base pour les entreprises et les personnes cherchant à profiter de cette vague d’IA à venir.
Mettre en place de nombreux agents et effectuer des tests A/B pour voir ce qui fonctionne, rester flexible et analyser les données – si c’est votre culture, vous progresserez plus rapidement. Si vous essayez de greffer l’IA sur d’anciens flux de travail, vous n’aurez pas une bonne expérience.
Tout comme lorsqu’Excel est apparu, si vous saviez l’utiliser pendant un certain temps, vous étiez très spécial. Mais après un moment, c’est devenu un prérequis. Vous deviez connaître Excel, point final.
Si vous êtes capable de gérer des agents IA, de faire ces tests A/B, de faire de la gestion de produit pour les agents, comme il le décrit, ce sera vraiment la compétence recherchée et un avantage concurrentiel massif.
La Courbe MER : Mesurer les Progrès de l’IA
L’un des cadres les plus satisfaisants pour comprendre les progrès de l’IA est la courbe MER (Meta Curve), qui mesure les performances de l’IA en fonction de la longueur des tâches que les agents IA peuvent accomplir.
Nous avons commencé avec des tâches de quelques secondes, puis GPT-3.5 pouvait gérer environ 40 secondes. Au fil du temps, nous avons des modèles comme Sonnet 3.7 qui peuvent accomplir des tâches d’une heure avec un taux de réussite de 50%.
Un récent article d’OpenAI appelé PaperBench a comparé des participants humains de niveau doctorat, travaillant en apprentissage automatique, avec le modèle GPT-4. Ils devaient reproduire des articles publiés dans le domaine de l’apprentissage automatique et de l’IA.
Normalement, vous avez un article qui propose une expérience et vous devez écrire le code qui l’exécute. Une vérification tierce du code est très utile. Ils examineraient l’article, reproduiraient le code (pas simplement utiliser le code écrit par les auteurs qui pourrait contenir des erreurs), puis l’exécuteraient pour voir s’ils peuvent reproduire les résultats.
Les agents IA (ligne bleue) sont beaucoup plus rapides au début que les docteurs humains en apprentissage automatique. Ils démarrent très rapidement, mais il y a un effet de plateau. Pour les humains, il nous faut un moment pour nous échauffer et comprendre ce que nous faisons. Après environ 24 heures de temps de travail réel (pas simplement une journée écoulée, mais 24 heures de travail effectif sur ce problème), nous dépassons les agents IA.
Selon mer.org, la recherche derrière ce graphique indique que la longueur des tâches que l’IA peut accomplir augmente. Ces IA peuvent servir d’outils utiles dans de nombreuses applications. Pourtant, même les meilleurs agents IA ne peuvent pas vraiment mener à bien des projets à long terme ou se substituer au travail humain. Ils sont incapables de gérer de manière fiable même un travail informatique relativement peu qualifié comme l’assistance exécutive à distance.
Nous avons couvert récemment un article appelé VendingBench où plusieurs modèles d’IA devaient gérer une entreprise de distributeurs automatiques. Ils devaient s’occuper des commandes, de la gestion des stocks, des prix, de la recherche de produits, etc. Certains ont fait mieux que la référence humaine, mais c’est en moyenne largement parce que lorsqu’ils font bien, ils font très bien, mais très souvent, ils deviennent complètement fous parce qu’ils perdent le fil.
Dans l’un des cas, l’un d’eux ne pouvait pas déterminer quand le stock arriverait, alors il a fermé l’entreprise, s’est rendu compte qu’il était toujours facturé pour certains services, a pensé qu’il était victime d’une fraude et a tenté de contacter le FBI. C’était hilarant.
Mais le point important ici est que ces systèmes sont actuellement surhumains pour effectuer des tâches à court terme. Ces tâches discrètes qui ont un début et une fin, ils peuvent les accomplir incroyablement bien. Les enchaîner en un projet à long terme ne se produit pas actuellement.
La recherche de mer.org indique qu’en extrapolant cette tendance, on prévoit que dans moins d’une décennie, nous verrons des agents IA capables d’accomplir indépendamment une grande partie des tâches logicielles qui prennent actuellement aux humains des jours ou des semaines. Mais rien de tout cela ne se produit du jour au lendemain.
Conclusion : L’Intelligence Bon Marché et la Valeur Future
Le point central de l’article est que votre capacité à transformer une intelligence bon marché et des ressources coûteuses en produits précieux est ce qui importera.
Je crois que tout ce qui est présenté ici est absolument juste. Les compétences requises ressembleront un peu à un jeu vidéo comme Starcraft ou Factorio, et l’objectif du jeu sera d’utiliser cette intelligence bon marché.
Historiquement, si vous aviez l’argent pour embaucher des personnes intelligentes, vous pouviez construire beaucoup de choses intéressantes. Mais vous aviez besoin d’argent pour embaucher cette intelligence, et ces humains intelligents ne peuvent pas travailler 24 heures sur 24.
Avec l’IA, vous pouvez la faire travailler 24 heures sur 24. Ce n’est pas très coûteux. Dans l’exemple de PaperBench, combien coûterait l’embauche d’un scientifique en apprentissage automatique de niveau doctorat pour travailler sur votre projet pendant 24 heures (pas une journée, mais 24 heures de travail) ?
Dans cet article, ils indiquent qu’il en coûte 400 $ en crédits API pour exécuter cet agent sur un déploiement de 12 heures, et 66 $ pour que GPT-4 juge la sortie de l’article. Et nous parlons d’un travail d’apprentissage automatique de niveau doctorat. Pour de nombreuses tâches moins exigeantes, ce serait beaucoup moins cher.
Si un projet vaut 10 000 $ sur le marché, et que vous êtes capable de créer une équipe d’agents (certains produisant les choses, d’autres les dépannant, les notant, assurant la qualité, etc.) qui peut le réaliser pour 2 000 $, c’est 8 000 $ de moins que ce qu’il coûterait actuellement.
Pendant un certain temps, vous pourriez très bien réussir simplement en faisant cela. Avec le temps, à mesure que de plus en plus d’entreprises rattrapent leur retard et apprennent à construire ces agents IA, elles découvriront également comment produire pour 2 000 $. L’astuce consistera alors à déterminer comment utiliser moins de ressources, moins de puissance de calcul, comment l’améliorer, etc. Peut-être pourrez-vous réduire le coût de moitié, à 1 000 $.
Je pense que ces deux étapes représentent les phases que nous traverserons dans un avenir proche :
- Apprendre à reproduire ce que font les humains avec des agents IA
- Une fois que cela devient plus courant et moins rare, trouver comment l’optimiser pour le rendre meilleur, moins cher et plus rapide
Personnellement, je pense que ces compétences seront très demandées, comme l’ingénierie logicielle lorsque les ordinateurs ont commencé à apparaître. C’est la nouvelle profession en vogue. Peu de gens savent comment le faire, et les récompenses pour ceux qui y parviennent sont énormes, que vous essayiez de lancer votre propre startup ou d’en faire une carrière.
Il est temps de commencer à pratiquer ces compétences aussi rapidement que possible… après juste une petite partie de Factorio, bien sûr.
