Maîtriser le ‘Fine-Tuning’ d’IA : Guide Complet pour Développer des Compétences Hautement Rémunératrices
Saviez-vous que le fine-tuning (affinage) des modèles d’IA est prédit comme l’une des carrières les plus lucratives de la prochaine décennie ? Pourtant, la plupart des gens sont intimidés à l’idée même d’essayer. Aujourd’hui, je vais vous montrer exactement comment affiner votre premier modèle d’IA pour que vous puissiez constater à quel point il est facile de vous lancer dans cette nouvelle voie professionnelle potentielle.
J’ai fermé toute mon agence de marketing quand j’ai réalisé à quel point l’IA allait être disruptive, et je crois que tout le monde devra faire un pivot similaire. C’est précisément l’objectif de cette chaîne : vous aider à naviguer ces transitions. Maîtriser le fine-tuning semble être l’un des paris les plus sûrs pour l’avenir, et j’ai passé de nombreuses heures à développer ce processus simple en trois étapes que n’importe qui peut suivre.
Pourquoi le Fine-Tuning Est une Compétence d’Avenir
Les entreprises sont désespérément à la recherche de personnes qui comprennent comment créer des outils d’IA spécialisés capables de résoudre des problèmes commerciaux uniques. Les personnes qui maîtrisent le fine-tuning auront un avantage déloyal sur le marché du travail. Même Sam Altman l’a souligné juste après le lancement de ChatGPT, affirmant que le fine-tuning serait une carrière viable pour très longtemps.
Qu’est-ce que le Fine-Tuning exactement ?
Contrairement au prompting simple, le fine-tuning consiste à réentraîner des parties du modèle lui-même. Si vous pouvez imaginer des situations qui nécessitent un prompting élaboré pour obtenir une solution spécifique, c’est un bon candidat pour le fine-tuning. Il existe de nombreux cas d’utilisation pour cela. C’est à la fois un art et une science, et ce n’est certainement pas une solution miracle. Si vous avez du mal à inciter un LLM (Large Language Model) à produire une certaine réponse, le fine-tuning peut ou non être la solution.
Processus de Fine-Tuning en 3 Étapes
Étape 1 : Préparer les Données d’Entraînement
C’est probablement la partie la plus délicate, alors soyez patient. Prenons un peu de recul et réfléchissons à ce que nous faisons lorsque nous affinons ces modèles d’IA. Nous les réentraînons et nous disons essentiellement : « Hé, quand je dis ceci, je veux que tu répondes avec cela. »
Vous devez fournir de nombreux exemples de la façon dont vous voulez que le modèle réponde, mais pas seulement cela – vous devez également fournir de nombreux exemples de vos requêtes utilisateur. Ce sont les deux éléments dont nous avons besoin pour affiner un modèle.
Vous aurez besoin d’entre 20 et 100, voire plus de 100 exemples des réponses que vous essayez d’obtenir du modèle d’IA. Mais encore une fois, la partie la plus délicate est de trouver le prompt qui produirait cette réponse spécifique.
La méthode que j’ai utilisée consiste à prendre cette réponse et à la soumettre à ChatGPT en demandant : « Hé, quel prompt pourrait créer cela ? » De cette façon, vous utilisez l’IA pour déconstruire cette réponse particulière.
Utilisation d’une Feuille de Calcul pour Structurer vos Données
Dans ma feuille de calcul, j’ai dans le premier onglet tous les différents exemples de réponses que je cherche à obtenir de l’IA. Ce sont des titres réels de vidéos YouTube qui ont bien performé. Notre cas d’utilisation aujourd’hui consiste à entraîner le modèle à créer des titres YouTube de la manière dont je veux qu’ils soient créés. Vous pouvez envisager d’utiliser cela pour des textes publicitaires sur les réseaux sociaux et toutes sortes de choses.
Dans le deuxième onglet, nous déconstruisons ces réponses et demandons simplement à l’IA de décrire cette réponse particulière. J’utilise un outil appelé GPT for Sheets, dont je suis un grand fan et que j’ai mentionné dans de nombreuses autres vidéos. Cela nous permet d’accéder à ChatGPT directement dans la feuille de calcul, ce qui nous permet de faire tout cela en masse.
J’ai donc mon titre idéal, puis je pose cette question : « En quelques mots, décrivez de quoi parle cette vidéo YouTube. » Lorsque vous connectez cela à l’aide de la formule GPT for Sheets, vous obtenez ce petit résultat. Ce n’est que la description.
Dans l’onglet suivant, nous prenons cette petite description et nous la concaténons ou la combinons avec ceci, qui est identique pour chacun d’entre eux, et cela donne ce résultat final, ce prompt final qui aboutit à ce titre YouTube particulier.
À partir de là, nous pouvons simplement faire cela en masse, faire glisser tout ce contenu et laisser l’IA faire tout le travail difficile. Maintenant, nous avons les requêtes complètes des utilisateurs ici et les titres réussis ici, et nous pouvons facilement les copier et les coller dans ce fichier, qui est exactement ce dont nous avons besoin lorsque nous affinons notre modèle.
La colonne A contient les requêtes des utilisateurs, la colonne B contient ce que l’agent devrait répondre, et c’est ainsi que vous voulez les intituler. La première colonne doit être intitulée « user » et la colonne B « agent ». Voilà, c’est à peu près la partie difficile.
Étape 2 : Convertir et Télécharger les Données
À partir d’ici, nous devons convertir votre feuille de calcul dans ce format JSON, qui est ce qu’OpenAI souhaite. Cela peut sembler compliqué au premier abord, mais si vous connaissez quelqu’un qui sait écrire des scripts, il peut facilement créer un petit script qui transforme votre CSV dans ce format.
Si vous rejoignez mon Patreon, dans l’aide-mémoire, il y a un lien vers un logiciel qui fait cela pour vous. C’est un logiciel que j’ai construit dans Replit, et c’était en fait très facile.
Je vais prendre le fichier de données d’entraînement que nous venons de créer, le télécharger en tant que CSV, le mettre ici, et nous voulons simplement ajouter cette sortie décrivant ce que devrait être le message système. En général, que fait cette chose et vous voulez lui donner un rôle. Ne réfléchissez pas trop à cela, le message système peut être assez simple. C’est l’un des aspects, comme je l’ai dit, qui relève à la fois de l’art et de la science. Vous pouvez expérimenter pour améliorer vos messages système afin d’obtenir les meilleurs résultats que vous souhaitez.
Maintenant, nous convertissons cela en JSON, nous voyons un petit aperçu de cela et nous pouvons télécharger ce fichier.
Étape 3 : Télécharger et Exécuter le Fine-Tuning
Maintenant, nous allons sur platform.openai.com, qui est en quelque sorte le côté développeur d’OpenAI, et vous voulez aller dans fine-tuning ici. Créez un nouveau modèle fine-tune, gardez-le comme modèle de base supervisé. J’ai eu les meilleurs résultats avec GPT-4.0, l’autre avec lequel vous pourriez vouloir expérimenter est GPT-4.0 mini. Nous allons cliquer sur celui-ci.
Voici l’astuce : j’ai eu beaucoup de difficultés, il ne chargera pas ce fichier directement ici. L’astuce que j’ai apprise à la dure est que vous devez aller dans le stockage et télécharger votre fichier dans le stockage ici. Ouvrez-le et sélectionnez fine-tune, téléchargez et c’est bon.
Maintenant, nous pouvons aller dans fine-tuning ici, nous pouvons créer notre modèle fine-tune, en sélectionnant à nouveau ce GPT-4.0, et maintenant sélectionnez existant et nous aurons besoin de cet ID de fichier de ce stockage. J’oublie toujours cela, mais vous pouvez simplement cliquer dessus pour le copier dans votre modèle, c’est le fichier que nous voulons utiliser. Vous cliquez simplement sur créer, cela va commencer à s’exécuter. Je ne sais pas combien de temps cela prend, peut-être une demi-heure ou quelque chose comme ça. Le coût est vraiment de 25 cents pour quelque chose comme ça, donc vous pouvez vous permettre d’en exécuter quelques-uns et de les tester.
Tester Votre Modèle Fine-Tuné
Une fois que c’est terminé, l’étape finale consiste à le tester et à voir quels sont vos résultats. Voici un que j’ai affiné hier, et la façon de le tester la plus rapide et la plus facile est de construire un petit assistant.
Nous allons dans l’onglet Assistants, nous allons créer un nouvel assistant ici, nous allons l’appeler YT Titlebot, je vais laisser ces instructions système vides, puis vous sélectionnez le modèle que vous avez affiné. Vous devriez voir vos modèles apparaître ici, et nous sélectionnons celui-là, laissant tout cela vide, ne touchant à rien de tout cela, et cliquez sur créer.
Maintenant, nous irons dans notre playground et nous trouverons notre YT Titlebot, et c’est là que nous pouvons le tester. Je vais dire « Créer un titre YouTube sur la présentation d’applications innovantes de l’opérateur OpenAI », je vais l’exécuter… « 9 utilisations géniales de l’opérateur OpenAI ».
C’est beaucoup plus proche que si je déposais simplement cela dans ChatGPT, il me donnerait toute une longue histoire et tout ça. Vous pouvez maintenant déployer cela à peu près n’importe où. Vous pouvez utiliser Zapier pour le déployer comme un bot sur votre site Web, vous pouvez utiliser des outils comme Make ou Integromat pour intégrer ces modèles affinés dans des étapes spécifiques très facilement.
Déploiement et Applications Pratiques
C’est donc le processus : collecter vos données et en particulier construire ces prompts, c’est la partie la plus difficile. L’exécution du fine-tuning est facile, vous allez simplement suivre ces étapes, bien qu’il y ait beaucoup de pistes que vous pouvez explorer pour améliorer les résultats. Ensuite, testez-le directement dans le playground, puis déployez-le où vous le jugez approprié dans les divers outils qui sont la façon dont vous voulez interagir avec lui.
Dans l’aide-mémoire, j’ai des notes sur tout cela, j’ai comme je l’ai dit cette feuille de calcul exemple et vous pouvez simplement copier et coller ceci et mettre ce que pourraient être vos résultats finaux ici et utiliser ceci pour déconstruire ceux-ci et construire ces données d’entraînement. Vous allez devoir le brancher dans votre GPT for Sheets, mais une fois que vous avez recueilli ces données d’entraînement, vous avez mon convertisseur CSV là qui les convertit pour vous en quelque chose que vous pouvez télécharger directement dans OpenAI pour avoir une idée de comment ça marche.
Mais il y a beaucoup plus ici, entrant dans les détails de ceci, y compris d’autres cas d’utilisation réels pour cela, mais cela va en fait beaucoup plus en profondeur dans la construction de votre entreprise de fine-tuning, y compris comment trouver des clients qui pourraient avoir besoin de ce service, comment tarifer ce service, comment présenter ces clients et comment gérer ces types de projets.
Conclusion
Si vous êtes enthousiasmé par le fine-tuning et pensez que cela pourrait être une opportunité de carrière pour vous, cet aide-mémoire pourrait être quelque chose qui vous intéresse. Vous pouvez obtenir cet aide-mémoire et plus de 125 autres en rejoignant mon Patreon, il y a un lien dans la description. J’ai également quelques options de coaching là-dedans.
Donnez-vous une petite tape dans le dos pour avoir traversé cela et avoir compris comment affiner et entraîner vos propres modèles d’IA. C’est une compétence massive pour quiconque va de l’avant en cherchant à pivoter vers ce nouveau monde de l’IA. Vous voulez être créatif dans la façon dont vous appliquez cela, ce qui me fait penser à une autre vidéo que j’ai réalisée ici, qui parle de trouver des idées innovantes.
Faites de vos rêves une réalité !