GPT-4.5 : L’IA la Plus Humaine Jamais Créée et Autres Avancées en IA

L’intelligence artificielle générative connaît actuellement une évolution fulgurante. OpenAI vient de lancer GPT-4.5, Anthropic a dévoilé Sonet 3.7, tous deux représentant l’état de l’art dans leurs domaines respectifs. Nous assistons également à l’émergence de nouveaux modèles de transcription audio, à la disponibilité du meilleur modèle vidéo, et bien d’autres innovations. Faisons le point sur toutes ces avancées et voyons comment les mettre à profit dès aujourd’hui.

GPT-4.5 : Une Révolution dans l’Intelligence Émotionnelle

Commençons par GPT-4.5, la nouvelle référence d’OpenAI. À l’heure où j’écris ces lignes (vendredi 28 février), ce modèle n’est disponible que pour les utilisateurs Pro (abonnement à 200 $). Mais rassurez-vous, d’ici une semaine, il sera accessible à tous les utilisateurs des formules Teams et Plus (abonnement à 20 $), puis aux comptes éducatifs et d’entreprise. Il ne sera probablement pas disponible sur le niveau gratuit avant longtemps, mais tous les utilisateurs payants y auront accès sous peu.

Pourquoi s’intéresser à ce modèle ? Pour la première fois depuis longtemps, je vais complètement ignorer les benchmarks techniques. Contrairement aux récents modèles qui se concentraient sur l’amélioration des performances en mathématiques et en codage, GPT-4.5 n’est pas un « modèle de raisonnement » – c’est un modèle conçu pour être plus humain.

Pour clarifier le paysage actuel des LLMs :

GPT-4.5 : Le meilleur modèle pour l’écriture et le brainstorming créatif
Sonet 3.5/3.7 : Excellent pour le codage

Grock Free : Idéal pour les données actualisées (connecté au flux Twitter)
Ofre Mini High ou Deep Seek R1 : Recommandés pour les problèmes mathématiques ou scientifiques
Deep Research d’OpenAI : Incontestablement le meilleur pour la recherche

La particularité de GPT-4.5 n’est pas d’écraser les benchmarks, mais d’offrir un QI émotionnel plus élevé, une meilleure « vibe », et une sensation plus humaine. C’est un partenaire supérieur pour le brainstorming, l’écriture et la création.

Premier Test de GPT-4.5

J’ai effectué quelques tests avec mon compte Chat GPT Pro en passant de la version 4.0 à la 4.5. Voici les résultats pour différentes requêtes :

Test 1 : Email à mon patron concernant une machine à café défectueuse

La réponse de GPT-4.5 est nettement plus humaine que celle des autres modèles. Elle montre de l’empathie, propose de l’aide pour résoudre le problème, et reste concise. En comparaison avec GPT-4.0 et Claude Sonet 3.5, GPT-4.5 offre clairement la meilleure réponse.

Test 2 : Rédaction d’un essai sur les pingouins

Le texte produit par GPT-4.5 ressemble moins à un manuel scolaire et davantage à quelque chose qu’une personne réelle écrirait. Il est plus engageant et moins ennuyeux que les alternatives.

Lorsque j’ai demandé d’écrire dans le style de Bukowski, les résultats étaient excellents : « Pingouins, ces petits bâtards en smoking glissant sur leur ventre à travers un désert gelé comme des ivrognes quittant un bar à l’heure de la fermeture. » GPT-4.0 s’en sort également bien dans ce style particulier, mais c’est le ton par défaut de GPT-4.5 qui marque la différence.

Test 3 : Génération d’idées pour des titres de vidéos YouTube

Pour une requête standard sur la génération de titres de vidéos YouTube comparant différentes plateformes d’IA, GPT-4.5 a produit des résultats immédiatement utilisables et de haute qualité. Sur ce test, GPT-4.0 s’est également amélioré par rapport aux versions précédentes, tandis que Claude était un peu trop verbeux.

En demandant des idées supplémentaires de vidéos similaires, GPT-4.5 a proposé des concepts par catégories, a identifié le public cible (que je n’avais pas mentionné), et a généré des idées qui correspondaient parfaitement à mon canal. En comparaison, GPT-4.0 n’a fourni que quelques idées utilisables, et Claude n’a pas du tout saisi l’esprit de mon canal.

En résumé, GPT-4.5 est le premier modèle qui sonne véritablement humain, avec une empathie intégrée. Bien que ces tests soient limités, ils confirment ce qu’OpenAI a annoncé : il s’agit du meilleur modèle d’écriture et de brainstorming créatif disponible actuellement.

Tarification API de GPT-4.5

Point important à noter : la tarification API de GPT-4.5 est extraordinairement élevée. Un million de tokens d’entrée coûte 75 $, contre seulement 14 cents pour Deep Seek R1. Les tokens de sortie sont encore plus chers : 150 $ par million. Ces coûts rendent l’API pratiquement inutilisable pour 99 % des cas d’usage. Heureusement, l’accès via Chat GPT reste abordable.

Sonet 3.7 : Le Roi du Codage

Anthropic a récemment lancé Sonet 3.7, un modèle de raisonnement particulièrement performant pour le codage. J’ai créé une vidéo séparée sur ce sujet, mais je souhaite apporter quelques précisions supplémentaires.

Bien que Sonet soit accessible gratuitement sur claude.ai, l’outil Claude Coder, qui permet d’utiliser Sonet pour le développement, consomme des crédits API. En l’utilisant quotidiennement pendant 30 à 60 minutes pour créer des extensions Chrome ou des tableaux de bord avec différentes applications IA, j’ai dépensé en moyenne 10 $ par jour. Ce n’est pas excessif pour une petite application, mais ce ne sont souvent que des versions moins performantes de services disponibles par abonnement pour 10 à 20 $. Claude Coder lui-même est gratuit (bien qu’il soit maintenant derrière une liste d’attente), mais les requêtes API ne le sont pas.

Monica : Extension Chrome pour les Modèles de Raisonnement

Pour les utilisateurs de Chrome, l’extension Monica permet d’utiliser divers modèles de raisonnement directement dans votre navigateur. Cette extension est l’une des plus intéressantes que j’ai vues jusqu’à présent.

Imaginez que vous consultez un article Wikipédia pour un travail de recherche. Au lieu de copier-coller le contenu dans un LLM, vous pouvez utiliser Monica pour interagir avec la page directement. Un simple clic sur « Chat with this page » et « Summary » lance une nouvelle conversation avec un résumé complet, et vous pouvez basculer entre différents modèles comme Deep Seek, Go free, Mini, etc.

L’extension propose également une bibliothèque de prompts où vous pouvez sauvegarder vos propres modèles. Par exemple, j’utilise un « density summarizer » qui crée cinq résumés de plus en plus denses, les quatrième et cinquième étant généralement les meilleurs. Vous pouvez appliquer ces prompts prédéfinis à n’importe quelle page web sans avoir à copier-coller quoi que ce soit.

Monica offre une période d’essai gratuite, mais pour utiliser toutes les fonctionnalités et obtenir plus de 40 requêtes par jour, un abonnement payant est nécessaire. C’est la première extension de navigateur que nous présentons sur cette chaîne, et elle mérite vraiment votre attention.

Chat GPT Deep Research pour Tous les Utilisateurs Payants

OpenAI déploie enfin Chat GPT Deep Research pour tous les utilisateurs payants, pas seulement ceux avec le plan Pro. Si vous avez l’abonnement Chat GPT Plus à 20 $, le plan Teams ou le plan éducatif, vous bénéficiez maintenant de 10 recherches approfondies par mois.

Je considère Deep Research comme l’une des fonctionnalités IA les plus significatives depuis GPT-4. Si vous n’avez pas encore essayé, c’est le moment idéal. J’ai créé une vidéo présentant 12 cas d’utilisation incroyables pour cet outil.

Des améliorations ont également été apportées : les utilisateurs Pro obtiennent 20 % de recherches supplémentaires par mois, les résultats incluent désormais des images directement citées des sites sources, et la compréhension des fichiers téléchargés a été améliorée.

Dans le même ordre d’idées, Perplexity propose désormais gratuitement une version simplifiée de Deep Research, et l’a également rendue disponible via son API. Il n’existe pas encore d’API Deep Research d’OpenAI, donc si vous souhaitez intégrer cette fonctionnalité dans vos automatisations, l’API Sonar de Perplexity est actuellement votre meilleure option.

VO2 : Le Meilleur Modèle Vidéo IA Enfin Disponible

VO2, le modèle vidéo IA de Google considéré comme le meilleur du marché, est enfin accessible au public. Jusqu’à présent, nous n’avions que des aperçus et quelques exemples, mais maintenant tout le monde peut l’utiliser via Freepik et Pika.art.

Nous avons effectué nos tests habituels pour comparer ce modèle aux autres solutions de pointe. VO2 excelle dans l’expression humaine et rend l’eau de manière particulièrement réaliste. C’est incontestablement le meilleur outil IA dans cette catégorie.

Si vous avez perdu le fil des différents générateurs vidéo, nous publions mensuellement un classement des outils vidéo dans une section gratuite de notre communauté. Nous faisons de même pour les outils d’image et les plateformes LLM.

Pika : Remplacement d’Objets dans les Vidéos

Pika a lancé une fonctionnalité permettant de remplacer des objets spécifiques dans une vidéo par de la vidéo générée par IA. C’est une application amusante et pratique qui ouvre de nouvelles possibilités créatives.

11 Labs : Transcription Vocale de Pointe

11 Labs a présenté un nouveau modèle de transcription parole-texte qui surpasse tous les autres modèles sur les benchmarks. Ce modèle peut transcrire la parole en texte avec une précision inégalée dans 99 langues différentes.

Cette technologie va probablement alimenter tout ce qui utilise des sous-titres, des vidéos YouTube aux films Netflix. D’ailleurs, Netflix a récemment étendu ses options de sous-titres et de doublage à de nombreuses langues supplémentaires, en partie grâce à l’IA. À terme, nous pouvons nous attendre à ce que les vidéos YouTube soient parfaitement transcrites et doublées dans toutes les langues.

J’ai également créé une vidéo avec 11 Labs cette semaine, présentant leur application mobile gratuite qui transforme du texte écrit, un lien ou un fichier PDF en fichier audio ou podcast que vous pouvez écouter. Cette application est entièrement gratuite, sans restrictions ni carte de crédit requise.

IA Jouant à Pokémon

Voici une curiosité fascinante : un agent IA propulsé par Claude qui joue à l’un des jeux Pokémon originaux sur un émulateur Game Boy. Un livestream montre l’agent en train de jouer en temps réel, avec près de 2 000 personnes regardant l’IA naviguer dans les cartes, participer à des combats et progresser dans les gymnases.

C’est une démonstration impressionnante des capacités actuelles de l’IA, quelque chose qui aurait été impossible il y a seulement un an. Si vous êtes fan de Pokémon ou simplement curieux des applications de l’IA, je vous recommande de consulter ce stream.

Signs : Apprendre la Langue des Signes avec l’IA

Pour terminer, voici Signs, une application qui vous aide à apprendre la langue des signes grâce à l’IA. Cette application interactive utilise votre caméra pour reconnaître vos mouvements et vous guider dans l’apprentissage des signes.

Lors d’un tutoriel rapide, l’application m’a enseigné comment signer « bonjour », « merci » et « qui ». La reconnaissance des doigts et des mouvements est impressionnante, et cette approche interactive rend l’apprentissage beaucoup plus engageant.

C’est un excellent exemple de la façon dont l’IA peut créer des expériences d’apprentissage interactives, et nous pouvons nous attendre à voir de plus en plus d’applications similaires à mesure que ces technologies deviennent plus accessibles.

C’est tout pour cette semaine ! J’ai hâte de vous proposer des analyses plus approfondies sur ces différents sujets. J’espère que vous avez trouvé quelque chose d’intéressant dans ce tour d’horizon des dernières innovations en IA.