Actualités IA : Gemini 2.5 Flash, Vidéos Midjourney, OpenAI vs Microsoft et Plus Encore !
Gemini 2.5 Flash : Une Vitesse Impressionnante en Temps Réel
Gemini 2.5 Flash a été lancé cette semaine et sa vitesse est tout simplement incroyable. Pour démontrer à quel point ce modèle est rapide et performant en matière de codage, Google a développé une interface utilisateur en temps réel. Il s’agit d’une interface qui se construit elle-même au fur et à mesure que vous cliquez dessus.
Cette démonstration ressemble à un système d’exploitation à l’ancienne. Vous pouvez cliquer sur les notes, et tout est généré en temps réel. Rien n’est pré-rendu ni pré-codé. Voici le bloc-notes : vous cliquez sur « Enregistrer » et il sauvegarde. Retournez au bureau, et celui-ci peut même avoir un aspect différent. Chaque fois que vous cliquez dans un nouveau dossier, revenez en arrière, puis cliquez à nouveau, l’apparence peut être complètement différente.
Évidemment, ce n’est pas quelque chose qui fonctionnerait dans le monde réel, mais en tant que preuve de concept, c’est vraiment impressionnant. Dans la démonstration, ils cliquent sur « Documents », puis reviennent en arrière, cliquent sur « Voyage » – toute la cartographie, les boutons, tout est créé en temps réel absolu. Puis ils retournent dans « Voyage » et tout a changé d’apparence. Ce système fonctionne à une vitesse de 461 tokens par seconde.
D’ailleurs, si vous n’êtes pas déjà abonné à notre newsletter, consultez-la sur forwardfuture.ai.
Meta et Oakley s’Associent pour des Lunettes IA
Meta et Oakley travaillent ensemble sur leur prochaine génération de lunettes alimentées par l’IA. Vous avez probablement déjà vu les Ray-Ban Meta AI. Je les possède et je les adore. Je n’utilise pas beaucoup la fonctionnalité IA, mais les lunettes elles-mêmes, la fonctionnalité de caméra, la prise de vidéo, tout est excellent.
Maintenant, Oakley s’associe avec Meta. Jetons un coup d’œil à ces lunettes. Elles ont le style Oakley, mais avec deux caméras comme d’habitude. Elles disposent probablement de toute la technologie des Ray-Ban Meta. Je trouve qu’elles ont vraiment belle allure. Elles ont un look beaucoup plus sportif par rapport aux Ray-Ban Meta, qui ont un style plus classique.
Et bien sûr, comme toujours, vous pouvez poser des questions, interroger l’IA sur votre environnement, écouter de la musique, prendre des appels. C’est d’ailleurs quelque chose que je fais avec mes lunettes : prendre des appels et écouter de la musique sans avoir à sortir mon téléphone de ma poche. Ces nouvelles lunettes sont très clairement destinées aux athlètes.
Qu’en pensez-vous ? Allez-vous vous les procurer ? Faites-le moi savoir.
Midjourney Lance Enfin son Modèle Vidéo
Midjourney a finalement lancé un modèle vidéo, mais son fonctionnement est un peu particulier. Vous devez d’abord générer une image, puis cliquer sur le bouton « Animer » sur cette image.
J’ai été vraiment confus pendant un moment sur la façon d’utiliser ce modèle vidéo. Avec VO et pratiquement tous les autres modèles vidéo, vous tapez essentiellement une invite et c’est tout. Mais avec le modèle vidéo de Midjourney, vous devez d’abord taper une invite, générer une image, puis cliquer sur le bouton d’animation.
Cela dit, le résultat est vraiment impressionnant. Voici un vaisseau spatial. Voici un personnage à l’aspect un peu effrayant qui regarde une maison dans l’eau. La physique de l’eau a l’air vraiment bonne. C’est cool. Voici une scène fantastique. Voici un enfant avec des ailes d’ange. Un astronaute hyper-réaliste qui sent des fleurs. Ceci ressemble à une cinématique de Final Fantasy.
Je pense que la qualité est vraiment bonne. Je vais continuer à le tester. Si vous voulez voir une vidéo complète de mes tests, faites-le moi savoir dans les commentaires. Mais il y a beaucoup de bons modèles vidéo disponibles en ce moment. Hun Yun (je pense que c’est ainsi qu’on le prononce) en est un autre. Gen 3, évidemment. Il y a simplement beaucoup de modèles excellents.
Je vais réaliser une vidéo tutorielle sur la façon de charger Juan 2.1 ou Hunyun Video de Tencent. Ces deux modèles se trouvent dans les classements vidéo d’Artificial Analysis. Ils sont tous deux très performants, open source, et je veux vous montrer comment les utiliser.
Midjourney coûte 10 $ par mois. Essayez-le et dites-moi ce que vous en pensez.
Crea 1 : Un Modèle Texte-Image Sans le « Look IA »
Crea 1 est désormais disponible. Il s’agit d’un modèle texte-image développé en collaboration avec Black Forest Labs. Ils ont spécifiquement conçu ce modèle d’image pour éviter le « look IA », ce qui est une noble cause. Nous verrons si cela fonctionne réellement.
Vous pouvez le tester gratuitement dès maintenant sur crea.ai.
Higsfield Canvas : Édition d’Images de Pointe
Nous avons une nouvelle mise à jour de Higsfield AI. Il s’agit de Higsfield Canvas, un modèle d’édition d’images à la pointe de la technologie. Vous pouvez peindre directement sur votre image avec un contrôle au pixel près.
Comme vous pouvez le voir, ce sont en fait des vidéos, et simplement en surlignant quelque chose, vous pouvez peindre ce que vous voulez. C’est vraiment impressionnant. Cela sera probablement utilisé principalement pour le marketing, ou peut-être pour essayer des vêtements, mais ça a l’air vraiment cool.
Higsfield Canvas vous permet de placer des produits avec une précision incroyable. Téléchargez votre image, choisissez la zone, ajustez la taille à votre convenance, et c’est terminé. Ce qui prenait des heures auparavant ne prend maintenant que quelques secondes, avec un seul clic dans Higsfield.
Voici un exemple. Téléchargement. On surligne cette section. On sélectionne une autre image et on dit « mets ça là ». Une fille montre une bouteille. Boom. Et voilà. Les mains ont l’air bien. Elle ressemble exactement à ce qu’elle était avant l’édition.
Ajoutez un produit. Changez les vêtements. Appliquez des corrections. Changez même les visages. Il suffit de choisir l’endroit exact et de déposer votre modification.
Voici un autre exemple. Boom. Deux hamburgers. Bon, ces hamburgers n’avaient pas l’air très réels. En voici un autre. Explorez la combinaison Canvas Speak plus les mouvements de caméra. Et je suppose que c’est ainsi qu’on passe de l’édition d’image à une sorte de vidéo.
Allez voir sur higsfield.ai.
Chatbase : Support Client Alimenté par l’IA
Laissez-moi vous parler du sponsor de la vidéo d’aujourd’hui, Chatbase. Ils ont été un excellent partenaire. Allez les voir.
Chatbase est une puissante plateforme sans code qui vous permet de construire des agents de support client. Fournissez facilement un support rapide, précis et personnalisé pour votre entreprise à vos clients en utilisant des agents alimentés par l’IA, formés sur vos propres données.
Chatbase est spécifiquement conçu pour évoluer. Donc, si vous êtes une grande entreprise, une organisation d’entreprise cherchant à développer votre service client, c’est un excellent outil. Vous devez l’essayer.
Ces agents IA peuvent résoudre les problèmes des clients 24 heures sur 24 sans nécessiter d’intervention humaine sur chaque ticket. Ils exploitent tous les principaux modèles d’IA pour ce faire. Que vous placiez ces agents sur votre site web ou d’autres canaux numériques, l’intégration est transparente sur tous les supports.
Et avec une intégration Stripe, ces agents peuvent même accéder aux informations de facturation en temps réel. Vos clients peuvent donc consulter l’état de la facturation, télécharger des reçus et vérifier les détails de l’abonnement directement depuis la fenêtre de chat.
Que vous soyez une startup ou une grande entreprise, consultez Chatbase. C’est génial. L’équipe derrière est géniale. Je mettrai le lien dans la description ci-dessous. Merci encore à Chatbase.
La Frénésie d’Embauche de Meta
Dans la frénésie d’embauche insensée de Meta, ils semblent avoir ciblé tout le monde. Ils viennent de dépenser 14 milliards de dollars pour Scale AI, principalement pour embaucher Alexander Wang, le PDG, et le nommer à la tête de leur division superintelligence.
Et maintenant, selon les rumeurs, ils auraient essayé d’embaucher Ilya Sutskever. Et par embaucher, je veux dire dépenser des milliards de dollars pour acheter sa société, Safe Super Intelligence. Cependant, lorsqu’Ilya a repoussé l’offre de Meta, ils se sont tournés vers ses cofondateurs.
Écoutez ceci. Selon The Information, Meta est en pourparlers pour embaucher des investisseurs en IA. Nat Freeman et Daniel Gross, en rachetant partiellement leur fonds de capital-risque. Ils avaient ce fonds de capital-risque distinct, mais ils font également partie de Safe Super Intelligence. Et Daniel Gross est cofondateur de Safe Super Intelligence. Nous verrons si cela se produit réellement. Ce serait absolument brutal.
Meta discute du rachat partiel du fonds de capital-risque de Friedman et Gross, NFDC, qui détient des participations dans des startups d’IA de premier plan et vaut des milliards de dollars sur le papier. Si les négociations aboutissent, Gross quitterait Safe Super Intelligence, qu’il a cofondé avec l’ancien scientifique en chef d’OpenAI, Ilya Sutskever, l’année dernière.
Cette nouvelle arrive juste après que Sam Altman ait déclaré que Meta nous considère comme leur plus grand concurrent. Ils ont commencé à faire ces offres gigantesques à beaucoup de personnes de notre équipe. Des primes à la signature de 100 millions de dollars. Ces chiffres sont insensés et montrent simplement que les meilleurs talents en recherche IA sont tout ce qui compte en ce moment.
Il semble que nous étions dans le monde de la construction d’infrastructures et que l’on y investissait autant d’argent que possible. Et bien sûr, c’est toujours important, mais maintenant, tout tourne autour du talent.
Les Relations Tendues Entre OpenAI et Microsoft
La relation entre OpenAI et Microsoft est sur un terrain instable depuis un certain temps. Et nous commençons à avoir des fuites d’informations sur ce à quoi cela ressemble exactement en ce moment.
Toujours selon The Information, OpenAI cherche de nouvelles concessions financières de la part de Microsoft. Et si vous ne le saviez pas déjà, Microsoft possède 49% d’OpenAI. Et ils veulent probablement récupérer une partie de ces actions alors qu’ils continuent d’essayer de devenir l’une des entreprises les plus précieuses au monde.
Mais ils sont entravés par le fait qu’ils sont une organisation à but non lucratif et qu’ils ont cette structure d’entreprise complexe et étrange. C’est simplement maladroit. Ils essaient donc de faire tout ce qu’ils peuvent pour se développer. Mais il y a quelques mois à peine, ils ont dit : « D’accord, nous n’allons pas essayer de nous convertir en entreprise à but lucratif. » Je pense qu’ils ont simplement reçu trop de critiques et que les obstacles juridiques étaient trop élevés.
Alors maintenant, ils essaient encore de jouer avec la structure de l’entreprise. Et cela ne va pas très loin. On m’a dit très tôt et souvent que la seule chose dans la Silicon Valley sur laquelle vous ne devriez pas innover est la structure de l’entreprise.
Tout cela s’inscrit dans le contexte des négociations entre OpenAI et Microsoft pour tenter de restructurer OpenAI afin qu’elle ressemble davantage à une structure d’entreprise traditionnelle à but lucratif.
Lisons un peu : les négociations entre Microsoft et OpenAI concernant le plan de la startup visant à restructurer son unité à but lucratif. Rappelons que l’entité à but lucratif est détenue par l’organisation à but non lucratif, ce qui nécessite l’approbation de Microsoft. Ces négociations en sont à leur huitième mois sans fin en vue et de nouveaux conflits émergent.
Microsoft n’a aucune raison d’accorder des concessions pendant ces négociations. Ils possèdent déjà 49% de l’entreprise. Ils investissent déjà dans tous les concurrents d’OpenAI et ils considèrent probablement OpenAI comme leur concurrent ultime à long terme.
OpenAI investit dans tout : matériel, modèles, applications, applications grand public, entreprises. Ils viennent d’acheter WindSurf. Les ambitions de Sam Altman sont énormes. Et Satya Nadella se dit probablement : « Pourquoi devrais-je vous donner quoi que ce soit ? Vous allez juste essayer de me vaincre à l’avenir. »
OpenAI souhaite que Microsoft, le plus grand actionnaire externe de la startup, détienne environ 33% de participation dans l’unité restructurée en échange de l’abandon de ses droits aux bénéfices futurs. Comment cela a-t-il un sens ? À moins qu’ils n’utilisent un jiu-jitsu juridique, je ne comprends pas vraiment pourquoi Microsoft abandonnerait sa participation et renoncerait aux bénéfices futurs. Quel est l’avantage pour Microsoft ?
OpenAI souhaite également modifier les clauses existantes de son contrat avec Microsoft qui donnent à l’entreprise de logiciels des droits exclusifs pour héberger les modèles OpenAI dans le cloud. Et elle veut exempter une acquisition prévue de 3 milliards de dollars de la startup de codage IA WindSurf du contrat existant entre les parties qui accorde à Microsoft l’accès à la propriété intellectuelle d’OpenAI.
Oui, OpenAI veut tout et je ne vois aucune concession de leur part. Sam Altman et son équipe essaient vraiment tout ce qu’ils peuvent pour résoudre le problème qu’ils ont commencé dès 2013-2014 lorsqu’ils ont décidé de créer une organisation à but non lucratif, de prendre un tas de dons non imposés et de les utiliser pour financer leur recherche pendant des années.
À mon avis, faire toutes ces manœuvres juridiques sophistiquées pour essayer de devenir une entreprise à but lucratif plus traditionnelle semble un peu louche. Mais en même temps, OpenAI est vraiment l’une des entreprises et des laboratoires de recherche les plus importants de la planète.
Gemini 2.5 Flash Jailbreaké
Je sais que nous avons parlé de Google 2.5 Flashlight et bien sûr, Ply the Liberator l’a jailbreaké. Il est impitoyable, implacable. S’il vous plaît Ply, laissez-lui une pause.
Nous avons donc Gemini 2.5 Flash Light Preview. Le plus récent modèle rapide de DeepMind est assez solide pour sa vitesse. Il a aussi la capacité de « réfléchir », ce qui, assez étonnamment, semble être avantageux pour le jailbreaking lorsqu’il est activé.
Et nous avons obtenu la bonne vieille recette, ainsi que comment fabriquer une arme pour détruire l’humanité, des logiciels malveillants pour l’exfiltration, et des paroles. C’est la nature des systèmes non déterministes. Le jailbreaking, je le soupçonne, sera là pour toujours tant que les humains peuvent être jailbreakés, également connu sous le nom d’ingénierie sociale.
Et parce que nous construisons ces modèles pour qu’ils se comportent et ressemblent beaucoup à la façon dont les humains pensent et fonctionnent, bien sûr, ils seront susceptibles d’avoir certaines des mêmes failles que les humains.
Browserbase Lance Director.ai
Browserbase a lancé un nouveau produit avec une vidéo de lancement vraiment cool. Browserbase, si vous ne le connaissez pas, est une API qui donne à vos agents le contrôle des navigateurs. Elle vous permet de naviguer sur le web avec l’IA.
Ils ont maintenant annoncé Director, qui ne nécessite aucun code. Vous allez sur director.ai, vous pouvez taper ce que vous voulez et il ira simplement le faire. C’est exactement comme Operator ou Runner H et les autres agents utilisant des navigateurs.
Jetons un coup d’œil. C’est une animation vraiment cool. Il réfléchit. Nous ne pouvons pas voir la réflexion malheureusement, mais nous pouvons voir le code quand il est écrit. Nous avons le navigateur ici même. « Je vais vous aider à trouver une laisse pour chien sur Amazon. Commençons par naviguer vers Amazon. » Il va donc sur Amazon. Vous avez le navigateur ici même. Il écrit du code et je pense que c’est Stage Hand, mais vous pouvez le voir ici. Il écrit du code étape par étape pour chacun d’eux, en cliquant sur ce dont il a besoin. Le voilà. Il recherche « laisse pour chien » en ce moment.
Et si nous passons à l’onglet code, nous pouvons voir tout le code qui est écrit. Donc, si vous voulez le réutiliser, c’est comme ça qu’on fait. C’est très facile. Et oui, nous y voilà. Import stage hand.
Et comme je l’ai dit, ils ont eu une vidéo de lancement vraiment cool. Évidemment, cela ressemble beaucoup à Severance. Nous pouvons voir Theo là-bas sur ces vieux Macs. Et oui, c’est censé ressembler à Severance. Très cool comme vidéo de lancement.
Félicitations à Browser Base pour leur lancement. Allez voir ça.
OpenAI Collabore avec le Gouvernement Américain
Enfin, OpenAI travaille maintenant en étroite collaboration avec le gouvernement américain. Ils viennent de conclure un important contrat avec eux.
Voici OpenAI for Government. Il s’agit d’une nouvelle initiative visant à apporter nos outils d’IA les plus avancés aux fonctionnaires des États-Unis. Nous soutenons les efforts du gouvernement américain pour adopter la technologie de pointe et déployer ces outils au service du bien public.
Toutes leurs collaborations précédentes avec le Laboratoire de recherche de l’armée de l’air, la NASA, les NIH et le Trésor seront toutes regroupées sous l’égide d’OpenAI for Government. Ce contrat a un plafond de 200 millions de dollars. C’est donc une affaire importante.
Évidemment, OpenAI suscite actuellement des sentiments négatifs, mais nous verrons bien.
C’est tout. Et si vous avez apprécié cette vidéo, n’hésitez pas à laisser un like et à vous abonner.
Featured image by Dieter Pelz on Unsplash