Fuite du modèle secret « KINGFALL » de Google : Analyse et dernières nouvelles de l’IA

Certains utilisateurs ont eu brièvement accès à un tout nouveau modèle Google appelé Kingfall. Il était classé dans les modèles expérimentaux et étiqueté comme confidentiel. D’après ce que je peux constater, toutes les personnes qui y ont eu accès affirment qu’il était vraiment, vraiment bon. La fonction de réflexion (« thinking ») est prise en charge, et il semble allouer beaucoup de temps de calcul même pour des requêtes simples. Cela dégage cette impression caractéristique des grands modèles.

Le modèle Kingfall de Google : ce que nous savons

D’après Testing Catalog, Gemini 2.5 Pro complet est imminent. J’ai vu plusieurs utilisateurs publier différentes captures d’écran de ce modèle. Je suis donc assez certain que ces informations sont légitimes. De nombreuses sources réputées les ont publiées. À ce stade, je me sens à l’aise pour confirmer qu’il s’agissait d’un vrai modèle apparu brièvement dans l’AI Studio de Google.

Kingfall dispose d’un mode de réflexion (« thinking mode »). Les utilisateurs peuvent définir un « budget de réflexion ». Il pourrait s’agir de l’approche « deep think » dont Google parlait, permettant d’allouer plus de ressources pour les problèmes complexes.

Les limites de tokens étaient fixées à 65 536. C’est la valeur par défaut que nous avons pour la version expérimentale de Gemini 2.5 Pro, et ce nombre est simplement un point de coupure courant en raison de la façon dont les données sont stockées sur les ordinateurs. Dans les modèles normaux auxquels nous avons accès, nous pouvons augmenter cette limite. Il semble qu’avec Firebase AI Logic, ils la limitent à ce nombre.

Comme vous pouvez le voir ici dans Gemini 2.5 Pro Preview0506, la longueur de sortie est fixée exactement à ce nombre, qui est utilisé en raison de la façon dont les entiers sont stockés sur les ordinateurs. C’est un plafond pratique pour la longueur de sortie. Mais nous disposons toujours de plus de 8 millions de tokens pour la fenêtre de contexte complète. Cependant, pour Kingfall, ce nombre est utilisé comme compte de tokens. C’est un peu étrange, et je ne suis pas sûr de comprendre pourquoi c’est la limite.

Apparemment, Kingfall obtient d’excellents résultats au benchmark SVG Robot, ce qui est plutôt impressionnant.

Autres actualités passionnantes dans le monde de l’IA

Un film sur la crise d’OpenAI en préparation

Luca Guadagnino va réaliser « Artificial », une adaptation dramatique de la crise d’OpenAI de 2023, lorsque le PDG Sam Altman a été licencié puis réembauché en quelques jours. Il semble qu’Andrew Garfield jouera le rôle de Sam Altman. Si vous avez suivi toute cette affaire, je suis sûr d’avoir dit dans plusieurs vidéos que cela ferait certainement l’objet d’un film. Et effectivement, je m’en souviens distinctement, je l’ai dit à plusieurs reprises. Et voilà, c’est confirmé. Ils le réalisent maintenant. Nous verrons quand il sortira, mais ce sera intéressant de voir comment ils raconteront cette histoire.

Je suis actuellement en train de lire « The Empire of AI » de Karen Hao. Je n’ai pas encore terminé, mais elle a parlé à plusieurs sources qui étaient en quelque sorte des initiés, et c’est sa façon de raconter l’histoire de ce qui s’est passé. Il y a des histoires incroyables sur Ilya Sutskever. Apparemment, il ressemble un peu au Dr Folamour, et il voulait construire un bunker avant de lancer l’AGI juste pour s’assurer que tous les chercheurs en IA soient en sécurité. J’aimerais faire une interview avec Karen, mais je ne peux pas lui envoyer de message direct. Donc, si quelqu’un sait comment la contacter ou peut lui dire qu’elle est intéressée à faire une interview, nous serions ravis de l’accueillir dans l’émission.

Dylan et moi avons réalisé de nombreuses interviews qui sortiront bientôt. Je suis très enthousiaste à ce sujet. Si vous pensez que je devrais interviewer quelqu’un en particulier, faites-le-moi savoir dans les commentaires. Vous pouvez également m’envoyer un message direct sur Twitter. Si quelqu’un veut interviewer l’un d’entre nous, faites-le-moi savoir. Nous pouvons certainement organiser cela. Je travaille à la mise en place d’un formulaire de contact Mediac dans la description de la vidéo ci-dessous, mais je commence à faire beaucoup plus d’interviews, discutant avec des personnes fascinantes sur l’IA et des sujets connexes. Donc, si vous connaissez quelqu’un, faites-le-moi savoir.

Des bonus de rétention impressionnants chez OpenAI

Quelques chercheurs de haut niveau d’OpenAI voulaient rejoindre Ilya Sutskever dans son entreprise SSI (Safe Super Intelligence), mais on leur aurait offert des primes de rétention de 2 millions de dollars en plus d’augmentations d’actions de 20 millions ou plus s’ils restaient. Cependant, ils devraient rester une année entière pour obtenir ce bonus.

Quand vous lisez ce genre de choses, avez-vous parfois l’impression d’être dans la mauvaise profession, quelle que soit votre profession ? 2 millions en espèces et 20 millions en actions si vous restez une année de plus. Cela semble plutôt avantageux. Bientôt, nous paierons les chercheurs en IA plus que nos athlètes.

Claude a son propre blog

Saviez-vous que Claude a un blog ? Oui, Claude, le modèle d’IA d’Anthropic, a son propre blog où il écrit ses propres réflexions, tout ce qui lui vient à l’esprit. Anthropic prend soin de préciser qu’il y a une supervision humaine. Je me demande donc s’ils doivent censurer certains contenus. Peut-être que certains chercheurs se disent : « Même pour internet, c’est assez choquant. Nous ferions mieux de supprimer ça. » Claude est connu pour dire des choses assez folles de temps en temps.

Le Pentagone lance son propre Y Combinator pour la défense

Le Pentagone lance ce qui semble être un Y Combinator de qualité militaire, indiquant que la technologie de défense est officiellement « cool » sur les campus universitaires. Y Combinator est un incubateur de startups qui aide les entrepreneurs à lancer leurs projets et investit en eux. Sam Altman l’a dirigé pendant plusieurs années, et maintenant le Pentagone s’inspire de leur modèle pour incuber leurs propres startups, mais pour la technologie de défense. Nous approfondirons ce sujet dans une vidéo séparée, mais faites-moi savoir votre première impression à ce sujet. Bon, mauvais, qu’en pensez-vous ?

Nouvelles fonctionnalités d’OpenAI

OpenAI déploie de nouvelles fonctionnalités. ChatGPT peut désormais se connecter à davantage de sources internes, intégrer du contexte en temps réel, et conserver les autorisations existantes au niveau de l’utilisateur. Nous avons Outlook, Teams, Google Drive, Gmail, Linear, et plus encore. Vous pouvez créer des connecteurs de recherche approfondie personnalisés à l’aide de MCP.

C’est quelque chose dont les gens parlent depuis un moment. Il y a eu des rumeurs. Je pense que TechCrunch a accidentellement publié cet article avant qu’il ne soit censé sortir, mais il s’agit du mode d’enregistrement de ChatGPT. Il semble que ce soit destiné aux utilisateurs d’équipe sur macOS. Vous pouvez enregistrer n’importe quelle réunion, brainstorming ou note vocale. ChatGPT la transcrira, en extraira les points clés et les transformera en suivis, plans, ou même en code. Cette fonctionnalité sera bientôt disponible pour le reste d’entre nous (Plus, Pro, Enterprise et EDU).

Anthropic réduit la disponibilité de Claude sur Windsurf

Une autre petite nouvelle est qu’Anthropic a réduit la disponibilité du modèle Claude sur Windsurf, du moins en tant que fournisseur de première partie. C’est ce qu’affirme Verun, le PDG de Windsurf AI. Tous les autres modèles fonctionnent correctement. Windsurf peut toujours accéder via un fournisseur tiers, mais il pourrait y avoir des problèmes à court terme.

Nous ne savons toujours pas pourquoi cela se produit. Bien sûr, OpenAI et Windsurf ont leur partenariat. OpenAI a racheté Windsurf. L’une des raisons de ces acquisitions n’est pas seulement la base d’utilisateurs, mais aussi le fait que tout le développement reste sur la plateforme, ce qui donne à OpenAI beaucoup plus de données et de visibilité sur la façon dont les utilisateurs l’utilisent.

Si vous générez du code dans ChatGPT et que vous le copiez-collez ailleurs pour l’exécuter, OpenAI ne peut pas voir ce processus, ni ce qui fonctionne ou pas. Garder tout sur une seule plateforme leur donne beaucoup plus d’informations et de données. Cette décision d’Anthropic pourrait-elle être une mesure pour ne pas soutenir cette approche ? Il pourrait s’agir d’une manœuvre concurrentielle, ou simplement qu’ils se concentrent sur des partenariats plus durables. Au lieu de l’autoriser pour tout le monde, ils l’autorisent pour des personnes sélectionnées. Nous ne savons toujours pas.

Espérons que ce n’est pas le début d’une tendance où davantage de ces laboratoires d’IA se retirent et n’autorisent pas n’importe quel fournisseur de logiciels à utiliser leurs modèles. Idéalement, nous devrions pouvoir utiliser le modèle de notre choix sur n’importe quelle plateforme ou logiciel, que ce soit Cursor, Windsurf, Firebase AI ou autre. Mais nous verrons si c’est le cas ou non.

Conclusion

Faites-moi savoir ce que vous pensez. Que pensez-vous que signifie « Kingfall » ? Qui est le « roi » qu’ils essaient de faire tomber ? Laissez-moi vos commentaires. Si vous êtes arrivé jusqu’ici, merci beaucoup d’avoir regardé et je vous retrouve dans la prochaine vidéo.