Les Annonces les Plus Importantes de Google I/O 2025 : Gemini 2.5, Android XR et Bien Plus

La conférence Google I/O 2025 a dévoilé une multitude d’innovations technologiques qui repoussent les frontières de l’intelligence artificielle. De Gemini 2.5 Pro aux lunettes Android XR, en passant par la génération vidéo VO3, cet article vous présente un résumé complet des annonces les plus marquantes de cet événement.

Gemini 2.5 : L’IA la Plus Intelligente de Google

Gemini continue d’évoluer avec la présentation de sa version la plus avancée à ce jour. Gemini 2.5 Pro est désormais présenté comme « le modèle fondamental le plus performant au monde ». Cette nouvelle version excelle particulièrement dans plusieurs domaines :

Elle domine le classement populaire des compétences de codage « webdev arena »

Grâce à l’intégration de Learn LM, une famille de modèles développée avec des experts en éducation, Gemini 2.5 Pro est également le modèle leader pour l’apprentissage
Elle est numéro un sur tous les classements de LM Arena

Parallèlement, Google a annoncé Gemini Flash, décrit comme « notre modèle de base le plus efficace ». Particulièrement apprécié des développeurs pour sa rapidité et son faible coût, le nouveau Flash s’améliore dans presque toutes les dimensions :

Meilleures performances en raisonnement, code et contexte long
Il se classe juste derrière 2.5 Pro sur le classement LM Arena

La disponibilité générale de Gemini Flash est prévue pour début juin, suivie peu après par la version Pro.

Nouvelles Fonctionnalités Audio et Contrôle des Coûts

Google a également introduit de nouvelles fonctionnalités pour Gemini :

Texte vers parole avec support multi-locuteurs pour deux voix, basé sur une sortie audio native
Capacité de conversation plus expressive, captant les nuances subtiles de la parole

Possibilité de chuchoter et de passer facilement d’une langue à l’autre (disponible dans plus de 24 langues)
Thinking Budgets pour Gemini 2.5 Pro, permettant de contrôler le nombre de tokens utilisés par le modèle pour réfléchir avant de répondre

Project Mariner : L’Agent qui Interagit avec le Web

Project Mariner est un agent de recherche capable d’interagir avec le web et d’accomplir des tâches. Google considère les agents comme des systèmes combinant l’intelligence des modèles d’IA avancés avec l’accès à des outils.

Les nouvelles fonctionnalités de Project Mariner incluent :

Multitâche : capacité de superviser jusqu’à 10 tâches simultanées
Teach and Repeat : possibilité de montrer une tâche une fois pour que l’agent apprenne un plan pour des tâches similaires à l’avenir

Les capacités d’utilisation d’ordinateur de Project Mariner seront disponibles pour les développeurs via l’API Gemini, avec une disponibilité plus large prévue pour cet été.

Google a également annoncé la compatibilité du SDK Gemini avec les outils MCP (Model Context Protocol) et son agent de codage asynchrone Jules, désormais en bêta publique. Jules peut s’occuper de tâches complexes dans de grandes bases de code, planifier les étapes, modifier des fichiers et plus encore en quelques minutes.

Gemini Diffusion : Une Nouvelle Approche pour le Texte

Après avoir révolutionné la génération d’images et de vidéos avec les techniques de diffusion, Google applique maintenant cette approche au texte avec Gemini Diffusion.

Ce modèle expérimental de diffusion de texte à la pointe de la technologie utilise la génération parallèle pour atteindre une latence extrêmement faible :

Génération cinq fois plus rapide que Gemini 2.0 Flashlight, tout en égalant ses performances de codage
Excellence dans les tâches d’édition, notamment dans les contextes mathématiques et de code

Capacité à itérer sur une solution très rapidement et à corriger les erreurs pendant le processus de génération

Gemini 2.5 Pro Deep Think : Repousser les Limites du Raisonnement

Google a introduit Deep Think, un nouveau mode pour Gemini 2.5 Pro qui pousse les performances du modèle à leurs limites :

Utilise les dernières recherches de pointe en matière de réflexion et de raisonnement, y compris des techniques parallèles

Obtient un score impressionnant sur USAMO 2025, l’un des benchmarks mathématiques les plus difficiles actuellement
Leader sur Live Codebench, un benchmark difficile pour le codage de niveau compétition
Excelle également sur le benchmark MMU, mesurant les capacités multimodales

Ce mode sera d’abord disponible pour des testeurs de confiance via l’API Gemini avant d’être largement déployé.

L’IA au Service de la Science et de la Découverte

Google DeepMind continue d’appliquer l’IA à presque toutes les branches de la science, avec des percées majeures au cours de la dernière année :

Alpha Proof : capable de résoudre des problèmes d’olympiades mathématiques au niveau médaille d’argent

Co-Scientist : collabore avec les chercheurs pour développer et tester de nouvelles hypothèses
Alpha Evolve : découvre de nouvelles connaissances scientifiques et accélère l’entraînement de l’IA
Amy : système de recherche pouvant aider les cliniciens dans le diagnostic médical

AlphaFold 3 : prédit la structure et les interactions de toutes les molécules du vivant
Isomorphic Labs : s’appuie sur AlphaFold pour révolutionner le processus de découverte de médicaments

AlphaFold a déjà un impact considérable dans la communauté scientifique, avec plus de 2,5 millions de chercheurs dans le monde l’utilisant dans leurs travaux.

Recherche Google : Un Nouveau Mode IA

Google a présenté un mode IA entièrement repensé pour la recherche. Cette nouvelle expérience permet :

De poser des requêtes plus longues et plus complexes (2 à 3 fois la longueur des recherches traditionnelles)
De poursuivre avec des questions de suivi

Ce mode IA est disponible dès maintenant pour tous les utilisateurs aux États-Unis.

En complément, la fonctionnalité Deep Research permet désormais de télécharger vos propres fichiers pour guider l’agent de recherche, et bientôt d’effectuer des recherches dans Google Drive et Gmail.

Canvas : L’Espace Interactif de Co-Création

Canvas est l’espace interactif de Gemini pour la co-création. Il permet désormais de transformer un rapport en divers formats avec une seule touche :

Page web dynamique
Infographie
Quiz

Podcast personnalisé

Cette fonctionnalité est disponible dans 45 langues et permet également de créer des applications comme des simulations interactives, simplement en décrivant ce que vous souhaitez construire.

Imagine 4 et VO3 : Révolution dans la Génération d’Images et de Vidéos

Google a annoncé Imagine 4, son modèle de génération d’images le plus avancé, désormais intégré dans l’application Gemini. Les images sont plus riches, avec des couleurs plus nuancées et des détails plus fins, ainsi qu’une meilleure gestion du texte et de la typographie.

Mais la véritable révolution vient de VO3, le nouveau modèle de génération vidéo de pointe :

Qualité visuelle améliorée
Meilleure compréhension de la physique

Génération audio native : effets sonores, sons d’ambiance et dialogues

Les personnages peuvent désormais parler dans les vidéos générées, avec un réalisme incroyable tant au niveau visuel qu’audio.

Parallèlement, LIA 2 peut générer de la musique et de l’audio de qualité professionnelle, avec des mélodies et des voix expressives.

Flow : Un Nouvel Outil de Création Cinématographique

Google a lancé Flow, un nouvel outil de création cinématographique alimenté par l’IA qui combine le meilleur de VO, Imagine et Gemini :

Importation d’images personnelles ou génération à la volée avec Imagine
Assemblage de clips avec une simple description, y compris des contrôles précis de caméra

Création séquentielle de scènes avec une cohérence des personnages et des décors
Possibilité d’ajuster, d’étendre ou de raccourcir les clips selon les besoins
Exportation des fichiers pour une édition dans un logiciel de montage

Nouveaux Plans d’Abonnement Google AI

Google a annoncé deux plans d’abonnement IA :

Google AI Pro : disponible mondialement, offre une suite complète de produits IA avec des limites de taux plus élevées et des fonctionnalités spéciales par rapport à la version gratuite

Google AI Ultra : pour les pionniers qui veulent l’IA de pointe de Google, avec les limites de taux les plus élevées et l’accès le plus précoce aux nouvelles fonctionnalités et produits. Disponible aux États-Unis dès maintenant, avec un déploiement mondial prévu prochainement.

Le plan Ultra inclut :
– Accès au mode Gemini 2.5 Pro Deep Think
– Accès à Flow avec VO3
– YouTube Premium
– Un espace de stockage considérable

Android et Android XR : L’IA au Cœur de l’Écosystème

Android continue d’évoluer comme la plateforme où l’on découvre l’avenir en premier. Les avancées de Gemini seront bientôt disponibles sur Android, et pas seulement sur les smartphones :

Accès à Gemini depuis le bouton d’alimentation
Extension à la montre, au tableau de bord de la voiture et même à la télévision

Mais Google va plus loin avec Android XR, la première plateforme Android construite à l’ère de Gemini. Elle prend en charge un large éventail d’appareils pour différents cas d’utilisation, des casques aux lunettes :

Pour regarder des films, jouer à des jeux ou travailler, un casque immersif sera préférable
Pour les déplacements, des lunettes légères pourront fournir des informations opportunes sans avoir à sortir son téléphone

Project Muhan et Lunettes Android XR

Project Muhan de Samsung est le premier appareil Android XR. Il offre un écran infini pour explorer vos applications avec Gemini à vos côtés :

Téléportation n’importe où dans le monde en demandant simplement à Gemini de vous y emmener
Discussion avec votre assistant IA sur tout ce que vous voyez

Expériences immersives comme assister à un match sportif comme si vous étiez dans le stade

Project Muhan sera disponible à l’achat plus tard cette année.

Parallèlement, Google a présenté des lunettes Android XR, légères et conçues pour être portées toute la journée :

Caméra et microphones donnant à Gemini la capacité de voir et d’entendre le monde
Haut-parleurs permettant d’écouter l’IA, de jouer de la musique ou de prendre des appels
Affichage optionnel dans les verres montrant discrètement des informations utiles

Fonctionnement avec le téléphone, donnant accès aux applications tout en gardant les mains libres

Google a annoncé des partenariats avec Gentle Monster et Warby Parker pour construire des lunettes avec Android XR, avec des prototypes déjà utilisés par des testeurs de confiance.

Google Beam : La Communication Vidéo Immersive

Google a présenté Google Beam, une nouvelle plateforme de communication vidéo basée sur l’IA, évolution de Project Starline :

Utilisation d’un modèle vidéo de pointe pour transformer les flux vidéo 2D en une expérience 3D réaliste
Capture par un ensemble de six caméras sous différents angles
Fusion des flux vidéo et rendu sur un écran à champ lumineux 3D avec suivi de tête quasi parfait

Expérience conversationnelle naturelle et profondément immersive

En collaboration avec HP, les premiers appareils Google Beam seront disponibles pour les premiers clients plus tard cette année.

L’IA au Service de la Société

Google a présenté plusieurs exemples d’applications de l’IA pour résoudre des problèmes sociétaux :

Firesat : une constellation de satellites utilisant l’imagerie multispectrale et l’IA pour fournir des informations en temps quasi réel sur les incendies de forêt. Elle peut détecter des incendies aussi petits que 25 m² (la taille d’un garage pour une voiture), avec une fréquence de mise à jour prévue toutes les 20 minutes.
Wing : en partenariat avec Walmart et la Croix-Rouge, a fourni des efforts de secours avec des livraisons par drone pendant l’ouragan Helen, livrant des articles essentiels comme de la nourriture et des médicaments.

Ces exemples montrent comment l’IA aide la société dès maintenant, avec des perspectives encore plus prometteuses pour les prochaines années : robots utiles de nouvelle génération, traitements pour les maladies les plus mortelles, ordinateurs quantiques à correction d’erreurs, ou véhicules entièrement autonomes.

Conclusion : Un Avenir Plein de Promesses

La conférence Google I/O 2025 a démontré que l’IA continue d’évoluer à un rythme impressionnant, avec des applications qui transforment notre façon de vivre, de travailler et d’interagir avec la technologie. Les innovations présentées ne sont pas des perspectives lointaines, mais des réalités qui se concrétiseront dans les prochaines années.

Comme l’a souligné un dirigeant de Google en partageant une expérience personnelle avec Waymo, ces avancées technologiques ont le pouvoir d’inspirer, d’émerveiller et de nous faire avancer. L’avenir de l’IA s’annonce prometteur, avec un potentiel immense pour améliorer nos vies de façons que nous commençons à peine à imaginer.