L’IA de NVIDIA Fait Voler les Voitures… En Quelque Sorte !

L’IA de NVIDIA Fait Voler les Voitures… En Quelque Sorte !

Imaginez prendre une simple image du monde réel et qu’une IA puisse la transformer en une scène complète où vous pouvez vous déplacer librement. Cette technologie existe désormais, et elle est encore plus impressionnante qu’on pourrait le penser. Non seulement elle comprend que l’eau doit refléter son environnement, mais elle simule même le mouvement de l’eau avec un réalisme stupéfiant.

J’ai passé des années à étudier la dynamique des fluides pour créer des simulations liquides similaires, mais maintenant, grâce à la puissance de l’IA, tout cela est disponible gratuitement. C’est véritablement révolutionnaire.

Une IA qui fait voler les voitures

Mais ce n’est pas tout ce que cette technologie peut faire. Aussi incroyable que cela puisse paraître, elle peut même apprendre à une voiture à voler. Comment est-ce possible ? Cette innovation s’appuie sur NVIDIA Cosmos, qui a été présenté pour la première fois sur la chaîne « 2minute papers ». Nous avions alors montré comment cette technologie pouvait générer de nombreuses vidéos utiles pour entraîner des voitures autonomes et toutes sortes de robots dans un environnement virtuel. Une fois que ces systèmes démontrent leur fiabilité dans le monde virtuel, ils peuvent être testés dans le monde réel.

De la vidéo à la réalité augmentée

Au lieu d’utiliser une simple image comme entrée, utilisons maintenant une vidéo. L’IA démontre immédiatement sa compréhension de la scène. Mais voici où les choses deviennent vraiment intéressantes : changeons la trajectoire de la caméra, mais pas comme vous pourriez l’imaginer.

Ce que vous voyez n’est pas une erreur. L’IA va effectivement faire voler cette voiture. Le résultat est absolument incroyable ! L’intelligence artificielle doit imaginer et prolonger ce monde, nous montrant des choses que nous n’avions jamais vues auparavant. Tout cela est créé par l’IA.

Lorsque la séquence originale se termine, la séquence imaginée par l’IA prend le relais, et la transition est parfaitement fluide. On ne peut pas simplement passer brusquement à une vidéo de mauvaise qualité. Je voudrais pouvoir voler partout avec cette technologie, c’est tellement impressionnant !

Des applications concrètes pour la conduite autonome

Cette technologie permet de prendre une seule séquence vidéo et de créer de nombreuses situations hypothétiques. Par exemple, que se passerait-il si nous changions de voie ? Vous pouvez générer toutes ces informations sans quitter votre domicile et entraîner une IA dans une simulation sécurisée jusqu’à ce qu’elle démontre qu’elle est suffisamment performante pour gérer diverses situations difficiles.

Ce serait déjà remarquable, mais cela devient encore plus impressionnant. Cette technologie ne se limite pas à la conduite autonome, elle semble capable de tout faire.

Au-delà de la conduite : des capacités étonnantes

Lorsqu’on lui donne l’image d’un selfie avec un chien, l’IA peut maintenant nous montrer ce qu’il y a derrière, et le résultat est parfaitement fluide. En tant que chercheur spécialisé dans le transport de la lumière (ou traçage de rayons), je ne peux qu’admirer les reflets ici, qui sont tout simplement sublimes.

Regardez ces caustiques – ces magnifiques motifs lumineux que l’on voit lorsque la lumière se courbe à travers ou rebondit sur des surfaces courbes comme l’eau ou le verre. Encore une fois, écrire un programme informatique qui simule cela m’a pris des années d’études, et ici, vous l’obtenez gratuitement.

L’IA comprend même la transparence et gère très bien les particules de poussière. Imaginez toutes les créations que nous pourrons réaliser avec cette technologie.

Les limites actuelles : comprendre vs générer

Cependant, dans cette scène de cerf, vous remarquerez que l’IA a fait frire les bois de l’animal, ce qui n’était probablement pas l’intention de l’artiste. Sa compréhension de la physique présente encore quelques lacunes, comme nous l’avons évoqué dans un épisode précédent.

Pourquoi ne pas simplement ajouter plus de données d’entraînement pour qu’elle comprenne enfin ? Chose intéressante, cela ne fonctionnerait pas. La raison est que ces systèmes sont entraînés pour générer des séquences, mais pas nécessairement pour les comprendre et répondre à des questions à leur sujet.

D’une certaine manière, il existe des systèmes capables de créer des vidéos absolument magnifiques, mais ils ne comprennent pas vraiment ce qu’ils font. C’est fascinant. Cette IA peut générer des parties entièrement nouvelles de villes, mais elle ne comprend pas nécessairement comment une ville devrait fonctionner, seulement à quoi elles ressemblent approximativement.

La prochaine génération de techniques d’IA aura également une compréhension appropriée de ces concepts. Quelle époque passionnante pour être en vie, et le rythme des progrès dans la recherche en IA est absolument incroyable.

L’avenir de la modélisation 3D par IA

Imaginez ce dont nous serons capables dans un avenir proche. Par exemple, rappelez-vous que cette représentation est un nuage de points. Les nuages de points peuvent maintenant être convertis en géométrie 3D d’une manière où vous pouvez même les voir naître à partir de rien.

Cette technique n’est pas encore parfaite – vous avez déjà entendu parler de certaines limitations. La résolution pourrait être un peu plus élevée (je suis sûr qu’elle le sera bientôt), et cette personne musclée semble un peu étrange.

L’article complet expliquant comment réaliser tout cela est disponible, et le code source sera également disponible gratuitement pour tous.

Une approche scientifique de l’IA

Aujourd’hui, tout le monde parle de cette nouvelle menace qu’est l’IA. Oui, on peut obtenir beaucoup de vues avec ce sujet, mais en réalité, nous n’en savons presque rien – des spéculations, puis d’autres spéculations sur les spéculations.

Ici, nous fonctionnons différemment. Nous sommes des chercheurs, nous aimons les articles scientifiques, nous envoyons de la joie et de la positivité dans le monde et montrons aux gens à quel point la recherche est incroyable.

Des outils puissants pour l’expérimentation

Vous me voyez ici exécuter le modèle complet d’IA Deep Seek via Lambda GPU Cloud – le modèle complet de 671 milliards de paramètres fonctionnant super rapidement et de manière fiable. C’est incroyable, j’adore ça et je l’utilise régulièrement.

Lambda vous fournit des GPU NVIDIA puissants pour exécuter vos propres chatbots et expériences, et c’est vraiment le meilleur. Essayez-le maintenant sur lambdalabs.com/papers ou cliquez sur le lien dans la description ci-dessous.

Conclusion

Les avancées en matière d’IA de génération d’images et de vidéos continuent de repousser les limites de ce que nous pensions possible. La capacité de NVIDIA à transformer des images statiques en scènes 3D dynamiques, où même les voitures peuvent voler, ouvre des possibilités infinies pour la simulation, l’entraînement des systèmes autonomes et la création artistique.

Bien que ces technologies présentent encore certaines limites dans leur compréhension fondamentale de la physique et du monde réel, elles représentent une étape cruciale vers des systèmes d’IA plus sophistiqués qui ne se contenteront pas de générer du contenu, mais comprendront véritablement ce qu’ils créent.

Le futur de l’IA n’est pas seulement dans sa capacité à imiter, mais à comprendre – et nous commençons tout juste à en explorer les possibilités.