VEO 3 : La Vidéo IA Devient BEAUCOUP TROP RÉELLE

VEO 3 : La Vidéo IA Devient BEAUCOUP TROP RÉELLE

Pourquoi mon clavier est-il tout mouillé ? Le nouveau modèle V3 est sorti et il m’a absolument époustouflé. C’est vraiment impressionnant. Il peut ajouter de la musique, des voix, des effets sonores – tous les éléments audio que vous souhaitez intégrer à votre vidéo. Il comprend parfaitement le prompt. Vous tapez simplement ce que vous voulez voir et il se met en marche.

J’ai utilisé tous mes crédits IA avec VEO pour générer plusieurs prompts différents afin d’évaluer ses performances. Voici pratiquement tous les résultats. Je pense qu’il y en a peut-être un ou deux que j’ai laissés de côté, mais ces exemples ne sont pas triés sur le volet. Ce ne sont pas les meilleurs des meilleurs. Ce sont simplement tous les prompts que j’ai testés. Examinons-les.

Un Buggy Tout-Terrain Poursuivi par un Canard Gonflable

Le prompt : « Un buggy tout-terrain sale qui fonce à travers la boue, poursuivi par un grand canard gonflable à l’apparence effrayante. »

Voici la version 1. C’est assez menaçant. C’est un canard plutôt intimidant qui se dandine derrière ce camion. Absolument phénoménal.

Voici la version 2. Wow, il prend de la hauteur. Le mouvement du canard est tout simplement phénoménal. On peut voir qu’il s’agit d’un grand objet gonflable. Impressionnant.

Voici la version 3. Toujours très bonne. Oh, wow. Il le contourne. Phénoménal.

Et nous avons la version 4. Il rattrape le camion. Il est sur le point de… Wow, il le fait sortir de la route. Je pense que c’était la meilleure version jusqu’à présent. Tout est absolument phénoménal et même un peu effrayant. Je dois dire qu’ils ont vraiment capturé l’essence du prompt.

Test de Réflexion : Un T-Rex dans le Miroir

Je voulais voir comment il gère les réflexions. Le prompt : « Deux femmes soulèvent lentement un miroir pour que vous puissiez voir votre propre reflet. Vous êtes un T-Rex menaçant avec d’énormes dents. »

Voici la version 1. Ça a l’air très réel. Excellente réflexion. Très bien.

Voici la version 2. J’ai l’impression que la version 1 était meilleure. La réflexion était meilleure, mais sinon c’est excellent.

Voici la version 3. Elles soulèvent le miroir. C’est plutôt bon.

Et la version 4. Elles sont toutes excellentes. Je dois dire que je pense que la version 1 était la meilleure. Tout y est parfait.

Une Pieuvre Pirate Informatique

Celui-ci n’est pas parfait, mais il y a beaucoup d’éléments formidables que nous devrions tous voir. Le prompt : « Une pieuvre sort de son aquarium pour essayer de pirater un ordinateur. Quand elle entend quelqu’un arriver, elle remonte rapidement dans son aquarium. Une personne entre et demande : ‘Pourquoi mon clavier est-il tout mouillé ?’ »

Notez que c’est un prompt assez long, mais voyons ce qui a été généré.

Voici la version 1. « Pourquoi mon clavier est-il tout mouillé ? » C’est formidable. Son expression, « Pourquoi mon clavier est-il tout mouillé ? » est phénoménale.

Voici la version 2. La pieuvre s’affale sur le clavier. Wow. « Pourquoi mon clavier est-il tout mouillé ? » Les sous-titres ont besoin d’être améliorés, mais à part ça, il y a beaucoup de bonnes choses ici.

Voici la version 3. « Pourquoi mon clavier est-il tout mouillé ? » C’est excellent. Malheureusement, ici la pieuvre n’est pas vraiment dans l’aquarium.

Et voici une autre version. C’est une autre pieuvre sans tête. « Pourquoi mon clavier est-il tout mouillé ? » Je pense que c’est la meilleure réaction humaine, du moins. J’adore cette expression, comme si elle se demandait comment c’est arrivé. Et la pieuvre qui saute n’est pas géniale parce qu’il semble que nous manquions la tête, mais dans ce plan initial, cette pieuvre est parfaite.

Je ne pense pas qu’aucune des versions soit parfaite en termes de fidélité, mais je dois dire qu’il y a tellement de bonnes choses qui se passent ici que je dois lui donner des points. Ce qui est étrange, c’est que c’est littéralement mon clavier. Je suis presque sûr que c’est une souris Razer, la même que j’ai. Et ça ressemble beaucoup à mon ordinateur. Par contre, ça ne ressemble pas du tout à mon écran.

Un Gorille Contre Dix Hommes

Que diriez-vous d’un gorille qui combat 10 hommes ? Voyons comment il gère une scène de bataille chaotique.

Essayons la première version. C’est plutôt bon.

Numéro deux. Wow. Effrayant.

Voici la trois. Aïe. Celle-ci pourrait être la meilleure jusqu’à présent. Ce petit effet sonore vers la fin est un peu idiot, mais à part ça, c’est très, très bon.

Vue à la Première Personne d’un Animal en Forêt

Prompt : « Une vue à la première personne d’un animal courant à travers une forêt nocturne avec une vitesse surhumaine, émergeant finalement pour voir un village humain et des personnes fuyant terrifiées à sa vue. »

Pour celui-ci, je sais déjà qu’une seule version a bien fonctionné. Laissez-moi vous montrer celles qui n’ont pas bien fonctionné. OK, c’est correct. C’est bien. Aucune de ces versions n’a vraiment capturé ce que je demande, à savoir un animal courant à travers la forêt. Sauf la numéro un qui le fait parfaitement. Celle-là était de loin la plus proche et vraiment bonne.

Un Aigle Jouant de l’Accordéon

« Vous êtes-vous déjà demandé à quoi ressemblerait un aigle s’il jouait de l’accordéon ? Vous savez, avec ces griffes tranchantes comme des rasoirs ? Vous vous êtes aussi posé la question, j’en suis sûr. Eh bien, le voici. »

Version 1. Je veux dire, le son est bon, non ?

Voyons la numéro 2. Celle-ci, je trouve, capture vraiment la difficulté que l’aigle aurait à appuyer sur les boutons avec précision, vous savez.

Voici la 3. Celle-ci a le meilleur accordéon, mais ce sont des mains à l’apparence humaine. Et celle-ci a une main supplémentaire ici. Je ne sais pas ce qui se passe.

Un Mort-Vivant Jouant de la Guitare

« Un mort-vivant de Donjons et Dragons joue un solo de guitare au sommet d’une montagne de crânes. Un champ de fans squelettes s’agite en dessous. La lune est brillante et rouge. »

Vérifions ça. J’aime beaucoup de choses dans cette version, surtout ce petit gros plan où l’on voit vraiment l’aspect mort-vivant. Très, très bon aussi. Ce qui me stupéfie, c’est qu’il génère la musique à la volée juste pour correspondre à la description.

Voici la 3. Ouais. Oh ouais, vous êtes géniaux. Ouais, c’est un peu improvisé vers la fin, mais c’est toujours très, très bon.

Voici la 4. Ouais, je ne sais pas. Je pense que c’est entre la 1 et la 4 pour moi.

Lutteurs de Sumo en Laine

Ici, je voulais avoir deux sumos faits de laine. En disant cela, je me rends compte que j’ai écrit « yarm ». Je ne sais pas ce qu’est « yarm », mais je pense qu’il a compris que je voulais dire « yarn » (laine). Donc, ils se préparent à se battre et ils se livrent à un trash-talking ludique. J’ai écrit ce qu’ils devraient dire. Écoutez.

« Mon highlight reel t’a dans chaque image, face contre terre. Ta ceinture est la seule chose dans ce ring qui pense encore que tu peux tenir quelque chose. »

J’aime vraiment les gestes du deuxième, c’est très vivant. La version 3 n’est pas trop bonne car on ne peut pas vraiment dire que la deuxième personne parle, que celle de droite parle. La version 4 a la plus haute fidélité vocale, mais les visuels les plus perturbants. Je dois donner la palme à la version 1. Je pense que la 1 était la meilleure.

Vue à la Première Personne d’un Loup Chassant un Lapin

« Une vue à la première personne d’un loup poursuivant un lapin, sautant par-dessus des arbres tombés et des branches. Le lapin zigzague à gauche et à droite en essayant de s’échapper. Vue basse au sol pour que vous ressentiez l’immense vitesse de la poursuite. »

Voici la 1. Voici la 2. Et j’aime vraiment celle-là. Voici la 3. Je l’aime beaucoup. Et ces deux-là ne sont pas à la première personne, mais elles capturent vraiment le sentiment que je voulais. Voici la 4. Toujours pas tout à fait ce que nous cherchons, mais je dois dire que celle-ci est vraiment bonne. Elle capture vraiment cette poursuite.

Une Maison en Briques avec des Pattes Mécaniques

« Une maison en briques avec des personnes penchées aux fenêtres. Elle a six pattes mécaniques et marche dans la rue tandis que les gens regardent avec étonnement. »

Voici la 1. La 2. La 3 et la 4.

Alors, je suppose que la 1 est la meilleure. On peut vraiment voir les gens là-haut qui se balancent d’avant en arrière. Je veux dire, ça a l’air réel. Les autres semblent un peu bizarres, je dirais.

Un Chat Obèse sur un Trône

Fait intéressant, cela n’a pas été rendu la première fois que je les ai exécutés, mais maintenant j’ai les quatre versions. Au début, je n’avais que celle-ci. Donc, je vois réellement celles-ci pour la première fois.

Le prompt est : « Un chat odieusement gros est assis sur un grand trône doré. Il vous regarde alors que vous approchez et dit : ‘Je vois que tu m’as apporté des friandises.’ »

Vous savez quoi ? Je vais laisser le chat le dire. Voici la 1. « Je vois que tu m’as apporté des friandises. Je suppose que je te laisserai vivre pour l’instant. » C’est plutôt bon.

La 2. « Je vois que tu m’as apporté des friandises. Je suppose que je te laisserai vivre pour l’instant. » Formidable.

La 3. Ça ne s’est pas traduit du chat. Je veux dire, ça capture l’attitude, mais ça ne livre pas la réplique.

La 4. « Je vois que tu m’as apporté des friandises. Je suppose que je te laisserai vivre pour l’instant. » Formidable.

Je pense que la 1 remporte la mise ici.

Un Monde Anneau Depuis un Vaisseau Spatial

Et voici l’un des prompts les plus difficiles qu’aucun modèle ne parvient à réaliser. Je n’ai vu aucune bonne représentation de cela. Il s’agit d’une vue depuis la cabine d’un vaisseau spatial qui s’approche d’un immense monde anneau. Tout ce qui concerne un monde anneau n’est jamais bien rendu. Une structure gigantesque en forme d’anneau qui tourne autour du soleil. Ce mot, si vous vous demandez, est censé être « signes ». Des signes d’une civilisation peuvent être vus sur la partie intérieure du monde anneau.

Une chose que j’aime avec l’IA, c’est qu’elle comprend toujours ce que j’essaie de dire. Voici ce que je veux dire. Ce n’est pas tout à fait un monde anneau, mais c’est bon. Je veux dire, on peut voir que c’est une structure massive. On peut voir les petits détails à la surface. C’est bon.

Voici la 2. Oui. Je veux dire, il y a définitivement quelque chose de magique à ce sujet. Ce sont comme les anneaux de Saturne. Donc, ce n’est toujours pas exactement ce que nous cherchons, mais j’aime ce que ça fait.

Voici la 3. Celle-là est la plus proche. Gardez à l’esprit que je n’ai rien vu qui rende cela parfaitement, mais ce sont certainement parmi les meilleures que j’ai vues.

Et il n’a pas fait de version 4 pour une raison quelconque. Je pense que celle-ci est ma préférée.

Patinage sur Glace en Vue Subjective

« Un plan continu à la première personne nous montre en train de poursuivre une femme patinant sur glace à travers un vaste lac gelé et vitreux entouré de pics enneigés. »

C’est l’un des exemples que Google montrait avec V2, alors je voulais voir comment V3 le gérerait.

C’est plutôt bon. Celui-là est excellent. On peut vraiment entendre les patins sur la glace. C’est génial. Bon. Et voici la 4. Des sons formidables, je dois dire. Ça capture vraiment cette ambiance.

Course en Moto dans le Désert

Voici un autre exemple que V2 avait réalisé. Je voulais donc voir comment il s’en sort ici. « Un plan POV continu monté sur un casque nous montre en train de suivre une femme sur une moto de cross alors qu’elle fonce à travers des dunes de désert ondulantes. »

Voici la 1. Celle-là est un peu étrange. C’est un peu bizarre. D’accord, voici la 2. C’est plutôt bon. On peut les voir prendre un peu d’air. Très cool. Voici la 3. Oui, beaucoup de bonnes choses se passent ici. Et la 4. Oui, elles sont toutes très, très cool. Ça répond parfaitement au prompt.

Montée en Montagnes Russes

Le suivant est une vue à la première personne d’un manège de montagnes russes qui monte lentement avant de plonger rapidement dans la nuit en contrebas.

Voici la 1. C’est plutôt bon, je dois dire. Voici la 2. Très cool. La 3. J’adore comment il a capturé les étoiles. Tout cela a l’air phénoménal. J’adore. Mais ce n’est pas une chute. Si ça avait chuté juste ici, ça aurait été parfait. C’est plus comme une ligne droite plate. Oui. J’aurais aimé qu’il y ait une chute, ça aurait rendu cela parfait. Voici la 4. Celle-là est vraiment bonne. Mais encore une fois, elle se coupe juste avant la chute. Ça aurait été génial avec la chute.

Un Tigre en Neige dans une Forêt Enneigée

Et voici un tigre fait de neige marchant dans une forêt enneigée. Vraiment bon. J’adore le son de la neige. C’est tellement parfait. Voici la 2. Ici, il n’y a pas de sons, plutôt une note unique. Mais les tigres ont l’air phénoménaux. Ils ont l’air d’être faits de neige. Celui-ci, on peut dire qu’il est fait de neige. Celui-là ressemble plus à un tigre couvert de neige. D’accord, ce n’est pas tout à fait ce que je cherchais. Voici la 4. Donc, quelque chose d’étrange se passait dans ces deux-là, mais celui-ci est phénoménal. Écoutez. Écoutez simplement ça. Le craquement de la neige. Celui-ci mérite un A+ pour moi.

Conclusion : Un Modèle Très Impressionnant

J’ai épuisé tous mes crédits. Je pourrais en racheter demain et faire plus de tests. Je suis très impressionné, surtout par les sons, la musique, la parole, les intonations. Tant d’aspects sont si bons et j’ai l’impression d’avoir épuisé mes crédits trop rapidement, juste au moment où je commençais à comprendre comment bien formuler les prompts.

Je vais certainement obtenir plus de crédits et réessayer à l’avenir car ce modèle est vraiment très bon. Mais dites-moi ce que vous en pensez. Comment était le son ? Comment était la musique ? Comment étaient les graphismes ? Comment rend-il les différentes scènes ? Est-ce que cela ressemble à la prochaine génération de modèles vidéo IA ? Ou êtes-vous toujours pas impressionné ? Faites-le-moi savoir.

Si vous êtes arrivé jusqu’ici, merci beaucoup d’avoir regardé. Je m’appelle Wes Roth et je vous retrouve la prochaine fois.