OpenAI présente Sora, un générateur de texte en vidéo capable de créer des clips réalistes de 60 secondes en 1080p

OpenAI introduces Sora, a text-to-video generator that can create realistic 60-second clips in 1080p

Qu’est-ce qui vient de se passer? Alors que d’autres entreprises lancent des IA génératives texte-vidéo, il n’est pas surprenant d’apprendre que la société qui a lancé la révolution de l’intelligence artificielle générative, OpenAI, a rejoint le club. Appelé Sora, l’outil peut générer des clips 1080p de 60 secondes semblables à des films à partir d’invites de texte qui, dans de nombreux cas, semblent assez réalistes.

Sora peut générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis sur le sujet et l’arrière-plan, écrit OpenAI. L’outil est également capable de créer plusieurs plans dans une seule vidéo générée.

Comme on pouvait s’y attendre, les exemples triés sur le volet et publiés sur la page d’annonce d’OpenAI semblent plutôt convaincants. Il y a une femme marchant dans une rue de Tokyo, des images historiques de la ruée vers l’or en Californie, un Dalmatien se déplaçant entre les rebords des fenêtres, et d’autres encore.

Sora Tokyo

Sora est capable de prendre des clips vidéo existants et de les étendre ou de remplir les images manquantes, ce qui semble intéressant. Il peut également générer des vidéos dans différents styles, comme le noir et blanc et l’animation.

Voir l’article sur imgur.com

C’est impressionnant, mais vous remarquerez peut-être les signes révélateurs que les clips ont été générés par l’IA après une inspection minutieuse, comme la façon dont les pattes du chien bougent ou l’apparence et les mouvements non naturels des personnages d’arrière-plan.

Voir l’article sur imgur.com

OpenAI admet que le modèle Sora actuel peut avoir des difficultés avec certains éléments, notamment la simulation précise de la physique et la non-compréhension d’instances spécifiques de cause à effet, comme une marque de morsure laissée dans la nourriture après que quelqu’un ait pris une bouchée. Cela peut également confondre les détails spatiaux et avoir du mal à décrire avec précision les événements qui se déroulent dans le temps, comme suivre une trajectoire de caméra spécifique.

La sécurité est toujours une grande préoccupation avec ce type de technologies. OpenAI affirme travailler avec des experts dans des domaines tels que la désinformation, la haine et les préjugés pour tester le modèle Sora. La société développe également des outils, notamment un classificateur de détection, pour aider à identifier les contenus trompeurs et à déterminer quand une vidéo a été générée par Sora. OpenAI a déclaré qu’il prévoyait d’inclure les métadonnées C2PA à l’avenir s’il déployait le modèle dans un produit.

Il existe des questions de droit d’auteur et d’éthique sur les données utilisées pour entraîner Sora, comme c’est toujours le cas avec ces technologies. OpenAI n’est pas très divulgué avec ces informations, si ce n’est qu’il a utilisé environ 10 000 heures de vidéo de haute qualité.

Sora est actuellement en phase de prévisualisation de la recherche et est testé par des utilisateurs sélectionnés ; il n’est pas encore accessible au public en raison d’un risque d’utilisation abusive.

« Nous mobiliserons les décideurs politiques, les éducateurs et les artistes du monde entier pour comprendre leurs préoccupations et identifier des cas d’utilisation positifs de cette nouvelle technologie », écrit OpenAI. « Malgré des recherches et des tests approfondis, nous ne pouvons pas prédire toutes les manières bénéfiques dont les personnes utiliseront notre technologie, ni toutes les manières dont ils en abuseront. C’est pourquoi nous pensons que l’apprentissage de l’utilisation dans le monde réel est un élément essentiel de la création et de la diffusion de plus en plus des systèmes d’IA sûrs au fil du temps.

Nous avons déjà vu des générateurs de texte vers vidéo, notamment Runaway et Lumiere de Google. Il sera intéressant de voir comment un concurrent de ChatGPT/DALL-E-creator OpenAI se comporte par rapport à ces outils.

Bien qu’il ne soit pas encore disponible pour tous, le patron d’OpenAI, Sam Altman, a demandé aux utilisateurs de X de suggérer des idées qui seront transformées en vidéos à l’aide de Sora. Certains des résultats ont été inclus dans cet article.


Envie de vous détendre un peu ? Voici un reportage très intéressant sur l’intelligence artificielle :

YouTube video