Table of Contents
L’IA de vidéo générative va-t-elle révolutionner le cinéma ?
Introduction des techniques de traitement numérique dans le cinéma
La première incorporation des techniques de traitement numérique dans les films a eu lieu en 1973 avec le film « Westworld ». Ce film est considéré comme le premier à utiliser les images générées par ordinateur (CGI). Les CGI du film étaient primaires, traitant certaines images animées pour simuler la vision des robots présentés dans le film.
Une avancée majeure avec « Le Seigneur des Anneaux »
La trilogie « Le Seigneur des Anneaux », diffusée à partir de 2001, constitue une percée significative dans l’utilisation des technologies informatiques avancées au cinéma. Elle a utilisé une version sophistiquée de CGI pour créer des scènes et des personnages mémorables.
- Programme MASSIVE: Développé pour cette trilogie, ce programme générait des scènes de bataille comportant des milliers de personnages, chacun ayant des mouvements indépendants.
- Personnage de Gollum: Le développement de Gollum marque une étape importante dans les effets visuels grâce à la capture de mouvement. Andy Serkis, acteur d’origine irakienne, portait une combinaison équipée de capteurs enregistrant ses mouvements pour les transférer au personnage numérique.
Transformation des textes en images
La vraie avancée dans la « transformation de texte en image » utilisant l’intelligence artificielle et l’apprentissage automatique est survenue en 2016. Scott Reed et son équipe ont développé un modèle pouvant générer des images cohérentes à partir de descriptions textuelles détaillées.
- Modèle CNNs et RNNs: Utilise des réseaux de neurones convolutifs pour analyser les images et des réseaux de neurones récurrents combinés à une technique d’augmentation conditionnelle pour améliorer la qualité des images créées.
- Images générées: Ce modèle pouvait créer des images variées et cohérentes d’oiseaux et de fleurs à partir de descriptions, contribuant de manière pionnière à la génération de texte en image.
Cette percée a ouvert la voie au développement de systèmes avancés comme « DALL-E » de OpenAI en 2021, permettant de créer des images très précises à partir de descriptions complexes.
Vidéo générative: Une nouvelle révolution cinématographique
En février 2024, OpenAI a invité des cinéastes et des experts en technologie à expérimenter son nouveau modèle de vidéo génératif « Sora ». Ce modèle utilise la technologie de transformation de texte en vidéo.
Le directeur technologique de Microsoft, Mark Russinovich, a décrit Sora comme « impressionnant et effrayant à la fois », ajoutant qu’il pourrait marquer la fin de la réalité telle que nous la connaissons.
Des vidéos créées par Sora, comprenant des séquences telles qu’une aventure d’un astronaute de 30 ans ou un chantier rempli de travailleurs, peuvent être visualisées sur le compte de Sam Altman sur X (anciennement Twitter) ou sur YouTube.
Les premières tentatives de génération de vidéo à partir de texte par des entreprises comme Meta et Google en 2022 étaient floues et courtes. Cependant, la technologie continue de s’améliorer, et Sora est actuellement le plus avancé, permettant de créer des vidéos d’une minute avec des scènes complexes et des détails précis.
Défis juridiques et éthiques
Les entreprises comme OpenAI et Google font face à des problèmes légaux concernant l’utilisation de données provenant de sites d’actualités, vidéos, réseaux sociaux et bases de données de livres pour entraîner leurs modèles sans consentement préalable. Cela pose des questions de confidentialité et de droits d’auteur.
En réponse, ces entreprises affirment que les données utilisées sont publiques. Cependant, cela n’a pas convaincu des entités comme le New York Times, qui a intenté une action en justice contre OpenAI pour violation de ses droits d’auteur.
Un autre défi est celui du deepfake, où la création de vidéos falsifiées peut perturber les élections, les marchés financiers, et la vie personnelle des individus.
L’avenir de l’industrie du divertissement
Sam Altman a organisé des réunions avec des dirigeants de Hollywood pour les convaincre que Sora ne détruirait pas l’industrie cinématographique, malgré les craintes de perte d’emplois au profit de l’IA, qui avaient conduit à des grèves des acteurs et scénaristes.
Bien que certains studios aient accepté l’idée d’utiliser prudemment cette technologie pour gagner du temps, des figures comme le réalisateur Tyler Perry restent sceptiques. Perry a interrompu ses projets d’expansion de ses studios en raison des préoccupations liées à Sora.
Actuellement, Sora surpasse les autres programmes de création de vidéos à partir de texte, mais de nombreuses entreprises travaillent à l’amélioration de leurs technologies pour offrir des alternatives compétitives dans un avenir proche.