Table of Contents
Le Professeur Björn Ommer, reconnu dans le domaine de la technologie, a récemment été honoré avec le Prix Allemand de l’IA à Berlin pour ses contributions significatives à l’intelligence artificielle. Cet expert, originaire de Rhénanie, est à la tête d’une équipe qui a marqué le début d’une nouvelle ère dans la course mondiale à l’intelligence artificielle générative.
Parcours académique et professionnel
Né en 1979, Björn Ommer a étudié l’informatique et la physique à l’Université de Bonn. En 2007, il a obtenu son doctorat en informatique à l’ETH Zurich, où sa thèse a été récompensée par la médaille de l’ETH. Après son passage à Zurich, il a travaillé à l’Université de Berkeley, en Californie, dans le domaine de la vision par ordinateur. En 2009, il a été nommé professeur d’informatique à l’Institut HCI de Heidelberg, dirigeant notamment le Centre Interdisciplinaire pour le Calcul Scientifique (IWR). Depuis 2021, il enseigne à l’Université de Munich.
Vision sur la démocratie de l’IA
Lors d’une interview, Ommer a exprimé sa volonté de démocratiser l’intelligence artificielle générative, qu’il considère comme une technologie d’émancipation comparable aux réseaux électriques ou aux ordinateurs. Il a souligné que la tendance actuelle à développer des modèles toujours plus grands rend la technologie inaccessible à de nombreux acteurs.
Il a déclaré : « Nous souhaitons rendre l’IA plus performante et suffisamment compacte pour qu’elle puisse fonctionner sur des téléphones mobiles, permettant ainsi à tout le monde d’y accéder. » Cette approche vise à réduire les coûts de développement et à éviter la concentration de pouvoir entre quelques grandes entreprises.
Différences entre l’IA générative et l’IA traditionnelle
Selon Ommer, l’IA traditionnelle apprend en se basant sur des exemples étiquetés, tandis que l’IA générative fonctionne différemment. Elle apprend en observant des textes ou des images sans indications explicites et découvre des relations et des patterns de manière autonome. Cela lui permet de comprendre des concepts plus complexes, tels que les ombres et les reflets.
Applications de l’intelligence artificielle générative
Initialement développée comme un générateur d’images, la technologie Stable Diffusion a ouvert la voie à de nombreuses autres applications. Par exemple, elle permet de créer des spectrogrammes pour la musique, qui peuvent ensuite être transformés en audio. De plus, des start-ups utilisent cette technologie pour améliorer les procédés de recherche d’objets dans l’industrie, remplaçant les descriptions textuelles par une reconnaissance visuelle.
Innovation et accessibilité
Ommer a expliqué comment ils ont réussi à réduire la taille des modèles d’IA. Au lieu d’analyser chaque pixel, ils ont introduit un langage de description qui permet au modèle de fonctionner à un niveau d’abstraction plus élevé, facilitant ainsi son intégration dans des appareils moins puissants.
Perspectives d’avenir
En regardant vers l’avenir, Ommer a mentionné que l’équipe continue de travailler sur des améliorations pour permettre aux ordinateurs de mieux « voir ». Il estime également que le potentiel de l’IA générative dans la création d’images et de vidéos est immense, mais que des défis importants restent à relever.
Enfin, concernant l’utilisation de l’IA pour des vidéos, il a souligné que, bien que des avancées aient été réalisées, produire des vidéos de qualité reste complexe et nécessite encore des recherches approfondies.