
Une équipe d'informaticiens du Max Planck Institute for Informatics, du MIT, de Google et de l'Université de Pennsylvanie a développé un nouvel outil d'imagerie IA pour la manipulation 3D interactive par l'utilisateur d'images 2D représentées sur une photographie. L'équipe a publié un article décrivant le nouvel outil, appelé DragGAN, sur le arXiv serveur de préimpression ainsi que de courtes vidéos illustrant ce que l'outil peut faire.
Photoshop est sorti pour la première fois à la fin des années 1980, et depuis lors, il et des applications similaires ont été utilisés pour éditer des photographies. Une telle utilisation est devenue une partie courante des médias sociaux - les gens photoshopent des images avant de les publier en ligne afin de les "améliorer". Dans ce nouvel effort, l'équipe de recherche a porté l'édition d'images à un tout autre niveau en ajoutant l'intelligence artificielle.
À première vue, DragGAN ressemble beaucoup à n'importe quel autre outil de manipulation d'images. Mais les vidéos publiées par l'équipe créative précisent qu'elle est capable de faire des choses qu'aucune application antérieure n'a même été près de réaliser, permettant aux utilisateurs de modifier des images en 3D imaginaire, à la volée. Les chercheurs appellent les résultats "contenu occulté halluciné".
Les photographies, de par leur nature même, sont bidimensionnelles. Les outils de retouche photo précédents permettaient de flouter, de colorer ou même de corriger d'autres images. Mais toutes ces modifications sont basées sur l'effort de l'utilisateur - l'utilisateur doit diriger la correction des couleurs ou estomper les rides. Un outil de retouche photo basé sur l'IA, appris à reconnaître les caractéristiques en analysant des milliers ou des millions d'autres images, peut déduire à quoi pourraient ressembler les parties manquantes d'une image et apporter des modifications en fonction de cela, avec l'invite de l'utilisateur.
Dans une vidéo, par exemple, une photo d'une personne en colère peut être modifiée pour montrer la même personne en train de sourire, le tout d'un simple clic et glissement. Le visage de la personne peut également être tourné, révélant des parties de la tête qui n'ont jamais été capturées dans la photographie originale. De même, les voitures, les animaux ou les paysages peuvent être radicalement modifiés en quelques clics et glissements. L'ajout de l'IA à l'édition de photos ajoute une toute nouvelle dimension à la catégorie, une dimension qui pourrait faire autant de bruit que Photoshop lors de son introduction.
Plus d'information: Xingang Pan et al, Faites glisser votre GAN : Manipulation interactive basée sur des points sur le collecteur d'images génératives, arXiv (2023). DOI : 10.48550/arxiv.2305.10973
Page du projet : vcai.mpi-inf.mpg.de/projects/DragGAN/
© 2023 Réseau Science X
Citation: Un nouvel outil d'imagerie IA permet des manipulations 3D interactives d'images 2D (2023, 25 mai) récupérées le 28 mai 2023 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation loyale à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans l'autorisation écrite. Le contenu est fourni seulement pour information.
Source