OpenAI a annoncé DALL-E 3la troisième itération de son célèbre modèle texte-image.
DALL-E 3 promet des améliorations significatives par rapport à ses prédécesseurs et introduit une intégration transparente avec ChatGPT.
L'une des caractéristiques les plus remarquables de DALL-E 3 est sa capacité à mieux comprendre et interpréter les intentions des utilisateurs lorsqu'ils sont confrontés à des invites détaillées et longues :
"Une femme d'âge moyen d'origine asiatique, ses cheveux noirs striés d'argent, semblent fracturés et éclatés, finement incrustés dans une mer de porcelaine brisée. La porcelaine scintille de motifs de peinture éclaboussés dans un mélange harmonieux de bleus, de verts, de verts, de verts, de brillants et de mats. … pic.twitter.com/QryQz0BtxB
-OpenAI (@OpenAI) 20 septembre 2023
Même si un utilisateur a du mal à exprimer sa vision avec précision, ChatGPT peut intervenir pour l'aider à créer des invites complètes.
DALL-E 3 a été conçu pour exceller dans la création d'éléments avec lesquels ses prédécesseurs et d'autres générateurs d'IA ont toujours eu du mal, comme le rendu de représentations complexes de mains et l'incorporation de texte dans des images :
"Une illustration d'un cœur humain en verre translucide, debout sur un piédestal au milieu d'une mer agitée. Les rayons du soleil transpercent les nuages, illuminant le cœur, révélant un petit univers intérieur. La citation "Trouvez l'univers en vous" est gravée dans lettres en gras à travers le… pic.twitter.com/S3cKMkG67T
-OpenAI (@OpenAI) 20 septembre 2023
OpenAI a également mis en œuvre des mesures de sécurité robustes, garantissant que le système d'IA s'abstient de générer du contenu explicite ou offensant en identifiant et en ignorant certains mots-clés dans les invites.
Au-delà des avancées techniques, OpenAI a pris des mesures pour atténuer les problèmes juridiques potentiels.
Alors que la version DALL-E actuelle peut imiter les styles d'artistes vivants, le prochain DALL-E 3 a été conçu pour refuser les demandes de reproduction de leurs œuvres protégées par le droit d'auteur. Les artistes auront également la possibilité de soumettre leurs créations originales via un formulaire dédié sur le site OpenAI, leur permettant de demander la suppression si nécessaire.
Le plan de déploiement d'OpenAI pour DALL-E 3 implique une première version pour les clients ChatGPT « Plus » et « Enterprise » le mois prochain. Le générateur d'images amélioré sera ensuite disponible pour les laboratoires de recherche d'OpenAI et les clients API au cours de la prochaine saison d'automne.
Alors qu'OpenAI continue de repousser les limites de la technologie de l'IA, DALL-E 3 représente une avancée majeure dans la génération de texte en image.
(Crédit d'image : OpenAI)
Voir également: Stability AI dévoile le modèle « Stable Audio » pour la génération audio contrôlable
Vous souhaitez en savoir plus sur l’IA et le Big Data auprès des leaders du secteur ? Vérifier Salon de l'IA et du Big Data se déroulant à Amsterdam, en Californie et à Londres. L'événement complet est co-localisé avec Semaine de la transformation numérique.
Découvrez d'autres événements et webinaires technologiques d'entreprise à venir proposés par TechForge ici.
Source