Aurora, l’intelligence artificielle avec des images photoréalistes qui dérange

En décembre 2024, xAI a marqué une avancée majeure dans le domaine de l’intelligence artificielle en dévoilant Aurora, un modèle de génération d’images d’une puissance photoréaliste sans précédent.

Enregistrer pour plus tard (0)
Please login to bookmark Close

Le développement de cette IA soulève des questions éthiques en raison de l’absence de limitations de sécurité habituelles. Avec l’arrivée d’Aurora, la frontière entre les deepfakes et la réalité pourrait bien s’effacer, nous dit le Journal du Net.

Une architecture innovante : le MoE

Préférant s’écarter des sentiers battus, xAI a choisi une architecture innovante pour Aurora, s’appuyant sur une base MoE (mixture-of-experts) au lieu de la diffusion latente traditionnelle. Alors que des modèles comme Midjourney, DALL-E et Firefly exploitent la diffusion latente pour « débruiter » progressivement l’image à partir de signaux aléatoires, Aurora crée ses images de manière séquentielle, comme un modèle de langage génératif (LLM) composerait du texte, un mot après l’autre.

Ce changement de paradigme permet à Aurora de convoquer des « experts » spécialisés pour chaque aspect de l’image : un pour les visages, un autre pour les textures, etc. Cette méthode résulte d’un entrainement sur un énorme dataset mariant texte et images, une initiative soutenue par d’énormes quantités de données extraites du web, et notamment de la plateforme X – anciennement connue sous le nom de Twitter.

Compréhension des prompts et détails

Cet entraînement en profondeur confère à Aurora une compréhension affinée des prompts, surpassant ses prédécesseurs. L’approche par modèle autorégressif garantit une cohérence sans faille dans la génération des images. Par exemple, comme le démontrent les tests, si l’utilisateur commande « un chat roux avec des pattes blanches », Aurora maintient une adhésion étroite aux spécifications demandées.

Un autre avantage de l’architecture MoE réside dans sa capacité à intégrer du texte directement dans les images générées. Les inscriptions, les logos, voire des contenus textuels complexes sont produits avec une lisibilité impressionnante, un aspect où les modèles traditionnels échouent régulièrement.

Un réalisme troublant et des implications juridiques

Le réalisme offert par Aurora est incontestablement révolutionnaire. Le modèle excelle dans les compositions impliquant des personnalités ou des événements complexes, repoussant les frontières de l’usage éthique. Il est par exemple capable de simuler des rencontres fictives entre figures politiques célèbres – telles que Donald Trump, Elon Musk, et Vladimir Poutine –, ou encore des images d’archives historiques telles qu’une réunion entre Nikola Tesla et Elon Musk en 1940.

Cependant, ce potentiel photoréaliste englobe également des dangers juridiques. Aurora peut reproduire à l’identique des logos protégés, tel que le logo de Kering sur une voiture fictive. Ces capacités soulèvent des questions sur le respect des droits d’auteur.

La vigilance est requise

Bien que Aurora ouvre la voie à des possibilités créatives sans précédent, elle impose également une vigilance particulière dans son utilisation. L’absence de filtres de sécurité standards et l’incertitude de X concernant la licence d’utilisation des images générées obligent les utilisateurs à naviguer prudemment dans ce nouvel espace technologique. L’annonce imminente d’une API par xAI pourrait clarifier ces aspects juridiques délicats, crucial pour toute exploitation commerciale du modèle.

En bref

  • Avec son architecture MoE, l’approche de Aurora est unique dans le domaine de l’IA générative d’images.
  • Le modèle offre un photoréalisme sans précédent et une excellente compréhension des prompts
  • L’absence de limitations de sécurité soulève des préoccupations concernant la création de deepfakes et la manipulation d’images.
  • La capacité à reproduire des logos protégés et des images photoréalistes pose des questions de droits d’auteur et de propriété intellectuelle.
  • Une API est prévue, ce qui pourrait clarifier les aspects juridiques pour l’utilisation commerciale.

Vous appréciez nos contenus ?

Enjoy Unlimited Digital Access

Read trusted, award-winning journalism. Just $2 for 6 months.
Already a subscriber?
Partager l'article

Quel est votre avis sur le sujet ?

Commenter

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *