Les générateurs d’images IA ont-ils assimilé votre art ? Un nouvel outil vous permet de vérifier

Les générateurs d’images IA ont-ils assimilé votre art ?  Un nouvel outil vous permet de vérifier
Agrandir / Une image du “Ai-je été formé?” site Web présentant une recherche pour l’un de ses créateurs, Holly Herndon.

En réponse à la controverse sur les modèles de synthèse d’images apprenant à partir d’images d’artistes récupérées sur Internet sans leur consentement – et potentiellement reproduisant leurs styles artistiques – un groupe d’artistes a publié un nouveau site Web qui permet à quiconque de voir si leurs œuvres ont été utilisées pour former l’IA .

Le site “Ai-je été formé ?” puise dans les données de formation LAION-5B utilisées pour former les modèles Stable Diffusion et Imagen AI de Google, entre autres. Pour construire LAION-5B, des robots dirigés par un groupe de chercheurs en intelligence artificielle ont exploré des milliards de sites Web, y compris de vastes référentiels d’œuvres d’art chez DeviantArt, ArtStation, Pinterest, Getty Images, etc. En cours de route, LAION a collecté des millions d’images d’artistes et de titulaires de droits d’auteur sans consultation, ce qui a irrité certains artistes.

Lors de la visite du site Ai-je été formé ? site Web, qui est géré par un groupe d’artistes appelé Spawning, les utilisateurs peuvent rechercher l’ensemble de données par texte (comme le nom d’un artiste) ou par une image qu’ils téléchargent. Ils verront les résultats d’image à côté des données de légende liées à chaque image. Il est similaire à un ancien outil de recherche LAION-5B créé par Romain Beaumont et à un effort récent d’Andy Baio et Simon Willison, mais avec une interface élégante et la possibilité d’effectuer une recherche d’image inversée.

Lire aussi  Il a fallu une pandémie pour essayer de réparer la qualité de l'air des écoles

Toute correspondance dans les résultats signifie que l’image aurait pu potentiellement être utilisée pour former des générateurs d’images IA et pourrait encore être utilisée pour former les modèles de synthèse d’images de demain. Les artistes IA peuvent également utiliser les résultats pour guider des invites plus précises.

Le site Web de Spawning fait partie de l’objectif du groupe d’établir des normes concernant l’obtention du consentement des artistes pour utiliser leurs images dans les futurs efforts de formation à l’IA, y compris développer des outils qui visent à permettre aux artistes de participer ou non à la formation en IA.

Une corne d’abondance de données

Un assortiment de portraits de robots générés par Stable Diffusion, chacun combinant des éléments appris de différents artistes.
Agrandir / Un assortiment de portraits de robots générés par Stable Diffusion, chacun combinant des éléments appris de différents artistes.

Comme mentionné ci-dessus, les modèles de synthèse d’images (ISM) comme Stable Diffusion apprennent à générer des images en analysant des millions d’images extraites d’Internet. Ces images sont utiles à des fins de formation car elles sont associées à des étiquettes (souvent appelées métadonnées), telles que des légendes et du texte alternatif. Le lien entre ces métadonnées et les images permet aux ISM d’apprendre les associations entre les mots (comme les noms d’artistes) et les styles d’images.

Lorsque vous tapez une invite telle que “une peinture d’un chat par Leonardo DaVinci”, l’ISM fait référence à ce qu’il sait de chaque mot de cette phrase, y compris des images de chats et des peintures de DaVinci, et comment les pixels de ces images sont généralement disposés en relation les uns avec les autres. Ensuite, il compose un résultat qui combine ces connaissances dans une nouvelle image. Si un modèle est entraîné correctement, il ne renverra jamais une copie exacte d’une image utilisée pour l’entraîner, mais certaines images peuvent être similaires en style ou en composition au matériau source.

Lire aussi  Visitez le Super Nintendo World d'Hollywood avec cette nouvelle vidéo d'aperçu

Il ne serait pas pratique de payer des humains pour écrire manuellement des descriptions de milliards d’images pour un ensemble de données d’image (bien que cela ait été tenté à une échelle beaucoup plus petite), de sorte que toutes les données d’image “gratuites” sur Internet sont une cible tentante pour l’IA. des chercheurs. Ils ne demandent pas le consentement parce que la pratique semble être légale en raison des décisions des tribunaux américains sur le grattage des données Internet. Mais un thème récurrent dans les reportages sur l’IA est que l’apprentissage en profondeur peut trouver de nouvelles façons d’utiliser les données publiques qui n’étaient pas prévues auparavant, et le faire d’une manière qui pourrait violer la vie privée, les normes sociales ou l’éthique de la communauté, même si la méthode est techniquement légale. .

Il convient de noter que les personnes utilisant des générateurs d’images AI font généralement référence à des artistes (généralement plus d’un à la fois) pour mélanger des styles artistiques dans quelque chose de nouveau et non dans le but de commettre une violation du droit d’auteur ou d’imiter de manière néfaste des artistes. Même ainsi, certains groupes comme Spawning estiment que le consentement devrait toujours faire partie de l’équation, en particulier lorsque nous nous aventurons dans ce territoire inexploré et en développement rapide.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick