DALL-E 2 AI par OpenAI est une mauvaise nouvelle pour certains artistes
DALL-E 2 d’OpenAI a été un choc pour ceux qui pensaient que l’intelligence artificielle ne commencerait jamais (ou du moins pas bientôt) à pénétrer le domaine de la créativité. Mais DALL-E 2 est là pour occuper les artistes ?
Comment fonctionne DALL-E 2 ?
Le DALL-E 2 est si impressionnant qu’il semble presque magique, mais les détails généraux de la façon dont il crée des images aussi étonnantes et réalistes ne sont pas si difficiles à comprendre.
DALL-E 2 se compose de deux composants principaux. Le premier est GPT-3 , qui est sans doute l’algorithme d’apprentissage automatique en langage naturel le plus avancé à ce jour. DALL-E 2 utilise également un autre modèle OpenAI appelé CLIP (Contrastive Language-Image Pre-training).
GPT-3 et CLIP permettent à un ordinateur de comprendre et de générer un langage naturel complexe. En formant un réseau de neurones DALL-E avec des milliards d’images et leurs descriptions en langage naturel provenant (principalement) d’Internet, il apprend les relations entre les concepts.
D’une certaine manière, DALL-E est à l’opposé de la pratique courante d’apprentissage automatique où vous fournissez une image et l’IA essaie de décrire ce qu’elle voit.
Pensez à la tristement célèbre application » Not a Hot Dog » de l’ émission télévisée de la Silicon Valley . La différence ici est qu’au lieu de demander à l’IA si l’image est un hot-dog ou non, vous décrivez un hot-dog et cela crée une image de hot-dog complètement originale basée sur tout ce qu’elle a appris à leur sujet.
La deuxième partie importante de DALL-E est la façon dont il génère des images. Il utilise une technique dite de « diffusion ». En particulier, la compréhension de la description en langage humain d’une image créée est transformée en image à l’aide d’un modèle OpenAI appelé GLIDE . GLIDE prend une image composée de bruit généré de manière aléatoire, puis supprime progressivement ce bruit jusqu’à ce qu’il corresponde à l’image décrite en langage naturel. C’est un peu comme si un sculpteur commençait avec un morceau de marbre et l’écaillait jusqu’à ce qu’il ne reste plus que la statue.
Pour une description beaucoup plus technique et détaillée de DALL-E 2 sous le capot, nous recommandons sans réserve l’explication DALL-E 2 sur le blog d’apprentissage en profondeur AssemblyAI.
Pourquoi DALL-E 2 est si révolutionnaire
DALL-E 2 est loin d’être le premier logiciel d’apprentissage automatique capable de générer des images. Il y a eu de nombreux systèmes précédents, et DALL-E 2 s’appuie sur les leçons tirées de ces autres projets. Alors pourquoi cette fois-ci ressemble-t-elle à un tournant décisif?
Une raison importante est que les images créées par DALL-E et DALL-E 2 sont esthétiques. D’autres systèmes d’imagerie par IA produisent souvent des images que les gens décrivent comme dérangeantes ou comme sortant d’un rêve. C’est un peu comme l’Uncanny Valley, mais pour les beaux-arts. Le DALL-E 2 crée des images qui ont clairement un œil artistique ou un certain sens de l’esthétique derrière elles.
Ainsi, les images créées par le DALL-E 2 sont comparables aux images réalisées par des artistes ou des photographes talentueux qui ont développé leur sens esthétique toute leur vie. Il n’est pas difficile d’imaginer quelqu’un comme ça regardant les images que le DALL-E 2 peut produire en quelques secondes et ayant l’impression qu’elles sont sur le point de devenir inutiles.
Non seulement le système peut créer de belles images haute résolution en quelques secondes à partir d’indices de langage naturel, mais il peut également personnaliser et modifier ces images, ou fournir plusieurs variantes d’une image existante, même celle fournie par l’utilisateur. Cela signifie-t-il que les artistes devraient emballer leurs chevalets et leurs tablettes à dessin et » apprendre à coder » à la place ?
DALL-E 2 signifie que les artistes changeront et ne disparaîtront pas
OpenAI a fait très attention à simplement présenter sa technologie au monde. C’est raisonnable, car il y a clairement beaucoup de place pour les abus. Cependant, maintenant qu’ils ont montré que cela peut être fait, il n’y aura pas de temps avant que des chercheurs commerciaux ou indépendants en IA reproduisent ce que fait DALL-E et le rendent accessible à tous. Les grands acteurs de l’apprentissage automatique ont également leurs artistes IA très performants qui attendent leur heure, comme Google Imagen .
Puisque la boîte de Pandore ne peut pas être fermée, nous devrons accepter que le monde des beaux-arts changera irrévocablement, mais cela ne signifie pas que les artistes sont partis.
Une façon de voir les choses est que ce type de technologie permet de créer de l’art entre les mains de n’importe qui. L’accent passe désormais de la capacité technique à créer des images à la capacité de décrire et de répéter avec précision votre vision jusqu’à ce que ce que vous voyez à l’écran corresponde à ce que vous aviez en tête. En d’autres termes, davantage de personnes pourront désormais s’exprimer visuellement, tout comme davantage de personnes pourront désormais effectuer des calculs précis grâce à l’existence de calculatrices.
Certains types d’artistes peuvent ne plus avoir de modèles commerciaux viables. Si vous gagnez des commissions moyennant des frais , vous aurez du mal à rivaliser avec un programme capable de créer des centaines d’images par heure en fonction de la description d’un client et d’apporter des modifications à ces images presque instantanément. Au lieu de cela, vous pouvez utiliser ces outils pour réaliser votre propre vision, puis vendre ces images uniques en fonction de vos sentiments.
Le client a toujours raison
Il est également important de se rappeler qu’en fin de compte, ces images sont créées pour la consommation humaine. Nous, les humains, avons notre propre ensemble de valeurs qui va au-delà de la commodité et de l’excellence technique. Dans un monde où l’art généré est abondant et donc relativement bon marché et jetable, il y aura toujours un public prêt à apprécier (et à acheter) l’art créé par l’homme, simplement parce qu’il peut être relativement rare.
En d’autres termes, un logiciel comme DALL-E 2 pourrait sonner le glas des artistes qui gagnent leur vie en faisant de l’art sur une chaîne de montage, mais il est peu probable qu’il freine les perspectives des artistes qui ont quelque chose à dire et qui ont une identité visuelle unique, avec à travers lequel vous pouvez parler.
Laisser un commentaire