Comment écrire une astuce de diffusion stable impressionnante

Comment écrire une astuce de diffusion stable impressionnante

Stable Diffusion, un générateur d’art populaire basé sur l’intelligence artificielle, nécessite des invites de texte pour générer une image. Parfois, il fait un travail incroyable et génère exactement ce que vous voulez avec un vague indice. D’autres fois, vous obtenez des résultats sous-optimaux. Voici quelques trucs et astuces pour des résultats parfaits.

Comment écrire un indice de diffusion stable

Si vous avez déjà travaillé avec des générateurs d’images AI comme Stable Diffusion, DALL-E ou MidJourney, vous remarquerez qu’une info-bulle bien articulée est essentielle. Une astuce bien formulée est la différence entre transformer votre idée en une superbe image et obtenir un monstre de la vallée étrange avec trop de doigts pointés vers vous.

Depuis le lancement de Stable Diffusion en août 2022, les gens essaient de trouver les meilleurs moyens d’obtenir des résultats parfaits, et feront du « fast smithing » ou du « fast design » dans les années à venir. Cela est particulièrement probable parce que les points d’arrêt qui indiquent comment Stable Diffusion génère des images seront mis à jour périodiquement. L’indice parfait sera une cible mouvante dans un avenir prévisible.

Soyez aussi spécifique que possible

La diffusion stable a tendance à prospérer sur certains indices, en particulier par rapport à quelque chose comme MidJourney. Vous devez lui dire exactement ce que vous voulez. Voici un exemple d’utilisation d’animaux préférés sur Internet : Chats mignons.

Un panel de 6 images de sortie de Stable Diffusion utilisant l'indice "Cute Kitty".
Indice : « Cute cat », Sampler = PLMS, CFG = 7, Sample steps = 50

D’accord, ils sont plutôt mignons, sauf peut-être le pauvre gars du milieu supérieur, qui a l’air d’avoir passé trop de temps à contempler l’abîme. Mais que se passe-t-il si vous voulez des chats gris et non un croisement entre chats ? Eh bien, il faut le préciser. Au lieu de cela, utilisez « Cute Grey Cats » comme indice.

Un panel de 6 images de sortie de Stable Diffusion utilisant l'indice "Cute Grey Cat".
Indice : « Chat gris mignon », Sampler = PLMS, CFG = 7, Sampler steps = 50

La diffusion stable renvoie désormais tous les chats gris. Vous pouvez continuer à ajouter des descriptions de ce que vous voulez, y compris les accessoires pour chats dans les images.

Un autre panel de 6 images de sortie de Stable Diffusion utilisant l'invite "Joli chat gris aux yeux bleus, portant un nœud papillon".
Indice : « Chat gris mignon aux yeux bleus, portant un nœud papillon », échantillonneur = PLMS, CFG = 7, étapes d’échantillonnage = 50

Cela s’applique à tout ce que vous souhaitez créer avec Stable Diffusion, y compris les paysages. Soyez descriptif, et lorsque vous essayez différentes combinaisons de mots-clés, notez mentalement comment l’image change. Certains mots et expressions ont tendance à déformer l’image plus que d’autres mots, vous devrez donc peut-être ajuster l’info-bulle en conséquence.

Nommer des styles artistiques ou des médias spécifiques

Le besoin de spécificité ne s’arrête pas lorsque vous décrivez complètement le contenu de l’image que vous souhaitez. Vous pouvez (et devriez) également spécifier le style souhaité. Nous nous en tiendrons à notre indice « Chat gris mignon ». Disons que nous voulons de jolis chats gris, mais nous voulons aussi qu’ils aient l’air d’être peints à l’acrylique. La première chose que vous devriez essayer est d’ajouter « peinture acrylique » comme mot-clé suivant dans l’invitation afin que cela ressemble à « Peinture acrylique chat gris mignon ».

En règle générale, il est préférable de commencer avec le moins de mots-clés pour se rapprocher de ce que vous voulez, puis d’en ajouter d’autres pour obtenir l’esthétique que vous recherchez.

6 chats gris de Stable Diffusion qui ressemblent à des peintures acryliques.
Indice : « Peinture acrylique chat gris mignon », échantillonneur = PLMS, CFG = 7, étapes d’échantillonnage = 50

Stable Diffusion reconnaît des dizaines de styles différents , des dessins au crayon aux modèles d’argile et aux rendus 3D dans Unreal Engine.

Un autre exemple de chats gris dans le style de "Unreal Engine".
Indice : « Chat gris mignon, rendu Unreal Engine », sampler=PLMS, CFG=7, sample steps=50

Ces exemples de suggestions sont extrêmement simples, mais vous pouvez utiliser des dizaines de mots-clés pour affiner vos résultats. Si vous voulez des modèles farfelus de poulet en argile de couleur psychédélique chez Walmart, vous devez remplir tous ces termes.

Une étrange sculpture de poulet en argile fondue dans un magasin Walmart.
Indice : « buste de poulet en magasin, modèle en argile, (couleurs psychédéliques), fondant, bizarre » Sampler = PLMS, CFG = 7, Sampling steps = 150

Nommer des artistes spécifiques pour une distribution stable

Stable Diffusion n’est pas seulement capable d’émuler certains styles ou environnements ; il peut même imiter des interprètes spécifiques si vous le souhaitez. Cet exemple a été utilisé par Pablo Picasso.

Vous devriez certainement essayer d’ajouter « de (nom de l’artiste) » à vos infobulles si vous ne l’avez pas déjà fait. Cela a tendance à conduire à des résultats spectaculaires. N’ayez pas peur de jumeler des artistes qui ne s’entendent généralement pas bien les uns avec les autres. Souvent, Stable Diffusion combine des styles pertinents de manière passionnante et imprévisible.

Astuce : Si vous utilisez notre version Windows recommandée de Stable Diffusion, il y a un bouton Déplacer à droite de la fenêtre d’indice qui déposera au hasard un artiste sur votre indice. C’est un excellent moyen de découvrir de nouveaux styles.

6 chats comme Picasso les aurait peints.

Le poids de vos mots clés

Bien sûr, le simple fait de fourrer des mots-clés dans une invitation ne vous mènera pas très loin. Que se passe-t-il si vous obtenez toutes les bonnes choses dans l’info-bulle, mais qu’elles ne sont pas correctement proportionnées ?

Stable Diffusion prend en charge la pondération des mots-clés d’invitation. En d’autres termes, vous pouvez lui dire qu’il a vraiment besoin de faire attention à un certain mot-clé (ou mots-clés) et de faire moins attention aux autres. C’est pratique si vous obtenez des résultats similaires à ce que vous recherchez, mais pas tout à fait là.

Dans la version en ligne de commande de Stable Diffusion, vous ajoutez simplement deux points suivis d’un nombre décimal au mot que vous souhaitez mettre en surbrillance. Les nombres décimaux représentent des pourcentages, ils doivent donc totaliser 1.

Pour en revenir à notre conseil « Cute Grey Cat », supposons qu’il a rendu correctement les chats mignons, mais peu d’images de sortie avaient des chats gris. Au lieu de cela, vous pouvez changer l’info-bulle en « mignon, chat gris : 0,7 » et il accordera plus d’attention au chat gris, puis appliquera automatiquement la différence à « mignon ». Vous pouvez également attribuer manuellement un poids à chaque mot dans l’info-bulle si vous souhaitez un contrôle plus précis, comme « Cute : 0,10, Grey Cat : 0,60, Unreal Engine Rendering : 0,30 ».

La plupart des interfaces graphiques disponibles pour une pondération de gestion de diffusion stable sans vous obliger à saisir des valeurs de pourcentage explicites. Vous pouvez généralement ajouter des parenthèses autour d’un terme dans une invite pour le souligner, et des parenthèses pour réduire l’importance du terme. Ainsi, le « chat gris mignon » précédent pourrait être « [mignon],((chat gris) ».

Noter. Vous pouvez utiliser plusieurs parenthèses pour définir les accents comme vous le souhaitez.

Trouvez l’inspiration ailleurs

La diffusion stable et d’autres générateurs d’art d’intelligence artificielle ont connu une popularité explosive. Vous pouvez trouver ce genre d’art de l’IA partout. Cela signifie qu’il y a au moins quelques millions d’images générées par les utilisateurs qui circulent actuellement sur Internet, et dans la plupart des cas, les gens incluent l’indice qu’ils ont utilisé pour obtenir leurs résultats.

Voici quelques ressources pour vous inspirer si vous n’êtes pas sûr de ce que vous voulez créer :

Avertissement : Tout cela est potentiellement NSFW.

  • Lexica est un référentiel d’images générées avec Stable Diffusion et l’infobulle associée. Recherche par mot-clé disponible.
  • Stable Diffusion Artist Style Studies – Une liste non exhaustive d’artistes que Stable Diffusion peut reconnaître, ainsi que des descriptions générales de leur style artistique. Il existe un système de classement qui décrit dans quelle mesure Stable Diffusion répond au nom d’un artiste dans une info-bulle.
  • Stable Diffusion Modifier Studies – Une liste de modificateurs qui peuvent être utilisés avec Stable Diffusion, tout comme sur la page de l’artiste.
  • Liste des modificateurs d’art AI – Une galerie de photos présentant certains des modificateurs les plus puissants que vous pouvez utiliser dans vos info-bulles et ce qu’ils font. Ils sont triés par type de modificateur.
  • Top 500 des artistes présentés dans Stable Diffusion . Nous savons exactement quelles images ont été incluses dans l’ensemble de formation Stable Diffusion, nous pouvons donc dire quels artistes ont le plus contribué à la formation AI. D’une manière générale, plus un artiste était représenté dans les données d’apprentissage, mieux Stable Diffusion répondrait à son nom en tant que mot-clé.
  • Stable Diffusion Subreddit – Le subreddit Stable Diffusion a un flux constant de nouveaux indices et de découvertes amusantes. Si vous êtes à la recherche d’inspiration ou de compréhension, vous ne pouvez pas vous tromper.

Ajuster d’autres paramètres importants

Un bon conseil est la partie la plus difficile de l’utilisation de Stable Diffusion, mais il y a quelques autres ajustements qui changeront radicalement les résultats.

  • CFG : détermine dans quelle mesure Stable Diffusion suit votre indice. Des nombres plus élevés entraînent plus de suivi de cue, tandis que des nombres plus faibles donnent plus de liberté à l’IA. Essayez d’abord de le configurer.
  • Méthode d’échantillonnage : comment une image est débruitée en formes reconnaissables. Essayez-en quelques-uns. Euler_a, k_LMS et PLMS semblent être populaires.
  • Étapes d’échantillonnage : le nombre de fois qu’une image sera sélectionnée avant d’obtenir le résultat final. Parfois, vous obtenez de bons résultats à 30 étapes, parfois vous devez passer à 50 ou 80. Habituellement, vous n’obtenez pas de meilleurs résultats après 150 étapes. Commencez par moins d’étapes et progressez progressivement.

Certains de nos conseils stylisés préférés

Ce sont quelques-uns de nos conseils préférés car ils ont tendance à fonctionner de manière très fiable. Ajoutez simplement un élément de votre choix plus quelques modificateurs. Tous les autres paramètres de diffusion stables restent les mêmes que dans les conseils ci-dessus.

Remarque : la diffusion stable est généralement exceptionnellement efficace pour créer des couchers de soleil et des feuilles d’automne.

(Sujet), 35 mm, pointu

Choisissez un thème et cet indice renverra de manière fiable des images photoréalistes de personnes, d’animaux et de paysages.

Noter. Cet exemple d’astuce incluait également Golden Hour pour obtenir les couleurs du coucher du soleil.

Vue de Stable Diffusion sur le mont Katahdin vu du lac.
Indice : photo du mont Katahdin avec un beau lac, 35 mm, pointu, heure d’or

(Thème), rendu 3D low poly, couleurs pastel éclatantes, tilt shift, grain de film

Tapez un thème et vous l’obtiendrez dans l’esthétique Art of Rally.

Une voiture très colorée.

(Thème), (Description environnementale), Cinématique, Dramatique, Composition, Ciel ensoleillé, Brutalisme, Hyper réalisme, Échelle épique, Admiration, Hyper maximalisme, Niveau de détail insensé, artstation HQ

Entrez simplement un thème et une description de l’environnement, et cette info-bulle fournira de superbes images d’art conceptuel de la ville avec l’effet d’environnement de votre choix. Voici un exemple d’utilisation de New York City comme thème et d’une tempête de poussière comme description de l’environnement :

Temps modérément mauvais à New York.
indice : new york, tempête de poussière, cinématographique, dramatique, composition, ciel ensoleillé, brutaliste, hyperréalisme, échelle épique, admiration, hypermaximalisme, niveau de détail insensé, artstation HQ

Kermit

Stable Diffusion donne d’excellents résultats avec Kermit. Essayez-le n’importe où.

Kermit avec une poupée maléfique derrière lui.

Pourquoi Stable Diffusion interprète « Kermit in Mordor » de cette façon et qui est ce Kermit rouge diabolique derrière notre fidèle héros ? Aucune idée.

N’oubliez pas, n’ayez pas peur de supprimer ce que vous pensez être un terme clé de votre info-bulle. Certains mots, tels que « magnifique », affectent grandement l’apparence d’une image, même s’ils n’ont pas de signification exacte. Au fur et à mesure que vous passez plus de temps avec Stable Diffusion, vous aurez une idée de la façon dont il réagit à certains mots, et vous découvrirez rapidement qu’écrire un bon indice est un art en soi.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *