Comprendre l'interface AUTOMATIC1111-reForge Stable Diffusion

L'interface utilisateur d'Automatic1111-reForge offre divers onglets et paramètres permettant d'ajuster la génération d'images avec Stable Diffusion.

Filtres UI

SD (Stable Diffusion)

Fait référence aux modèles de génération d'images utilisés. Il existe différentes versions de SD :

  • SD 1.5 : Version classique, large choix de checkpoints.
  • SD 2.x : Améliorations sur certains aspects, mais moins de modèles disponibles.
  • SD XL : Version plus avancée, générant des images plus détaillées.

XL (Stable Diffusion XL)

  • C'est une version améliorée de Stable Diffusion avec des images de meilleure qualité.
  • Nécessite un modèle spécifique et est plus gourmand en ressources.
  • Offre de meilleurs résultats pour les compositions complexes.

Flux

  • Ce paramètre pourrait être lié à un mode de gestion des ressources ou à un flux de travail particulier dans reForge.
  • Peut concerner le flux de diffusion (comment les images sont générées progressivement).

Checkpoint

  • Fichier de modèle principal utilisé pour la génération.
  • Peut être ajusté selon le style recherché (ex : RealisticVision pour du réalisme, DreamShaper pour du stylisé).
  • Se charge dans l’onglet "Model" et influence grandement le rendu.
  • Les modèles sont dans le répertoire : `webui/models/Stable-diffusion`

VAE / Text Encoder

  • VAE (Variational Autoencoder) : Module affectant la couleur et la netteté des images. Certains modèles nécessitent un VAE spécifique.
  • Text Encoder : Améliore la compréhension des prompts textuels.

Ajustement :

  • Tester le VAE recommandé pour le checkpoint utilisé.
  • Activer un text encoder performant pour une meilleure interprétation des prompts.

Diffusion in Low Bits

  • Permet de réduire la consommation de VRAM en exécutant la diffusion en mode 8-bit ou 4-bit.
  • Utile pour les GPU avec peu de VRAM (ex : RTX 2060).
  • Peut affecter légèrement la qualité de l'image.

Swap Method

  • Méthode d’échange mémoire permettant d’optimiser la gestion des ressources GPU.

Swap Location

  • Définit où se fait l’échange mémoire (VRAM, RAM, disque dur).
  • Utile si la mémoire GPU est limitée.

GPU Weight

  • Contrôle la charge attribuée au GPU pour la génération d’images.
  • À augmenter pour de meilleures performances si le GPU est puissant.

Génération d'images

Sampling Method (Méthode d'échantillonnage)

  • Définit la manière dont les détails sont affinés au fil des étapes.
  • Exemples :
    • Euler a (rapide, résultats corrects).
    • DPM++ 2M Karras (détails plus propres, plus lent).
    • UniPC (équilibre qualité/vitesse).

Schedule Type

  • Influence la façon dont le bruit est réduit durant les itérations de diffusion.
  • Peut avoir un impact sur la netteté et le style final.

Sampling Steps

  • Nombre d'itérations de diffusion.
  • Plus de steps = meilleure qualité mais plus lent.
  • Valeurs courantes : 20-30 (efficace), 50+ (qualité maximale).

Distilled CFG Scale

  • Variante du CFG Scale optimisée pour les modèles distillés.
  • Influence le contrôle sur le respect du prompt.

CFG Scale (Classifier Free Guidance Scale)

  • Contrôle le niveau d’influence du prompt sur l’image.
  • Valeurs typiques :
    • 3-7 : Images plus naturelles, mais moins précises.
    • 7-12 : Plus de fidélité au prompt.
    • 15+ : Trop rigide, peut donner des artefacts.

Seed

  • Détermine l’aléatoire des résultats.
  • Utiliser -1 pour un seed aléatoire.
  • Réutiliser un seed spécifique pour reproduire une image.

Extra

  • Options supplémentaires spécifiques à reForge (peut inclure des filtres, post-traitement...).

Hires. Fix (High Resolution Fix)

  • Génère une image en basse résolution, puis l'agrandit en ajoutant des détails.
  • Idéal pour améliorer la netteté et éviter le détail flou en haute résolution.
  • Doit être activé si l’image générée est trop pixellisée ou manque de détails.