Aller au contenu

Text-to-Image

La generation text-to-image est le cas d’usage principal de ComfyUI. Ce guide couvre les differentes approches et modeles disponibles.

Modeles recommandes en 2025-2026

Flux (Black Forest Labs)

Le modele de reference pour la qualite text-to-image.

  • Flux.1 Dev : meilleur rapport qualite/vitesse pour le developpement
  • Flux.1 Schnell : generation ultra-rapide (4 steps suffisent)
  • Points forts : excellente adherence au prompt, texte lisible, compositions complexes
  • VRAM : 12 Go+ recommande (quantifie possible pour 8 Go)

Stable Diffusion 3.5

La derniere generation de Stability AI.

  • SD3.5 Large : qualite maximale, 8B parametres
  • SD3.5 Medium : bon compromis qualite/vitesse
  • Architecture : MMDiT (Multi-Modal Diffusion Transformer)
  • Points forts : multi-resolution native, coherence de style

SDXL

Toujours excellent et tres supporte par la communaute.

  • Resolution : 1024x1024 natif
  • Ecosysteme : le plus grand choix de LoRA et custom models
  • Points forts : mature, stable, enormement de ressources communautaires

Workflow de base Flux

Load Checkpoint (Flux) → CLIP Text Encode → KSampler → VAE Decode → Save Image

Particularites Flux

  • Utilise un double CLIP (CLIP-L + T5-XXL)
  • CFG : 1.0 pour Schnell, 3.5 pour Dev (pas besoin de prompt negatif avec guidance)
  • Sampler : euler recommande
  • Steps : 4 pour Schnell, 20 pour Dev

Techniques avancees

ControlNet

Controlez la composition de l’image avec des images de reference :

  • Canny : detecte les contours pour guider la structure
  • Depth : utilise une carte de profondeur
  • OpenPose : detecte les poses du corps humain
  • Tile : upscale guide par l’image originale

Workflow : Ajoutez un node Apply ControlNet entre votre conditioning et le KSampler.

IP-Adapter

Transferez le style ou le sujet d’une image de reference.

  • IP-Adapter : transfert de style global
  • IP-Adapter Face : preservation de l’identite faciale
  • IP-Adapter Plus : version amelioree avec plus de details

LoRA (Low-Rank Adaptation)

Affinez le style ou ajoutez des concepts specifiques :

  1. Telechargez un LoRA depuis CivitAI ou HuggingFace
  2. Placez-le dans models/loras/
  3. Ajoutez un node Load LoRA dans votre workflow
  4. Strength : 0.5-0.8 est generalement un bon point de depart

Prompting avance

  • Poids : (mot important:1.3) augmente l’importance
  • Negatif : [mot a eviter] reduit la presence
  • BREAK : separe les concepts dans le prompt
  • Embeddings : utilisez des embeddings pre-entraines pour des styles specifiques

Batch processing

Pour generer plusieurs images automatiquement :

  1. Batch Size dans Empty Latent Image : genere N images en une seule passe
  2. Queue multiple : lancez plusieurs generations a la suite
  3. Load Images from Directory : traitez un dossier entier d’images de reference

Ou trouver des workflows

Prochaines etapes