Text-to-Image
La generation text-to-image est le cas d’usage principal de ComfyUI. Ce guide couvre les differentes approches et modeles disponibles.
Modeles recommandes en 2025-2026
Flux (Black Forest Labs)
Le modele de reference pour la qualite text-to-image.
- Flux.1 Dev : meilleur rapport qualite/vitesse pour le developpement
- Flux.1 Schnell : generation ultra-rapide (4 steps suffisent)
- Points forts : excellente adherence au prompt, texte lisible, compositions complexes
- VRAM : 12 Go+ recommande (quantifie possible pour 8 Go)
Stable Diffusion 3.5
La derniere generation de Stability AI.
- SD3.5 Large : qualite maximale, 8B parametres
- SD3.5 Medium : bon compromis qualite/vitesse
- Architecture : MMDiT (Multi-Modal Diffusion Transformer)
- Points forts : multi-resolution native, coherence de style
SDXL
Toujours excellent et tres supporte par la communaute.
- Resolution : 1024x1024 natif
- Ecosysteme : le plus grand choix de LoRA et custom models
- Points forts : mature, stable, enormement de ressources communautaires
Workflow de base Flux
Load Checkpoint (Flux) → CLIP Text Encode → KSampler → VAE Decode → Save ImageParticularites Flux
- Utilise un double CLIP (CLIP-L + T5-XXL)
- CFG : 1.0 pour Schnell, 3.5 pour Dev (pas besoin de prompt negatif avec guidance)
- Sampler :
eulerrecommande - Steps : 4 pour Schnell, 20 pour Dev
Techniques avancees
ControlNet
Controlez la composition de l’image avec des images de reference :
- Canny : detecte les contours pour guider la structure
- Depth : utilise une carte de profondeur
- OpenPose : detecte les poses du corps humain
- Tile : upscale guide par l’image originale
Workflow : Ajoutez un node Apply ControlNet entre votre conditioning et le KSampler.
IP-Adapter
Transferez le style ou le sujet d’une image de reference.
- IP-Adapter : transfert de style global
- IP-Adapter Face : preservation de l’identite faciale
- IP-Adapter Plus : version amelioree avec plus de details
LoRA (Low-Rank Adaptation)
Affinez le style ou ajoutez des concepts specifiques :
- Telechargez un LoRA depuis CivitAI ou HuggingFace
- Placez-le dans
models/loras/ - Ajoutez un node
Load LoRAdans votre workflow - Strength : 0.5-0.8 est generalement un bon point de depart
Prompting avance
- Poids :
(mot important:1.3)augmente l’importance - Negatif :
[mot a eviter]reduit la presence - BREAK : separe les concepts dans le prompt
- Embeddings : utilisez des embeddings pre-entraines pour des styles specifiques
Batch processing
Pour generer plusieurs images automatiquement :
- Batch Size dans Empty Latent Image : genere N images en une seule passe
- Queue multiple : lancez plusieurs generations a la suite
- Load Images from Directory : traitez un dossier entier d’images de reference
Ou trouver des workflows
- OpenArt : la plus grande collection
- CivitAI : modeles + workflows associes
- ComfyUI Examples : exemples officiels
- Comfy Registry : custom nodes avec documentation
Prochaines etapes
- Image-to-Video : animez vos creations
- Inpainting : modifiez des zones specifiques
- Upscale : ameliorez la resolution