Générer des images avec HuggingFace Diffusers

Vue d'ensemble

HuggingFace Diffusers fournit des modèles de diffusion pour text-to-image, image-to-image, inpainting et super-résolution. Supporte Stable Diffusion, Flux et SDXL avec personnalisation complète du pipeline.

Installation

uv pip install diffusers transformers accelerate

Text-to-Image

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16,
).to("cuda")

image = pipe("a photo of a cat wearing a space suit").images[0]
image.save("cat_astronaut.png")

SDXL

from diffusers import DiffusionPipeline

pipe = DiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16,
).to("cuda")

image = pipe(prompt="a cinematic shot of a mountain", num_inference_steps=30).images[0]

Inpainting

from diffusers import StableDiffusionInpaintPipeline

pipe = StableDiffusionInpaintPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16,
).to("cuda")

image = pipe(prompt="cat", image=init_image, mask_image=mask_image).images[0]

Workflow

Installer avec uv pip install diffusers
Choisir un pipeline : StableDiffusionPipeline, StableDiffusionXLPipeline, FluxPipeline
Charger le modèle avec .from_pretrained(model_id)
Générer avec pipe(prompt).images[0]
Personnaliser : num_inference_steps, guidance_scale, negative_prompt
Enregistrer avec .save() ou convertir en PIL pour un traitement ultérieur