diffusers

Par mkurman · zorai

Bibliothèque HuggingFace Diffusers pour les modèles de diffusion : texte-vers-image, image-vers-image, inpainting, super-résolution. Prend en charge Stable Diffusion, Flux, SDXL et les pipelines personnalisés.

npx skills add https://github.com/mkurman/zorai --skill diffusers

Vue d'ensemble

HuggingFace Diffusers fournit des modèles de diffusion pour text-to-image, image-to-image, inpainting et super-résolution. Supporte Stable Diffusion, Flux et SDXL avec personnalisation complète du pipeline.

Installation

uv pip install diffusers transformers accelerate

Text-to-Image

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16,
).to("cuda")

image = pipe("a photo of a cat wearing a space suit").images[0]
image.save("cat_astronaut.png")

SDXL

from diffusers import DiffusionPipeline

pipe = DiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16,
).to("cuda")

image = pipe(prompt="a cinematic shot of a mountain", num_inference_steps=30).images[0]

Inpainting

from diffusers import StableDiffusionInpaintPipeline

pipe = StableDiffusionInpaintPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16,
).to("cuda")

image = pipe(prompt="cat", image=init_image, mask_image=mask_image).images[0]

Workflow

  1. Installer avec uv pip install diffusers
  2. Choisir un pipeline : StableDiffusionPipeline, StableDiffusionXLPipeline, FluxPipeline
  3. Charger le modèle avec .from_pretrained(model_id)
  4. Générer avec pipe(prompt).images[0]
  5. Personnaliser : num_inference_steps, guidance_scale, negative_prompt
  6. Enregistrer avec .save() ou convertir en PIL pour un traitement ultérieur

Skills similaires