generate-image

Par mkurman · zorai

Générez ou modifiez des images à l'aide de modèles d'IA (FLUX, Nano Banana 2). À utiliser pour la génération d'images à usage général, notamment les photos, illustrations, œuvres d'art, ressources visuelles, concept art et toute image qui n'est pas un diagramme ou schéma technique. Pour les organigrammes, circuits, chemins et diagrammes techniques, utilisez plutôt le skill scientific-schematics.

npx skills add https://github.com/mkurman/zorai --skill generate-image

Générer une Image

Générez et modifiez des images haute qualité en utilisant les modèles de génération d'images d'OpenRouter, notamment FLUX.2 Pro et Gemini 3.1 Flash Image Preview.

Quand utiliser cette compétence

Utilisez generate-image pour :

  • Les photos et images photorréalistes
  • Les illustrations artistiques et œuvres d'art
  • L'art conceptuel et les concepts visuels
  • Les ressources visuelles pour présentations ou documents
  • L'édition et modification d'images
  • Tout besoin général de génération d'images

Utilisez scientific-schematics à la place pour :

  • Les organigrammes et diagrammes de processus
  • Les schémas de circuits et schémas électriques
  • Les voies biologiques et cascades de signalisation
  • Les diagrammes d'architecture système
  • Les diagrammes CONSORT et organigrammes méthodologiques
  • Tout diagramme technique/schématique

Démarrage rapide

Utilisez le script scripts/generate_image.py pour générer ou modifier des images :

# Générer une nouvelle image
python scripts/generate_image.py "A beautiful sunset over mountains"

# Modifier une image existante
python scripts/generate_image.py "Make the sky purple" --input photo.jpg

Cela génère/modifie une image et l'enregistre sous generated_image.png dans le répertoire courant.

Configuration de la clé API

CRITIQUE : Le script nécessite une clé API OpenRouter. Avant d'exécuter, vérifiez que l'utilisateur a configuré sa clé API :

  1. Recherchez un fichier .env dans le répertoire du projet ou les répertoires parents
  2. Vérifiez la présence de OPENROUTER_API_KEY=<key> dans le fichier .env
  3. Si absent, informez l'utilisateur qu'il doit :
    • Créer un fichier .env avec OPENROUTER_API_KEY=your-api-key-here
    • Ou définir la variable d'environnement : export OPENROUTER_API_KEY=your-api-key-here
    • Obtenir une clé API sur : https://openrouter.ai/keys

Le script détecte automatiquement le fichier .env et fournit des messages d'erreur clairs si la clé API est manquante.

Sélection du modèle

Modèle par défaut : google/gemini-3.1-flash-image-preview (haute qualité, recommandé)

Modèles disponibles pour la génération et l'édition :

  • google/gemini-3.1-flash-image-preview - Haute qualité, supporte la génération + édition
  • black-forest-labs/flux.2-pro - Rapide, haute qualité, supporte la génération + édition

Génération uniquement :

  • black-forest-labs/flux.2-flex - Rapide et économique, mais qualité inférieure à pro

Sélectionnez selon :

  • Qualité : Utilisez gemini-3.1-flash-image-preview ou flux.2-pro
  • Édition : Utilisez gemini-3.1-flash-image-preview ou flux.2-pro (tous deux supportent l'édition d'images)
  • Coût : Utilisez flux.2-flex pour la génération uniquement

Patterns d'utilisation courants

Génération basique

python scripts/generate_image.py "Your prompt here"

Spécifier le modèle

python scripts/generate_image.py "A cat in space" --model "black-forest-labs/flux.2-pro"

Chemin de sortie personnalisé

python scripts/generate_image.py "Abstract art" --output artwork.png

Modifier une image existante

python scripts/generate_image.py "Make the background blue" --input photo.jpg

Éditer avec un modèle spécifique

python scripts/generate_image.py "Add sunglasses to the person" --input portrait.png --model "black-forest-labs/flux.2-pro"

Éditer avec sortie personnalisée

python scripts/generate_image.py "Remove the text from the image" --input screenshot.png --output cleaned.png

Plusieurs images

Exécutez le script plusieurs fois avec des prompts ou chemins de sortie différents :

python scripts/generate_image.py "Image 1 description" --output image1.png
python scripts/generate_image.py "Image 2 description" --output image2.png

Paramètres du script

  • prompt (requis) : Description textuelle de l'image à générer, ou instructions d'édition
  • --input ou -i : Chemin de l'image d'entrée pour édition (active le mode édition)
  • --model ou -m : ID du modèle OpenRouter (défaut : google/gemini-3.1-flash-image-preview)
  • --output ou -o : Chemin du fichier de sortie (défaut : generated_image.png)
  • --api-key : Clé API OpenRouter (surcharge le fichier .env)

Exemples de cas d'usage

Pour les documents scientifiques

# Générer une illustration conceptuelle pour un article
python scripts/generate_image.py "Microscopic view of cancer cells being attacked by immunotherapy agents, scientific illustration style" --output figures/immunotherapy_concept.png

# Créer un visuel pour une présentation
python scripts/generate_image.py "DNA double helix structure with highlighted mutation site, modern scientific visualization" --output slides/dna_mutation.png

Pour les présentations et affiches

# Arrière-plan de diapositive titre
python scripts/generate_image.py "Abstract blue and white background with subtle molecular patterns, professional presentation style" --output slides/background.png

# Image héroïque d'affiche
python scripts/generate_image.py "Laboratory setting with modern equipment, photorealistic, well-lit" --output poster/hero.png

Pour le contenu visuel général

# Images pour site web ou documentation
python scripts/generate_image.py "Professional team collaboration around a digital whiteboard, modern office" --output docs/team_collaboration.png

# Matériel de marketing
python scripts/generate_image.py "Futuristic AI brain concept with glowing neural networks" --output marketing/ai_concept.png

Gestion des erreurs

Le script fournit des messages d'erreur clairs pour :

  • Clé API manquante (avec instructions de configuration)
  • Erreurs API (avec codes de statut)
  • Formats de réponse inattendus
  • Dépendances manquantes (bibliothèque requests)

Si le script échoue, lisez le message d'erreur et résolvez le problème avant de réessayer.

Notes

  • Les images sont renvoyées sous forme de URLs de données encodées en base64 et enregistrées automatiquement en fichiers PNG
  • Le script supporte à la fois les formats de réponse images et content des différents modèles OpenRouter
  • Le temps de génération varie selon le modèle (généralement 5-30 secondes)
  • Pour l'édition d'images, l'image d'entrée est encodée en base64 et envoyée au modèle
  • Formats d'image d'entrée supportés : PNG, JPEG, GIF, WebP
  • Consultez le tarif OpenRouter pour les informations de coût : https://openrouter.ai/models

Conseils pour l'édition d'images

  • Soyez spécifique sur les changements souhaités (par ex., « changer le ciel en couleurs de coucher de soleil » vs « éditer le ciel »)
  • Référencez des éléments spécifiques de l'image si possible
  • Pour de meilleurs résultats, utilisez des instructions d'édition claires et détaillées
  • Gemini 3.1 Flash Image Preview et FLUX.2 Pro supportent l'édition d'images via OpenRouter

Intégration avec d'autres compétences

  • scientific-schematics : Utilisez pour les diagrammes techniques, organigrammes, circuits, voies
  • generate-image : Utilisez pour les photos, illustrations, œuvres d'art, concepts visuels
  • scientific-slides : Combinez avec generate-image pour des présentations visuellement riches
  • latex-posters : Utilisez generate-image pour les visuels d'affiche et images héroïques

Skills similaires