Générer une Image

Générez et modifiez des images haute qualité en utilisant les modèles de génération d'images d'OpenRouter, notamment FLUX.2 Pro et Gemini 3.1 Flash Image Preview.

Quand utiliser cette compétence

Utilisez generate-image pour :

Les photos et images photorréalistes
Les illustrations artistiques et œuvres d'art
L'art conceptuel et les concepts visuels
Les ressources visuelles pour présentations ou documents
L'édition et modification d'images
Tout besoin général de génération d'images

Utilisez scientific-schematics à la place pour :

Les organigrammes et diagrammes de processus
Les schémas de circuits et schémas électriques
Les voies biologiques et cascades de signalisation
Les diagrammes d'architecture système
Les diagrammes CONSORT et organigrammes méthodologiques
Tout diagramme technique/schématique

Démarrage rapide

Utilisez le script scripts/generate_image.py pour générer ou modifier des images :

# Générer une nouvelle image
python scripts/generate_image.py "A beautiful sunset over mountains"

# Modifier une image existante
python scripts/generate_image.py "Make the sky purple" --input photo.jpg

Cela génère/modifie une image et l'enregistre sous generated_image.png dans le répertoire courant.

Configuration de la clé API

CRITIQUE : Le script nécessite une clé API OpenRouter. Avant d'exécuter, vérifiez que l'utilisateur a configuré sa clé API :

Recherchez un fichier .env dans le répertoire du projet ou les répertoires parents
Vérifiez la présence de OPENROUTER_API_KEY=<key> dans le fichier .env
Si absent, informez l'utilisateur qu'il doit :
- Créer un fichier .env avec OPENROUTER_API_KEY=your-api-key-here
- Ou définir la variable d'environnement : export OPENROUTER_API_KEY=your-api-key-here
- Obtenir une clé API sur : https://openrouter.ai/keys

Le script détecte automatiquement le fichier .env et fournit des messages d'erreur clairs si la clé API est manquante.

Sélection du modèle

Modèle par défaut : google/gemini-3.1-flash-image-preview (haute qualité, recommandé)

Modèles disponibles pour la génération et l'édition :

google/gemini-3.1-flash-image-preview - Haute qualité, supporte la génération + édition
black-forest-labs/flux.2-pro - Rapide, haute qualité, supporte la génération + édition

Génération uniquement :

black-forest-labs/flux.2-flex - Rapide et économique, mais qualité inférieure à pro

Sélectionnez selon :

Qualité : Utilisez gemini-3.1-flash-image-preview ou flux.2-pro
Édition : Utilisez gemini-3.1-flash-image-preview ou flux.2-pro (tous deux supportent l'édition d'images)
Coût : Utilisez flux.2-flex pour la génération uniquement

Patterns d'utilisation courants

Génération basique

python scripts/generate_image.py "Your prompt here"

Spécifier le modèle

python scripts/generate_image.py "A cat in space" --model "black-forest-labs/flux.2-pro"

Chemin de sortie personnalisé

python scripts/generate_image.py "Abstract art" --output artwork.png

Modifier une image existante

python scripts/generate_image.py "Make the background blue" --input photo.jpg

Éditer avec un modèle spécifique

python scripts/generate_image.py "Add sunglasses to the person" --input portrait.png --model "black-forest-labs/flux.2-pro"

Éditer avec sortie personnalisée

python scripts/generate_image.py "Remove the text from the image" --input screenshot.png --output cleaned.png

Plusieurs images

Exécutez le script plusieurs fois avec des prompts ou chemins de sortie différents :

python scripts/generate_image.py "Image 1 description" --output image1.png
python scripts/generate_image.py "Image 2 description" --output image2.png

Paramètres du script

prompt (requis) : Description textuelle de l'image à générer, ou instructions d'édition
--input ou -i : Chemin de l'image d'entrée pour édition (active le mode édition)
--model ou -m : ID du modèle OpenRouter (défaut : google/gemini-3.1-flash-image-preview)
--output ou -o : Chemin du fichier de sortie (défaut : generated_image.png)
--api-key : Clé API OpenRouter (surcharge le fichier .env)

Exemples de cas d'usage

Pour les documents scientifiques

# Générer une illustration conceptuelle pour un article
python scripts/generate_image.py "Microscopic view of cancer cells being attacked by immunotherapy agents, scientific illustration style" --output figures/immunotherapy_concept.png

# Créer un visuel pour une présentation
python scripts/generate_image.py "DNA double helix structure with highlighted mutation site, modern scientific visualization" --output slides/dna_mutation.png

Pour les présentations et affiches

# Arrière-plan de diapositive titre
python scripts/generate_image.py "Abstract blue and white background with subtle molecular patterns, professional presentation style" --output slides/background.png

# Image héroïque d'affiche
python scripts/generate_image.py "Laboratory setting with modern equipment, photorealistic, well-lit" --output poster/hero.png

Pour le contenu visuel général

# Images pour site web ou documentation
python scripts/generate_image.py "Professional team collaboration around a digital whiteboard, modern office" --output docs/team_collaboration.png

# Matériel de marketing
python scripts/generate_image.py "Futuristic AI brain concept with glowing neural networks" --output marketing/ai_concept.png

Gestion des erreurs

Le script fournit des messages d'erreur clairs pour :

Clé API manquante (avec instructions de configuration)
Erreurs API (avec codes de statut)
Formats de réponse inattendus
Dépendances manquantes (bibliothèque requests)

Si le script échoue, lisez le message d'erreur et résolvez le problème avant de réessayer.

Notes

Les images sont renvoyées sous forme de URLs de données encodées en base64 et enregistrées automatiquement en fichiers PNG
Le script supporte à la fois les formats de réponse images et content des différents modèles OpenRouter
Le temps de génération varie selon le modèle (généralement 5-30 secondes)
Pour l'édition d'images, l'image d'entrée est encodée en base64 et envoyée au modèle
Formats d'image d'entrée supportés : PNG, JPEG, GIF, WebP
Consultez le tarif OpenRouter pour les informations de coût : https://openrouter.ai/models

Conseils pour l'édition d'images

Soyez spécifique sur les changements souhaités (par ex., « changer le ciel en couleurs de coucher de soleil » vs « éditer le ciel »)
Référencez des éléments spécifiques de l'image si possible
Pour de meilleurs résultats, utilisez des instructions d'édition claires et détaillées
Gemini 3.1 Flash Image Preview et FLUX.2 Pro supportent l'édition d'images via OpenRouter

Intégration avec d'autres compétences

scientific-schematics : Utilisez pour les diagrammes techniques, organigrammes, circuits, voies
generate-image : Utilisez pour les photos, illustrations, œuvres d'art, concepts visuels
scientific-slides : Combinez avec generate-image pour des présentations visuellement riches
latex-posters : Utilisez generate-image pour les visuels d'affiche et images héroïques