Générer une Image
Générez et modifiez des images haute qualité en utilisant les modèles de génération d'images d'OpenRouter, notamment FLUX.2 Pro et Gemini 3.1 Flash Image Preview.
Quand utiliser cette compétence
Utilisez generate-image pour :
- Les photos et images photorréalistes
- Les illustrations artistiques et œuvres d'art
- L'art conceptuel et les concepts visuels
- Les ressources visuelles pour présentations ou documents
- L'édition et modification d'images
- Tout besoin général de génération d'images
Utilisez scientific-schematics à la place pour :
- Les organigrammes et diagrammes de processus
- Les schémas de circuits et schémas électriques
- Les voies biologiques et cascades de signalisation
- Les diagrammes d'architecture système
- Les diagrammes CONSORT et organigrammes méthodologiques
- Tout diagramme technique/schématique
Démarrage rapide
Utilisez le script scripts/generate_image.py pour générer ou modifier des images :
# Générer une nouvelle image
python scripts/generate_image.py "A beautiful sunset over mountains"
# Modifier une image existante
python scripts/generate_image.py "Make the sky purple" --input photo.jpg
Cela génère/modifie une image et l'enregistre sous generated_image.png dans le répertoire courant.
Configuration de la clé API
CRITIQUE : Le script nécessite une clé API OpenRouter. Avant d'exécuter, vérifiez que l'utilisateur a configuré sa clé API :
- Recherchez un fichier
.envdans le répertoire du projet ou les répertoires parents - Vérifiez la présence de
OPENROUTER_API_KEY=<key>dans le fichier.env - Si absent, informez l'utilisateur qu'il doit :
- Créer un fichier
.envavecOPENROUTER_API_KEY=your-api-key-here - Ou définir la variable d'environnement :
export OPENROUTER_API_KEY=your-api-key-here - Obtenir une clé API sur : https://openrouter.ai/keys
- Créer un fichier
Le script détecte automatiquement le fichier .env et fournit des messages d'erreur clairs si la clé API est manquante.
Sélection du modèle
Modèle par défaut : google/gemini-3.1-flash-image-preview (haute qualité, recommandé)
Modèles disponibles pour la génération et l'édition :
google/gemini-3.1-flash-image-preview- Haute qualité, supporte la génération + éditionblack-forest-labs/flux.2-pro- Rapide, haute qualité, supporte la génération + édition
Génération uniquement :
black-forest-labs/flux.2-flex- Rapide et économique, mais qualité inférieure à pro
Sélectionnez selon :
- Qualité : Utilisez gemini-3.1-flash-image-preview ou flux.2-pro
- Édition : Utilisez gemini-3.1-flash-image-preview ou flux.2-pro (tous deux supportent l'édition d'images)
- Coût : Utilisez flux.2-flex pour la génération uniquement
Patterns d'utilisation courants
Génération basique
python scripts/generate_image.py "Your prompt here"
Spécifier le modèle
python scripts/generate_image.py "A cat in space" --model "black-forest-labs/flux.2-pro"
Chemin de sortie personnalisé
python scripts/generate_image.py "Abstract art" --output artwork.png
Modifier une image existante
python scripts/generate_image.py "Make the background blue" --input photo.jpg
Éditer avec un modèle spécifique
python scripts/generate_image.py "Add sunglasses to the person" --input portrait.png --model "black-forest-labs/flux.2-pro"
Éditer avec sortie personnalisée
python scripts/generate_image.py "Remove the text from the image" --input screenshot.png --output cleaned.png
Plusieurs images
Exécutez le script plusieurs fois avec des prompts ou chemins de sortie différents :
python scripts/generate_image.py "Image 1 description" --output image1.png
python scripts/generate_image.py "Image 2 description" --output image2.png
Paramètres du script
prompt(requis) : Description textuelle de l'image à générer, ou instructions d'édition--inputou-i: Chemin de l'image d'entrée pour édition (active le mode édition)--modelou-m: ID du modèle OpenRouter (défaut : google/gemini-3.1-flash-image-preview)--outputou-o: Chemin du fichier de sortie (défaut : generated_image.png)--api-key: Clé API OpenRouter (surcharge le fichier .env)
Exemples de cas d'usage
Pour les documents scientifiques
# Générer une illustration conceptuelle pour un article
python scripts/generate_image.py "Microscopic view of cancer cells being attacked by immunotherapy agents, scientific illustration style" --output figures/immunotherapy_concept.png
# Créer un visuel pour une présentation
python scripts/generate_image.py "DNA double helix structure with highlighted mutation site, modern scientific visualization" --output slides/dna_mutation.png
Pour les présentations et affiches
# Arrière-plan de diapositive titre
python scripts/generate_image.py "Abstract blue and white background with subtle molecular patterns, professional presentation style" --output slides/background.png
# Image héroïque d'affiche
python scripts/generate_image.py "Laboratory setting with modern equipment, photorealistic, well-lit" --output poster/hero.png
Pour le contenu visuel général
# Images pour site web ou documentation
python scripts/generate_image.py "Professional team collaboration around a digital whiteboard, modern office" --output docs/team_collaboration.png
# Matériel de marketing
python scripts/generate_image.py "Futuristic AI brain concept with glowing neural networks" --output marketing/ai_concept.png
Gestion des erreurs
Le script fournit des messages d'erreur clairs pour :
- Clé API manquante (avec instructions de configuration)
- Erreurs API (avec codes de statut)
- Formats de réponse inattendus
- Dépendances manquantes (bibliothèque requests)
Si le script échoue, lisez le message d'erreur et résolvez le problème avant de réessayer.
Notes
- Les images sont renvoyées sous forme de URLs de données encodées en base64 et enregistrées automatiquement en fichiers PNG
- Le script supporte à la fois les formats de réponse
imagesetcontentdes différents modèles OpenRouter - Le temps de génération varie selon le modèle (généralement 5-30 secondes)
- Pour l'édition d'images, l'image d'entrée est encodée en base64 et envoyée au modèle
- Formats d'image d'entrée supportés : PNG, JPEG, GIF, WebP
- Consultez le tarif OpenRouter pour les informations de coût : https://openrouter.ai/models
Conseils pour l'édition d'images
- Soyez spécifique sur les changements souhaités (par ex., « changer le ciel en couleurs de coucher de soleil » vs « éditer le ciel »)
- Référencez des éléments spécifiques de l'image si possible
- Pour de meilleurs résultats, utilisez des instructions d'édition claires et détaillées
- Gemini 3.1 Flash Image Preview et FLUX.2 Pro supportent l'édition d'images via OpenRouter
Intégration avec d'autres compétences
- scientific-schematics : Utilisez pour les diagrammes techniques, organigrammes, circuits, voies
- generate-image : Utilisez pour les photos, illustrations, œuvres d'art, concepts visuels
- scientific-slides : Combinez avec generate-image pour des présentations visuellement riches
- latex-posters : Utilisez generate-image pour les visuels d'affiche et images héroïques