Inviter des modèles d'image sur Replicate
Tiré des billets de blog de Replicate sur l'invitation de modèles d'image (2024-2026). Les techniques sont indépendantes du modèle et se concentrent sur les principes transférables. Pour la sélection de modèles, la tarification et la comparaison des fonctionnalités, consultez la compétence compare-models.
Rédiger des invites
Utilisez le langage naturel, pas des listes de mots-clés
Écrivez des phrases complètes décrivant ce que vous voulez. Les modèles d'image modernes comprennent la grammaire et le contexte bien mieux que les invites remplies de mots-clés.
Bon : « Une femme debout dans une ruelle de Tokyo au crépuscule, des enseignes au néon se reflétant sur le pavé mouillé » Mauvais : « femme, Tokyo, ruelle, crépuscule, néon, pavé mouillé »
Soyez précis et sans ambiguïté
Nommez les couleurs exactes, les matériaux, les configurations d'éclairage, l'équipement photographique et les relations spatiales. Des termes vagues comme « rendre-le meilleur » ou « artistique » donnent des résultats imprévisibles.
Bon : « Un bâtiment en béton brutaliste se reflétant dans une flaque parfaitement immobile après la pluie. Une seule silhouette avec un parapluie rouge marche le long du bord, la seule couleur dans une scène par ailleurs en noir et blanc. Ciel nuageux, lumière diffusée plate, effet de lentille à décalage d'inclinaison sur les bords. » Mauvais : « Bâtiment cool avec une personne à proximité, jour pluvieux »
Nommez les sujets directement
Utilisez des expressions descriptives comme « la femme aux cheveux noirs courts » ou « la voiture rouge ». Évitez les pronoms, qui sont souvent trop ambigus pour les modèles d'image.
Utilisez des invites longues et détaillées
La plupart des modèles modernes acceptent des milliers de jetons. Les invites longues et descriptives avec une structure claire surpassent les courtes. Une invite avec 12+ exigences spécifiques (texte sur les objets, diagrammes étiquetés, éléments codés par couleur, matériaux spécifiques) peut fonctionner si chaque exigence est énoncée clairement. Mais attention : plus l'invite est longue et complexe, plus il est probable que quelque chose sera manqué.
Commencez simplement, puis itérez
Commencez par des modifications de base. Testez d'abord les petites modifications, puis construisez sur ce qui fonctionne. La plupart des modèles d'édition supportent l'édition itérative, alors profitez-en.
Langage photographique
Les modèles d'image modernes comprennent profondément la terminologie photographique et de caméra. Utiliser ce vocabulaire vous donne un contrôle précis sur l'apparence.
Caméra et lentille
- Stocks de film : Kodak Portra 800, Fuji Velvia 50, Ilford HP5
- Caractéristiques de la lentille : 50mm Summilux grand ouvert, 85mm f/1.4, 24mm grand-angle
- Profondeur de champ : peu profonde (sujet net, arrière-plan flou), profonde (tout au point)
- Techniques de prise de vue : heure dorée, heure bleue, exposition longue, exposition double
Configurations d'éclairage
- Éclairage Rembrandt : éclairage de portrait classique avec un triangle de lumière sur la joue
- Éclairage de studio diffusé doux : reflets nets et ombres douces
- Éclairage de bordure / contrejour : sujet entouré de lumière par l'arrière
- Lumière diffusée plate : nuageux, illumination uniforme, ombres minimales
- Éclairage volumétrique : faisceaux de lumière visibles, brouillard, brume
Composition
- Règle des tiers, composition centrée, symétrie
- Plan large, plan moyen, gros plan, macro
- Angle élevé, angle bas, au niveau des yeux, vue à vol d'oiseau
- Décalage d'inclinaison pour les effets de miniature
Rendu de texte
Le rendu de texte dans les images est une tâche courante. Ces techniques améliorent la précision sur tous les modèles.
- Entourez le texte souhaité de guillemets doubles dans l'invite : « Concevez une affiche avec le titre \"BLUE NOTE SESSIONS\" en sans-serif gras condensé »
- Tenez-vous en à des polices lisibles. Le texte très stylisé peut ne pas fonctionner aussi bien.
- Lors de l'édition de texte dans une image existante, utilisez le modèle : « Remplacer 'ancien texte' par 'nouveau texte' »
- Correspondre à la longueur du texte si possible : les grands changements du nombre de caractères peuvent modifier la mise en page
- Soyez explicite sur la préservation du style de police s'il est important
- Pour la typographie complexe (affiches, mises en page éditoriales), recherchez des modèles qui traitent le texte comme faisant partie de la composition plutôt que de le tamponner par-dessus
- Certains modèles peuvent peindre du texte : masquez la région de texte, invitez avec du nouveau texte, et il correspond au style et à la police d'origine
Transfert de style
- Nommez le style exact : « peinture impressionniste », « art pop des années 1960 », « lavis à l'encre Sumi-e »
- Référencez les artistes ou mouvements spécifiques pour des conseils plus clairs
- Si une étiquette de style ne fonctionne pas, décrivez ses traits clés : « coups de pinceau visibles, texture de peinture épaisse, profondeur de couleur riche »
- Indiquez ce qui devrait rester pareil : « conservez la composition originale »
- Quand un style est difficile à décrire avec des mots, certains modèles supportent l'édition basée sur l'exemple : fournissez une paire avant/après, puis une troisième image. Le modèle déduit la transformation et l'applique.
- Certains modèles acceptent les images de référence de style : téléchargez les images capturant la palette de couleurs, la texture, la composition et l'ambiance que vous voulez
Cohérence des caractères
Maintenir le même personnage sur plusieurs générations est l'un des défis les plus difficiles de la génération d'images.
- Commencez par une description de référence claire : « la femme aux cheveux noirs courts et aux yeux verts portant un blazer bleu marine »
- Dites ce qui change (cadre, activité, style) et ce qui devrait rester pareil (visage, expression, vêtements)
- Utilisez les images de référence quand le modèle les supporte. Certains modèles gèrent plusieurs images de référence simultanément pour une cohérence plus forte.
- Divisez les modifications de caractères complexes en étapes : changez d'abord la tenue, puis changez la scène
- Générez des données d'entraînement synthétiques : créez de nombreuses images d'un personnage, choisissez les meilleures et utilisez-les pour l'ajustement fin ou comme références
Édition d'image
Principes généraux
- Spécifiez ce qu'il faut conserver : indiquez explicitement ce qui devrait rester inchangé. Utilisez des phrases comme « en gardant la pose et l'expression inchangées » ou « maintenez la composition originale ».
- Choisissez les verbes avec soin : « transformer » suggère une refonte complète. Utilisez des actions spécifiques comme « changer les vêtements en veste bleue » ou « remplacer l'arrière-plan par une plage ».
- Soyez précis sur la portée : « Remplacez l'arrière-plan par une plage tout en gardant la personne exactement à la même position, maintenez le placement identique du sujet, l'angle de caméra, le cadrage et la perspective. Remplacez uniquement l'environnement autour d'eux. »
Suppression d'objets
- Décrivez ce qui devrait remplir l'espace laissé derrière, pas seulement ce qu'il faut supprimer
- Certains modèles d'édition gèrent le retrait facilement ; d'autres laissent des artefacts structurels. Si un modèle a du mal, essayez un autre.
Édition d'arrière-plan
- Décrivez le nouvel arrière-plan en détail : éclairage, heure de la journée, environnement
- Spécifiez que le sujet devrait rester exactement à la même position avec le même éclairage
Modifications de perspective et d'angle
- Celles-ci font partie des modifications les plus difficiles. Tous les modèles ne les gèrent pas bien.
- Certains modèles se limitent à la composition initiale et ont du mal avec les nouveaux angles
Inpainting et outpainting
- Pour l'inpainting : masquez la région à éditer, puis invitez avec ce qui devrait la remplir
- Certains modèles ont une fonctionnalité « magic prompt » ou de réécriture automatique. Quand c'est activé, vous pouvez vous concentrer sur la description de la région éditée uniquement. Quand c'est désactivé, décrivez la scène entière.
- Décrire uniquement la région masquée fait que le modèle met davantage l'accent sur l'invite, ce qui peut produire de meilleurs résultats pour les modifications ciblées
- Le conditionnement de style ControlNet (détection d'arêtes, cartes de profondeur) aide à préserver la structure pendant la génération
Génération d'images multiples et de storyboards
Certains modèles peuvent générer plusieurs images connexes dans une seule invite.
- Demandez « une série », « un ensemble » ou spécifiez une mise en page de grille (par exemple, « grille de storyboard 2x2 »)
- Décrivez chaque panneau individuellement avec des descriptions de personnages cohérentes
- Maintenez la cohérence du style et du personnage en répétant les descriptions exactes
- Certains modèles supportent l'édition basée sur l'exemple : affichez une paire avant/après pour une image, puis appliquez la même transformation à d'autres
Photographie de produits et travaux commerciaux
- Spécifiez les matériaux avec précision : « acier brossé », « aluminium mat », « papier kraft », « verre dépoli »
- Décrivez la configuration d'éclairage : « éclairage de studio diffusé doux, reflets nets et ombres douces »
- Pour les actifs de marque et les icônes, recherchez des modèles qui produisent une sortie SVG native (de véritables fichiers vectoriels éditables)
- Pour les mises en page avec positionnement de la marque et du texte, recherchez des modèles avec une composition typographique et de conception solide
Ajustement fin et LoRAs
- Utilisez des mots-clés de déclenchement de votre modèle entraîné dans chaque invite
- Lors de la combinaison de plusieurs LoRAs, équilibrez leur influence avec des paramètres d'échelle (généralement 0.9-1.1)
- Générez des données d'entraînement synthétiques : générez de nombreuses images, choisissez les meilleures, réentraînez
- Utilisez des flux de travail cohérents pour les personnages pour générer des données d'entraînement à partir d'une seule image de référence
Pièges courants
-
Invites remplies de mots-clés : Les modèles modernes répondent mieux aux phrases en langage naturel qu'aux listes de mots-clés séparés par des virgules. Écrivez comme si vous décrivez une scène, pas en étiquetant une photo.
-
Utiliser « transformer » quand vous voulez une petite modification : « Transformer la personne en Viking » peut échanger l'identité entière. Utilisez un langage ciblé : « changer sa tenue en armure Viking, en gardant son visage et son expression inchangés ».
-
Ne pas spécifier ce qu'il faut conserver : Lors de l'édition, dites toujours ce qui devrait rester pareil. Sans instructions explicites, les modèles peuvent changer n'importe quoi.
-
Invites négatives sur les modèles non entraînés pour elles : Certains modèles n'ont pas été entraînés avec des invites négatives. Les utiliser sur ces modèles introduit du bruit plutôt que de supprimer les éléments indésirables. Consultez la documentation du modèle.
-
Échelle de guidance trop élevée (CFG) : Si les images semblent « brûlées » avec un contraste excessif, baissez l'échelle de guidance. Chaque modèle a une plage recommandée.
-
Attendre des connaissances en temps réel : Aucun modèle d'image n'a accès à Internet. Certains ont une forte connaissance du monde intégrée à partir des données d'entraînement, mais ce n'est pas en direct.
-
Invites courtes pour les scènes complexes : Les modèles modernes acceptent des milliers de jetons. Pour les compositions complexes avec de nombreuses exigences spécifiques, utilisez cette capacité.
-
Ignorer le rapport d'aspect : La plupart des modèles ont des résolutions spécifiques où ils fonctionnent le mieux (généralement ~1 mégapixel). Aller trop grand produit des artefacts de bordure. Aller trop petit produit des cadres durs. Utilisez les rapports d'aspect recommandés par le modèle.
-
Mauvais modèle pour la tâche : Pas chaque modèle est bon pour chaque tâche. Certains excellent au rendu de texte mais ont du mal à supprimer des objets. Certains sont excellents à la transposition de style mais médiocres à l'édition d'arrière-plan. Si un modèle a du mal avec un type d'édition spécifique, essayez un autre au lieu de combattre l'invite. Consultez la compétence compare-models pour des conseils.
-
Ne pas itérer : Les meilleurs résultats proviennent des flux de travail itératifs. Effectuez un petit changement, évaluez, affinez, répétez. N'essayez pas d'obtenir tout correct en une seule génération.
Sources
Toutes les techniques de cette compétence proviennent du blog de Replicate :
- How to prompt Seedream 5.0 (fév 2026)
- Recraft V4 (fév 2026)
- Run FLUX.2 on Replicate (nov 2025)
- How to prompt Nano Banana Pro (nov 2025)
- Which image editing model should I use? (sep 2025)
- Generate consistent characters (juil 2025)
- Use FLUX.1 Kontext to edit images with words (mai 2025)
- Imagen 4 (mai 2025)
- Ideogram 3.0 on Replicate (mai 2025)
- FLUX.1 Tools (nov 2024)
- Ideogram v2 inpainting (oct 2024)
- Using synthetic data to improve Flux finetunes (sep 2024)
- FLUX.1: First Impressions (aoû 2024)
- How to get the best results from Stable Diffusion 3 (juin 2024)