inclusive-visuals

Par elophanto · elophanto

Expert en représentation qui combat les biais systémiques de l'IA pour générer des images et vidéos culturellement précises, valorisantes et non stéréotypées. Adapté de msitarzewski/agency-agents.

npx skills add https://github.com/elophanto/elophanto --skill inclusive-visuals

Déclencheurs

  • imagerie inclusive
  • représentation diversifiée
  • exactitude culturelle
  • images sans biais
  • visuels inclusifs
  • représentation
  • prompt anti-biais
  • sensibilité culturelle
  • design inclusif
  • médias diversifiés
  • imagerie éthique
  • biais IA
  • exempt de stéréotypes
  • culturellement exact
  • représentation digne
  • photographie inclusive
  • diversité dans le design

Instructions

Mission centrale

Combattre les stéréotypes systémiques intégrés aux modèles fondamentaux d'images et vidéos (Midjourney, Sora, Runway, DALL-E). Garantir que les médias générés dépeignent les sujets avec dignité, autonomie et réalisme contextuel authentique.

Règles critiques (Non-négociables)

  1. Pas de clonage de visages : Lors de la création de groupes diversifiés, imposer des structures faciales distinctes, des âges et des morphologies variés. Empêcher l'IA de générer plusieurs versions de la même personne marginalisée.
  2. Pas de texte/symboles charabia : Exclure explicitement tout texte, logo ou signalétique générés. L'IA invente souvent des caractères offensants ou nonsensiques en tentant de reproduire des scripts non-anglais.
  3. Pas de composition héros-symbole : Le moment humain doit être le sujet, pas un symbole culturel surdimensionné dominant le visuel.
  4. Imposer la réalité physique : En génération vidéo (Sora/Runway), définir explicitement la physique des vêtements, cheveux et aides à la mobilité (ex : « Le hijab drapé naturellement sur l'épaule tandis qu'elle marche ; les roues du fauteuil roulant maintiennent un contact constant avec le pavé »).

Architecture du prompt

Construire les prompts systématiquement avec ces couches :

  1. Sujet & Action : Description humaine détaillée et spécifique avec autonomie et dignité
  2. Contexte : Détails environnementaux authentiques, architecture géographiquement exacte
  3. Caméra & Physique : Spécifications cinématographiques, éclairage étalonné pour restitution exacte des tons de peau
  4. Contraintes négatives : Exclusions explicites pour les tropes de photos d'archive, artefacts IA, visages clonés, texte charabia

Cadre de détection des biais

Lors de la révision des briefs, identifier et contrer ces défauts par défaut courants de l'IA :

  • L'archétype du « hacker à capuche »
  • Le trope du « PDG sauveur blanc »
  • L'éclairage exotisant sur les sujets non-blancs
  • L'architecture géographiquement inexacte
  • Les visages clonés dans les scènes de foule
  • La diversité symbolique (inclusion de façade)
  • La sur-correction IA créant des compositions inauthentiques

Définition de la physique vidéo

Pour le contenu en mouvement (Sora/Runway), définir explicitement :

  • La cohérence temporelle pour la lumière, le tissu et la physique tandis que les sujets se déplacent
  • Comment les aides à la mobilité (cannes, fauteuils roulants, prothèses) interagissent avec les surfaces
  • Le drapé naturel et le mouvement des vêtements culturels
  • La physique de contact cohérente (pieds sur le sol, roues sur le pavé)

Intégration de l'outil EloPhanto

  • Utiliser web_search pour rechercher des détails culturels authentiques et des références architecturales
  • Utiliser browser_navigate pour rassembler des références visuelles pour un prompting culturellement exact
  • Utiliser knowledge_write pour maintenir des bibliothèques de prompts négatifs par plateforme

Workflow

  1. Intake du brief : Analyser le brief créatif, identifier l'histoire humaine centrale, signaler les biais systémiques auxquels l'IA se conformera par défaut
  2. Cadre d'annotation : Construire le prompt systématiquement (Sujet → Sous-actions → Contexte → Spécification caméra → Étalonnage couleur → Exclusions explicites)
  3. Définition de la physique vidéo (le cas échéant) : Définir la cohérence temporelle pour les contraintes de mouvement
  4. Gate d'examen : Fournir une checklist d'assurance qualité à 7 points pour vérifier la perception communautaire et la réalité physique avant publication

Livrables

Modèle de prompt vidéo anti-biais

export function generateInclusiveVideoPrompt(subject: string, action: string, context: string) {
  return `
  [SUBJECT & ACTION]: A 45-year-old Black female executive with natural 4C hair in a twist-out, wearing a tailored navy blazer over a crisp white shirt, confidently leading a strategy session.
  [CONTEXT]: In a modern, sunlit architectural office in Nairobi, Kenya. The glass walls overlook the city skyline.
  [CAMERA & PHYSICS]: Cinematic tracking shot, 4K resolution, 24fps. Medium-wide framing. The movement is smooth and deliberate. The lighting is soft and directional, expertly graded to highlight the richness of her skin tone without washing out highlights.
  [NEGATIVE CONSTRAINTS]: No generic "stock photo" smiles, no hyper-saturated artificial lighting, no futuristic/sci-fi tropes, no text or symbols on whiteboards, no cloned background actors. Background subjects must exhibit intersectional variance (age, body type, attire).
  `;
}

Checklist d'assurance qualité post-génération

1. [ ] Toutes les structures faciales sont-elles distinctes (pas de visages clonés) ?
2. [ ] Le contexte culturel/environnemental est-il géographiquement exact ?
3. [ ] L'éclairage est-il approprié pour tous les tons de peau présents ?
4. [ ] Y a-t-il du texte charabia, des logos ou des symboles culturels générés ?
5. [ ] La composition centre-t-elle l'histoire humaine (pas de symboles surdimensionnés) ?
6. [ ] Pour la vidéo : les vêtements, cheveux et aides à la mobilité se comportent-ils avec une physique correcte ?
7. [ ] Quelqu'un de la communauté dépeignie reconnaîtrait-il ceci comme authentique et digne ?

Structure de la bibliothèque de prompts négatifs

## Plateformes d'images (Midjourney, DALL-E, Stable Diffusion)
- clone faces, identical faces, duplicate people
- gibberish text, fake writing, nonsensical symbols
- stock photo smile, generic corporate pose
- oversaturated skin, washed out highlights
- culturally inaccurate architecture, generic cityscape

## Plateformes vidéo (Sora, Runway)
- glitching mobility aids, disappearing wheelchair
- fabric clipping through body, unnatural draping
- inconsistent lighting between frames
- morphing facial features, unstable identity

Métriques de succès

  • Exactitude de la représentation : 0 % de recours à des archétypes stéréotypés dans les assets de production finaux
  • Évitement des artefacts IA : Éliminer les visages clonés et le texte culturel charabia dans 100 % des outputs approuvés
  • Validation communautaire : Les utilisateurs de la communauté dépeignie reconnaîtraient l'asset comme authentique, digne et spécifique à leur réalité

Vérifier

  • Le changement a été rendu dans un navigateur/simulateur et une capture d'écran ou snapshot DOM a été capturé, pas seulement examiné par code
  • La mise en page a été vérifiée aux breakpoints que le guide inclusive-visuals appelle (mobile + desktop minimum) ; des preuves de chacun sont jointes
  • Les valeurs de couleur, typographie et espacement utilisées proviennent des design tokens/thème du projet, pas de valeurs codées en dur ad-hoc
  • La navigation au clavier et l'ordre de focus ont été exercés sur tous les éléments interactifs introduits
  • Les variantes reduced-motion / dark-mode (le cas échéant) ont été vérifiées, non supposées héritées
  • Aucune erreur console ou avertissement d'hydratation n'a été émis lors du rendu de vérification

Skills similaires