Media & Creative

Generation et manipulation de contenu visuel : video, audio, images, illustration.

107 skills

# Skill Source Description Δ
1 algorithmic-art anthropics/skills Générer des philosophies algorithmiques visuelles en art génératif p5.js. 155 898 47
2 brand-guidelines anthropics/skills Appliquer l'identité visuelle Anthropic à des présentations PowerPoint automatiquement. 155 898 47
3 canvas-design anthropics/skills Générer une philosophie esthétique visuelle et l'exprimer graphiquement en artefacts. 155 898 47
4 theme-factory anthropics/skills Appliquer un thème visuel professionnel personnalisé à n'importe quel artefact ou présentation. 155 898 47
5 slack-gif-creator anthropics/skills Créer des GIFs animés optimisés pour Slack avec contrôle précis des paramètres. 155 898 47
6 report nvidia/skills Générer un rapport d'analyse vidéo horodaté via l'agent VSS. 1 970 18
7 video-search nvidia/skills Rechercher des archives vidéo en langage naturel via des embeddings vectoriels. 1 970 18
8 video-summarization nvidia/skills Résumer automatiquement des vidéos courtes ou longues via VLM NIM ou LVS. 1 970 18
9 video-understanding nvidia/skills Interroger une vidéo via un agent VLM pour analyser frames, objets et actions visuelles. 1 970 18
10 vios nvidia/skills Gérer caméras, flux RTSP, enregistrements et stockage vidéo via l'API VIOS. 1 970 18
11 vss-frag nvidia/skills Analyser des vidéos avec RAG d'entreprise pour générer des rapports enrichis. 1 970 18
12 vss-generate-video-calibration nvidia/skills Calibrer automatiquement des caméras via fichiers locaux, flux RTSP ou données d'exemple. 1 970 18
13 vss-generate-video-report nvidia/skills Générer un rapport d'analyse vidéo via clip ou incidents selon le contexte. 1 970 18
14 vss-manage-video-io-storage nvidia/skills Gérer caméras, flux RTSP, snapshots et stockage vidéo via l'API VIOS. 1 970 18
15 vss-summarize-video nvidia/skills Produire un résumé narratif horodaté d'un clip vidéo via API VLM ou microservice LVS. 1 970 18
16 slang-shader-engineer github/awesome-copilot Écrire, réviser et optimiser des shaders Slang pour applications graphiques professionnelles multiplateformes. 35 830 5
17 resemble-detect github/awesome-copilot Détecter deepfakes, contenus synthétiques et vérifier l'authenticité de tout média. 35 830 5
18 adobe-illustrator-scripting github/awesome-copilot Automatiser Adobe Illustrator via ExtendScript pour manipuler, exporter et générer des fichiers vectoriels. 35 830 5
19 excalidraw-diagram-generator github/awesome-copilot Générer des diagrammes Excalidraw variés à partir de descriptions en langage naturel. 35 830 5
20 freecad-scripts github/awesome-copilot Générer des scripts Python production pour modélisation 3D dans FreeCAD. 35 830 5
21 legacy-circuit-mockups github/awesome-copilot Créer des maquettes visuelles de circuits électroniques rétro sur breadboard. 35 830 5
22 drawio github/awesome-copilot Générer des diagrammes draw.io natifs et les exporter en PNG intégrables. 35 830 5
23 rhino3d-scripts github/awesome-copilot Scripter pour Rhinoceros 3D en Python, VBScript ou C# via RhinoCommon. 35 830 5
24 image-manipulation-image-magick github/awesome-copilot Manipuler, redimensionner et convertir des images en lot avec ImageMagick. 35 830 5
25 nano-banana-pro-openrouter github/awesome-copilot Générer, éditer ou composer des images via OpenRouter avec Gemini. 35 830 5
26 generate-image github/awesome-copilot Générer et sauvegarder des images via OpenAI ou Google Gemini. 35 830 5
27 image-annotations github/awesome-copilot Annoter visuellement des images avec callouts, flèches et étiquettes via PIL. 35 830 5
28 transloadit-media-processing github/awesome-copilot Encoder, transformer et traiter des médias en pipeline cloud via Transloadit. 35 830 5
29 screen-recording github/awesome-copilot Créer des GIFs animés de démos UI avec annotations et timing variable. 35 830 5
30 video-sdk/linux anthropics/knowledge-work-plugins Développer des bots et applications vidéo headless avec le SDK Zoom sur Linux. 22 080 4
31 zoom-video-sdk-macos anthropics/knowledge-work-plugins Intégrer le SDK vidéo Zoom pour créer des apps macOS personnalisées. 22 080 4
32 video-sdk/web anthropics/knowledge-work-plugins Développer des applications vidéo personnalisées dans le navigateur avec le SDK Zoom. 22 080 4
33 video-sdk/windows anthropics/knowledge-work-plugins Développer des applications vidéo personnalisées sur Windows avec le SDK Zoom. 22 080 4
34 speech openai/skills Générer des clips audio parlés, en mode simple ou batch, via un CLI dédié. 22 951 3
35 transcribe openai/skills Transcrire des fichiers audio avec identification optionnelle des locuteurs via OpenAI. 22 951 3
36 imagegen openai/skills Générer ou éditer des images pour un projet via outil intégré ou CLI. 22 951 3
37 hatch-pet openai/skills Créer un pet animé compatible Codex depuis un concept ou des images de référence. 22 951 3
38 azure-ai-transcription-py microsoft/skills Transcrire de l'audio en texte via Azure AI, en temps réel ou par lot. 2 625 2
39 azure-speech-to-text-rest-py microsoft/skills Transcrire des fichiers audio courts en texte via l'API REST Azure Speech. 2 625 2
40 azure-ai-voicelive-ts microsoft/skills Créer des assistants vocaux bidirectionnels en temps réel avec Azure AI. 2 625 2
41 podcast-generation microsoft/skills Générer des narrations audio réalistes à partir de texte via l'API Azure OpenAI Realtime. 2 625 2
42 remotion google-labs-code/stitch-skills Créer des vidéos de présentation d'applications en combinant Stitch et Remotion. 6 217 1
43 remotion-best-practices remotion-dev/skills Créer et animer des vidéos programmatiques avec Remotion en React. 3 813 1
44 pr-walkthrough tldraw/tldraw Générer une vidéo narrée de présentation d'une pull request GitHub avec sous-titres et diapositives. 48 364 1
45 macos-metal elophanto/elophanto Rendre des graphes massifs en 3D stéréoscopique sur Vision Pro via Metal. 82 0
46 music elevenlabs/skills Générer de la musique originale à partir de texte, vidéos ou plans de composition détaillés. 352 0
47 elevenlabs-transcribe elevenlabs/skills Transcrire de l'audio en texte avec identification des locuteurs et streaming temps réel. 352 0
48 sound-effects elevenlabs/skills Générer des effets sonores réalistes à partir de descriptions textuelles via ElevenLabs. 352 0
49 speech-to-text elevenlabs/skills Transcrire de l'audio en texte avec détection de locuteurs et horodatage précis. 352 0
50 text-to-speech elevenlabs/skills Convertir du texte en parole naturelle multilingue via l'API ElevenLabs. 352 0

À propos de cette sélection

Quand un agent doit produire une vidéo explicative, retailler une série d'images pour une campagne ou synthétiser une voix off en plusieurs langues, les skills génériques atteignent vite leurs limites. Cette section regroupe ce qui couvre réellement ces besoins : piloter Runway pour la génération vidéo, appeler ElevenLabs pour cloner une voix ou en produire une à partir d'un script, générer des visuels programmatiquement, manipuler du canvas ou appliquer des brand guidelines dans un workflow automatisé. Les skills media & creative ici s'adressent aux devs qui intègrent du contenu généré dans un produit. L'outillage reste hétérogène, mais un socle solide couvre déjà la majorité des cas d'usage courants, du GIF Slack automatique au diagramme généré à la volée.