Media & Creative

Generation et manipulation de contenu visuel : video, audio, images, illustration.

107 skills

#	Skill	Source	Description		Δ
1	algorithmic-art	anthropics/skills	Générer des philosophies algorithmiques visuelles en art génératif p5.js.	155 917	47
2	brand-guidelines	anthropics/skills	Appliquer l'identité visuelle Anthropic à des présentations PowerPoint automatiquement.	155 917	47
3	canvas-design	anthropics/skills	Générer une philosophie esthétique visuelle et l'exprimer graphiquement en artefacts.	155 917	47
4	theme-factory	anthropics/skills	Appliquer un thème visuel professionnel personnalisé à n'importe quel artefact ou présentation.	155 917	47
5	slack-gif-creator	anthropics/skills	Créer des GIFs animés optimisés pour Slack avec contrôle précis des paramètres.	155 917	47
6	report	nvidia/skills	Générer un rapport d'analyse vidéo horodaté via l'agent VSS.	1 970	18
7	video-search	nvidia/skills	Rechercher des archives vidéo en langage naturel via des embeddings vectoriels.	1 970	18
8	video-summarization	nvidia/skills	Résumer automatiquement des vidéos courtes ou longues via VLM NIM ou LVS.	1 970	18
9	video-understanding	nvidia/skills	Interroger une vidéo via un agent VLM pour analyser frames, objets et actions visuelles.	1 970	18
10	vios	nvidia/skills	Gérer caméras, flux RTSP, enregistrements et stockage vidéo via l'API VIOS.	1 970	18
11	vss-frag	nvidia/skills	Analyser des vidéos avec RAG d'entreprise pour générer des rapports enrichis.	1 970	18
12	vss-generate-video-calibration	nvidia/skills	Calibrer automatiquement des caméras via fichiers locaux, flux RTSP ou données d'exemple.	1 970	18
13	vss-generate-video-report	nvidia/skills	Générer un rapport d'analyse vidéo via clip ou incidents selon le contexte.	1 970	18
14	vss-manage-video-io-storage	nvidia/skills	Gérer caméras, flux RTSP, snapshots et stockage vidéo via l'API VIOS.	1 970	18
15	vss-summarize-video	nvidia/skills	Produire un résumé narratif horodaté d'un clip vidéo via API VLM ou microservice LVS.	1 970	18
16	slang-shader-engineer	github/awesome-copilot	Écrire, réviser et optimiser des shaders Slang pour applications graphiques professionnelles multiplateformes.	35 830	5
17	resemble-detect	github/awesome-copilot	Détecter deepfakes, contenus synthétiques et vérifier l'authenticité de tout média.	35 830	5
18	adobe-illustrator-scripting	github/awesome-copilot	Automatiser Adobe Illustrator via ExtendScript pour manipuler, exporter et générer des fichiers vectoriels.	35 830	5
19	excalidraw-diagram-generator	github/awesome-copilot	Générer des diagrammes Excalidraw variés à partir de descriptions en langage naturel.	35 830	5
20	freecad-scripts	github/awesome-copilot	Générer des scripts Python production pour modélisation 3D dans FreeCAD.	35 830	5
21	legacy-circuit-mockups	github/awesome-copilot	Créer des maquettes visuelles de circuits électroniques rétro sur breadboard.	35 830	5
22	drawio	github/awesome-copilot	Générer des diagrammes draw.io natifs et les exporter en PNG intégrables.	35 830	5
23	rhino3d-scripts	github/awesome-copilot	Scripter pour Rhinoceros 3D en Python, VBScript ou C# via RhinoCommon.	35 830	5
24	image-manipulation-image-magick	github/awesome-copilot	Manipuler, redimensionner et convertir des images en lot avec ImageMagick.	35 830	5
25	nano-banana-pro-openrouter	github/awesome-copilot	Générer, éditer ou composer des images via OpenRouter avec Gemini.	35 830	5
26	generate-image	github/awesome-copilot	Générer et sauvegarder des images via OpenAI ou Google Gemini.	35 830	5
27	image-annotations	github/awesome-copilot	Annoter visuellement des images avec callouts, flèches et étiquettes via PIL.	35 830	5
28	transloadit-media-processing	github/awesome-copilot	Encoder, transformer et traiter des médias en pipeline cloud via Transloadit.	35 830	5
29	screen-recording	github/awesome-copilot	Créer des GIFs animés de démos UI avec annotations et timing variable.	35 830	5
30	video-sdk/linux	anthropics/knowledge-work-plugins	Développer des bots et applications vidéo headless avec le SDK Zoom sur Linux.	22 082	4
31	zoom-video-sdk-macos	anthropics/knowledge-work-plugins	Intégrer le SDK vidéo Zoom pour créer des apps macOS personnalisées.	22 082	4
32	video-sdk/web	anthropics/knowledge-work-plugins	Développer des applications vidéo personnalisées dans le navigateur avec le SDK Zoom.	22 082	4
33	video-sdk/windows	anthropics/knowledge-work-plugins	Développer des applications vidéo personnalisées sur Windows avec le SDK Zoom.	22 082	4
34	speech	openai/skills	Générer des clips audio parlés, en mode simple ou batch, via un CLI dédié.	22 951	3
35	transcribe	openai/skills	Transcrire des fichiers audio avec identification optionnelle des locuteurs via OpenAI.	22 951	3
36	imagegen	openai/skills	Générer ou éditer des images pour un projet via outil intégré ou CLI.	22 951	3
37	hatch-pet	openai/skills	Créer un pet animé compatible Codex depuis un concept ou des images de référence.	22 951	3
38	azure-ai-transcription-py	microsoft/skills	Transcrire de l'audio en texte via Azure AI, en temps réel ou par lot.	2 625	2
39	azure-speech-to-text-rest-py	microsoft/skills	Transcrire des fichiers audio courts en texte via l'API REST Azure Speech.	2 625	2
40	azure-ai-voicelive-ts	microsoft/skills	Créer des assistants vocaux bidirectionnels en temps réel avec Azure AI.	2 625	2
41	podcast-generation	microsoft/skills	Générer des narrations audio réalistes à partir de texte via l'API Azure OpenAI Realtime.	2 625	2
42	remotion	google-labs-code/stitch-skills	Créer des vidéos de présentation d'applications en combinant Stitch et Remotion.	6 217	1
43	remotion-best-practices	remotion-dev/skills	Créer et animer des vidéos programmatiques avec Remotion en React.	3 813	1
44	pr-walkthrough	tldraw/tldraw	Générer une vidéo narrée de présentation d'une pull request GitHub avec sous-titres et diapositives.	48 364	1
45	macos-metal	elophanto/elophanto	Rendre des graphes massifs en 3D stéréoscopique sur Vision Pro via Metal.	82	0
46	music	elevenlabs/skills	Générer de la musique originale à partir de texte, vidéos ou plans de composition détaillés.	352	0
47	elevenlabs-transcribe	elevenlabs/skills	Transcrire de l'audio en texte avec identification des locuteurs et streaming temps réel.	352	0
48	sound-effects	elevenlabs/skills	Générer des effets sonores réalistes à partir de descriptions textuelles via ElevenLabs.	352	0
49	speech-to-text	elevenlabs/skills	Transcrire de l'audio en texte avec détection de locuteurs et horodatage précis.	352	0
50	text-to-speech	elevenlabs/skills	Convertir du texte en parole naturelle multilingue via l'API ElevenLabs.	352	0

À propos de cette sélection

Quand un agent doit produire une vidéo explicative, retailler une série d'images pour une campagne ou synthétiser une voix off en plusieurs langues, les skills génériques atteignent vite leurs limites. Cette section regroupe ce qui couvre réellement ces besoins : piloter Runway pour la génération vidéo, appeler ElevenLabs pour cloner une voix ou en produire une à partir d'un script, générer des visuels programmatiquement, manipuler du canvas ou appliquer des brand guidelines dans un workflow automatisé. Les skills media & creative ici s'adressent aux devs qui intègrent du contenu généré dans un produit. L'outillage reste hétérogène, mais un socle solide couvre déjà la majorité des cas d'usage courants, du GIF Slack automatique au diagramme généré à la volée.