LLM & Inférence
Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.
| # | Skill | Source | Description | Maj | |
|---|---|---|---|---|---|
| 1 | claude-api | anthropics/skills | Construire des applications LLM avec Claude via le SDK officiel adapté au langage. | 155 892 | 7h |
| 2 | omni-ai-optimizer | exploreomni/omni-agent-skills | Optimiser un modèle sémantique Omni pour des réponses précises de l'agent IA. | 22 | 1j |
| 3 | ai-sdk | vercel/ai | Intégrer et utiliser correctement l'AI SDK Vercel avec APIs et modèles à jour. | 25 187 | 2j |
| 4 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 736 | 2j |
| 5 | agents | elevenlabs/skills | Créer et déployer des agents IA vocaux conversationnels via ElevenLabs. | 352 | 4j |
| 6 | neon-ai-gateway | neondatabase/agent-skills | Accéder à plusieurs LLMs via une seule API unifiée intégrée à Neon. | 71 | 4j |
| 7 | firebase-ai-logic-basics | firebase/agent-skills | Intégrer l'IA générative Gemini dans des apps mobiles et web via Firebase. | 363 | 5j |
| 8 | gemini-interactions-api | google-gemini/gemini-skills | Interagir avec les modèles Gemini via une API unifiée et conversationnelle. | 3 712 | 5j |
| 9 | jetson-llm-serve | nvidia/skills | Déployer un LLM ou VLM sur Jetson avec vLLM ou SGLang via Docker. | 1 960 | 5j |
| 10 | jetson-package | nvidia/skills | Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA. | 1 960 | 5j |
| 11 | jetson-speculative-decoding | nvidia/skills | Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3. | 1 960 | 5j |
| 12 | openai-docs | openai/skills | Consulter la documentation officielle OpenAI pour guider développeurs, migrations et sélection de modèles. | 22 950 | 10j |
| 13 | update-provider-models | vercel/ai | Mettre à jour les identifiants de modèles IA en ajoutant ou supprimant des références dans une codebase. | 25 187 | 11j |
| 14 | ai-agent | rivet-dev/skills | Construire des agents IA conversationnels persistants avec mémoire et streaming par acteur. | 17 | 12j |
| 15 | creating-replay-vision-scanners | posthog/skills | Créer et calibrer des scanners d'analyse de sessions avec contrôle budgétaire préalable. | 48 | 13j |
| 16 | exploring-llm-clusters | posthog/skills | Explorer et analyser les clusters de traces LLM pour identifier des patterns dans le trafic IA. | 48 | 13j |
| 17 | exploring-llm-costs | posthog/skills | Analyser et décomposer les coûts LLM par modèle, utilisateur ou trace dans PostHog. | 48 | 13j |
| 18 | exploring-llm-traces | posthog/skills | Explorer et déboguer des traces LLM d'agents IA via PostHog. | 48 | 13j |
| 19 | signals-scout-ai-observability | posthog/skills | Surveiller les anomalies d'observabilité LLM pour détecter coûts, latences et erreurs. | 48 | 13j |
| 20 | hf-mem | huggingface/skills | Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face. | 10 736 | 15j |
| 21 | vss-ask-video | nvidia/skills | Interroger un agent VLM pour analyser visuellement le contenu d'un clip vidéo. | 1 960 | 16j |
| 22 | vss-ask-video | nvidia-ai-blueprints/video-search-and-summarization | Interroger une vidéo via VLM pour analyser visuellement frames, objets et actions. | 1 677 | 17j |
| 23 | langfuse | langfuse/skills | Instrumenter, déboguer et interroger Langfuse via CLI, docs et SDK à jour. | 181 | 17j |
| 24 | gemini-live-api-dev | google-gemini/gemini-skills | Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. | 3 712 | 18j |
| 25 | llm-obs-eval-pipeline | datadog-labs/agent-skills | Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production. | 136 | 22j |
| 26 | nemotron-policy-generator | nvidia/skills | Générer des politiques de sécurité structurées pour les modèles Nemotron Content Safety de NVIDIA. | 1 960 | 23j |
| 27 | prompt-engineering-patterns | wshobson/agents | Concevoir et optimiser des prompts avancés pour maximiser les performances des LLMs. | 37 258 | 24j |
| 28 | llm-obs-experiment-py-bootstrap | datadog-labs/agent-skills | Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs. | 136 | 25j |
| 29 | nemotron-speech | nvidia/skills | Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM. | 1 960 | 26j |
| 30 | rag-perf | nvidia/skills | Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML. | 1 960 | 29j |
| 31 | rag-blueprint | nvidia/skills | Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés. | 1 960 | 29j |
| 32 | exploring-llm-evaluations | posthog/skills | Gérer et exécuter des évaluations LLM sur des événements de génération IA dans PostHog. | 48 | 29j |
| 33 | nemoclaw-user-configure-inference | nvidia/skills | Configurer un sous-agent spécialisé dans un sandbox NemoClaw avec OpenClaw. | 1 960 | 1mo |
| 34 | nemoclaw-user-overview | nvidia/skills | Naviguer l'écosystème NemoClaw, OpenShell et OpenClaw pour choisir le bon outil. | 1 960 | 1mo |
| 35 | llm-obs-session-classify | datadog-labs/agent-skills | Classifier la satisfaction des sessions et traces LLM Observability Datadog en verdicts automatisés. | 136 | 1mo |
| 36 | langchain-architecture | wshobson/agents | Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. | 37 258 | 1mo |
| 37 | llm-evaluation | wshobson/agents | Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. | 37 258 | 1mo |
| 38 | ad-graph-dump | nvidia/skills | Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. | 1 960 | 1mo |
| 39 | ad-accuracy-debug | nvidia/skills | Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM. | 1 960 | 1mo |
| 40 | adding-model-support | nvidia/skills | Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. | 1 960 | 1mo |
| 41 | trtllm-serve-config-guide | nvidia/skills | Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. | 1 960 | 1mo |
| 42 | gemini-api-dev | google-gemini/gemini-skills | Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. | 3 712 | 1mo |
| 43 | langgraph-persistence | langchain-ai/langchain-skills | Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. | 827 | 1mo |
| 44 | add-provider-package | vercel/ai | Créer et intégrer un nouveau package provider dans l'AI SDK Vercel. | 25 187 | 1mo |
| 45 | prompt-optimizer | github/awesome-copilot | Transformer n'importe quelle ébauche en prompt optimisé prêt à l'emploi pour LLM. | 35 826 | 1mo |
| 46 | arize-ai-provider-integration | github/awesome-copilot | Gérer les intégrations LLM dans Arize AI via des commandes CLI dédiées. | 35 826 | 1mo |
| 47 | arize-evaluator | github/awesome-copilot | Concevoir et exécuter des évaluateurs LLM-as-judge sur la plateforme Arize. | 35 826 | 1mo |
| 48 | arize-instrumentation | github/awesome-copilot | Instrumenter une application avec le tracing Arize AX via une analyse guidée. | 35 826 | 1mo |
| 49 | arize-link | github/awesome-copilot | Générer des liens profonds vers l'interface Arize pour traces, spans, datasets et évaluateurs. | 35 826 | 1mo |
| 50 | arize-prompt-optimization | github/awesome-copilot | Optimiser les prompts LLM en analysant les traces et signaux de performance Arize. | 35 826 | 1mo |
À propos de cette sélection
L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle.
Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.