LLM & Inférence
Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.
| # | Skill | Source | Description | Maj | |
|---|---|---|---|---|---|
| 1 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 736 | 2j |
| 2 | jetson-package | nvidia/skills | Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA. | 1 960 | 5j |
| 3 | jetson-speculative-decoding | nvidia/skills | Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3. | 1 960 | 5j |
| 4 | hf-mem | huggingface/skills | Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face. | 10 736 | 15j |
| 5 | gemini-live-api-dev | google-gemini/gemini-skills | Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. | 3 712 | 18j |
| 6 | llm-obs-eval-pipeline | datadog-labs/agent-skills | Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production. | 136 | 22j |
| 7 | llm-obs-experiment-py-bootstrap | datadog-labs/agent-skills | Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs. | 136 | 25j |
| 8 | nemotron-speech | nvidia/skills | Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM. | 1 960 | 26j |
| 9 | rag-perf | nvidia/skills | Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML. | 1 960 | 29j |
| 10 | rag-blueprint | nvidia/skills | Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés. | 1 960 | 29j |
| 11 | llm-obs-session-classify | datadog-labs/agent-skills | Classifier la satisfaction des sessions et traces LLM Observability Datadog en verdicts automatisés. | 136 | 1mo |
| 12 | langchain-architecture | wshobson/agents | Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. | 37 258 | 1mo |
| 13 | llm-evaluation | wshobson/agents | Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. | 37 258 | 1mo |
| 14 | ad-graph-dump | nvidia/skills | Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. | 1 960 | 1mo |
| 15 | ad-accuracy-debug | nvidia/skills | Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM. | 1 960 | 1mo |
| 16 | adding-model-support | nvidia/skills | Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. | 1 960 | 1mo |
| 17 | trtllm-serve-config-guide | nvidia/skills | Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. | 1 960 | 1mo |
| 18 | gemini-api-dev | google-gemini/gemini-skills | Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. | 3 712 | 1mo |
| 19 | langgraph-persistence | langchain-ai/langchain-skills | Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. | 827 | 1mo |
| 20 | arize-instrumentation | github/awesome-copilot | Instrumenter une application avec le tracing Arize AX via une analyse guidée. | 35 826 | 1mo |
| 21 | byob | nvidia/skills | Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. | 1 960 | 1mo |
| 22 | experiment-analyzer | datadog-labs/agent-skills | Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements. | 136 | 1mo |
| 23 | eval-bootstrap | datadog-labs/agent-skills | Générer du code d'évaluation Python à partir de traces de production LLM Datadog. | 136 | 1mo |
| 24 | textarena | mkurman/zorai | Évaluer et entraîner des LLMs via 100+ jeux textuels multi-agents compétitifs. | 315 | 1mo |
| 25 | lighteval | mkurman/zorai | Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables. | 315 | 1mo |
| 26 | lm-evaluation-harness | mkurman/zorai | Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée. | 315 | 1mo |
| 27 | openai-evals | mkurman/zorai | Évaluer systématiquement la qualité des LLMs via un framework de tests et régression. | 315 | 1mo |
| 28 | sglang | mkurman/zorai | Déployer et interroger des LLMs avec génération structurée et cache de préfixes optimisé. | 315 | 1mo |
| 29 | vllm | mkurman/zorai | Déployer des LLMs avec inférence rapide et API compatible OpenAI via vLLM. | 315 | 1mo |
| 30 | guardrails-ai | mkurman/zorai | Valider et sécuriser les sorties de LLMs avec des contraintes structurées. | 315 | 1mo |
| 31 | huggingface-tgi | mkurman/zorai | Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible. | 315 | 1mo |
| 32 | langgraph | mkurman/zorai | Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants. | 315 | 1mo |
| 33 | llama-cpp | mkurman/zorai | Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python. | 315 | 1mo |
| 34 | nvidia-nemo-guardrails | mkurman/zorai | Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo. | 315 | 1mo |
| 35 | ollama | mkurman/zorai | Exécuter des LLMs localement avec accélération GPU et API compatible OpenAI. | 315 | 1mo |
| 36 | transformers | mkurman/zorai | Charger, inférer et affiner des modèles pré-entraînés via Hugging Face Transformers. | 315 | 1mo |
| 37 | hypogenic | mkurman/zorai | Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature. | 315 | 1mo |
| 38 | deep-agents-core | langchain-ai/langchain-skills | Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches. | 827 | 1mo |
| 39 | langchain-dependencies | langchain-ai/langchain-skills | Configurer les dépendances LangChain selon les versions et cas d'usage requis. | 827 | 1mo |
| 40 | langchain-fundamentals | langchain-ai/langchain-skills | Construire des agents IA production avec create_agent(), middleware et décorateur @tool. | 827 | 1mo |
| 41 | langchain-middleware | langchain-ai/langchain-skills | Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain. | 827 | 1mo |
| 42 | langchain-rag | langchain-ai/langchain-skills | Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes. | 827 | 1mo |
| 43 | langgraph-fundamentals | langchain-ai/langchain-skills | Concevoir et gérer des graphes d'agents LangGraph avec état et reducers. | 827 | 1mo |
| 44 | langgraph-human-in-the-loop | langchain-ai/langchain-skills | Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines. | 827 | 1mo |
| 45 | deployment | nvidia/skills | Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. | 1 960 | 2mo |
| 46 | launching-evals | nvidia/skills | Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. | 1 960 | 2mo |
| 47 | eval-driven-dev | github/awesome-copilot | Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. | 35 826 | 2mo |
| 48 | agent-framework-azure-ai-py | microsoft/skills | Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. | 2 624 | 2mo |
| 49 | azure-ai-projects-py | microsoft/skills | Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python. | 2 624 | 2mo |
| 50 | developing-genkit-python | firebase/agent-skills | Construire des applications IA en Python avec le SDK Genkit et Google Gemini. | 363 | 2mo |
À propos de cette sélection
L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle.
Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.