LLM & Inférence
Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.
| # | Skill | Source | Description | ||
|---|---|---|---|---|---|
| 1 | open-source | browser-use/browser-use | Automatiser la navigation web en Python avec des agents IA configurables. | 100 965 | |
| 2 | langchain-architecture | wshobson/agents | Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. | 37 256 | |
| 3 | llm-evaluation | wshobson/agents | Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. | 37 256 | |
| 4 | agentic-eval | github/awesome-copilot | Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA. | 35 825 | |
| 5 | arize-instrumentation | github/awesome-copilot | Instrumenter une application avec le tracing Arize AX via une analyse guidée. | 35 825 | |
| 6 | eval-driven-dev | github/awesome-copilot | Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. | 35 825 | |
| 7 | phoenix-evals | github/awesome-copilot | Construire et valider des évaluateurs LLM pour applications IA en production. | 35 825 | |
| 8 | phoenix-tracing | github/awesome-copilot | Instrumenter des applications LLM avec Phoenix via le tracing OpenInference. | 35 825 | |
| 9 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 736 | |
| 10 | hf-mcp | huggingface/skills | Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU. | 10 736 | |
| 11 | hf-mem | huggingface/skills | Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face. | 10 736 | |
| 12 | huggingface-paper-publisher | huggingface/skills | Publier, gérer et lier des articles de recherche sur Hugging Face Hub. | 10 736 | |
| 13 | gemini-api-dev | google-gemini/gemini-skills | Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. | 3 711 | |
| 14 | gemini-live-api-dev | google-gemini/gemini-skills | Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. | 3 711 | |
| 15 | agent-framework-azure-ai-py | microsoft/skills | Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. | 2 623 | |
| 16 | azure-ai-language-conversations-py | microsoft/skills | Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié. | 2 623 | |
| 17 | azure-ai-projects-py | microsoft/skills | Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python. | 2 623 | |
| 18 | ad-accuracy-debug | nvidia/skills | Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM. | 1 952 | |
| 19 | ad-graph-dump | nvidia/skills | Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. | 1 952 | |
| 20 | adding-model-support | nvidia/skills | Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. | 1 952 | |
| 21 | byob | nvidia/skills | Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. | 1 952 | |
| 22 | deployment | nvidia/skills | Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. | 1 952 | |
| 23 | jetson-package | nvidia/skills | Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA. | 1 952 | |
| 24 | jetson-speculative-decoding | nvidia/skills | Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3. | 1 952 | |
| 25 | launching-evals | nvidia/skills | Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. | 1 952 | |
| 26 | nemotron-speech | nvidia/skills | Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM. | 1 952 | |
| 27 | nemotron-voice-agent-deploy | nvidia/skills | Déployer un agent vocal IA conversationnel en temps réel avec NVIDIA NIMs. | 1 952 | |
| 28 | rag-blueprint | nvidia/skills | Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés. | 1 952 | |
| 29 | rag-perf | nvidia/skills | Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML. | 1 952 | |
| 30 | serve-config-guide | nvidia/skills | Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. | 1 952 | |
| 31 | trtllm-serve-config-guide | nvidia/skills | Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. | 1 952 | |
| 32 | deep-agents-core | langchain-ai/langchain-skills | Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches. | 827 | |
| 33 | langchain-dependencies | langchain-ai/langchain-skills | Configurer les dépendances LangChain selon les versions et cas d'usage requis. | 827 | |
| 34 | langchain-fundamentals | langchain-ai/langchain-skills | Construire des agents IA production avec create_agent(), middleware et décorateur @tool. | 827 | |
| 35 | langchain-middleware | langchain-ai/langchain-skills | Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain. | 827 | |
| 36 | langchain-rag | langchain-ai/langchain-skills | Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes. | 827 | |
| 37 | langgraph-fundamentals | langchain-ai/langchain-skills | Concevoir et gérer des graphes d'agents LangGraph avec état et reducers. | 827 | |
| 38 | langgraph-human-in-the-loop | langchain-ai/langchain-skills | Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines. | 827 | |
| 39 | langgraph-persistence | langchain-ai/langchain-skills | Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. | 827 | |
| 40 | developing-genkit-python | firebase/agent-skills | Construire des applications IA en Python avec le SDK Genkit et Google Gemini. | 363 | |
| 41 | guardrails-ai | mkurman/zorai | Valider et sécuriser les sorties de LLMs avec des contraintes structurées. | 315 | |
| 42 | huggingface-tgi | mkurman/zorai | Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible. | 315 | |
| 43 | hypogenic | mkurman/zorai | Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature. | 315 | |
| 44 | langgraph | mkurman/zorai | Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants. | 315 | |
| 45 | lighteval | mkurman/zorai | Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables. | 315 | |
| 46 | llama-cpp | mkurman/zorai | Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python. | 315 | |
| 47 | lm-evaluation-harness | mkurman/zorai | Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée. | 315 | |
| 48 | nvidia-nemo-guardrails | mkurman/zorai | Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo. | 315 | |
| 49 | ollama | mkurman/zorai | Exécuter des LLMs localement avec accélération GPU et API compatible OpenAI. | 315 | |
| 50 | openai-evals | mkurman/zorai | Évaluer systématiquement la qualité des LLMs via un framework de tests et régression. | 315 |
À propos de cette sélection
L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle.
Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.