LLM & Inférence

Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.

60 skills

# Skill Source Description
1 open-source browser-use/browser-use Automatiser la navigation web en Python avec des agents IA configurables. 100 965
2 langchain-architecture wshobson/agents Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. 37 256
3 llm-evaluation wshobson/agents Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. 37 256
4 agentic-eval github/awesome-copilot Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA. 35 825
5 arize-instrumentation github/awesome-copilot Instrumenter une application avec le tracing Arize AX via une analyse guidée. 35 825
6 eval-driven-dev github/awesome-copilot Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. 35 825
7 phoenix-evals github/awesome-copilot Construire et valider des évaluateurs LLM pour applications IA en production. 35 825
8 phoenix-tracing github/awesome-copilot Instrumenter des applications LLM avec Phoenix via le tracing OpenInference. 35 825
9 hf-cli huggingface/skills Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. 10 736
10 hf-mcp huggingface/skills Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU. 10 736
11 hf-mem huggingface/skills Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face. 10 736
12 huggingface-paper-publisher huggingface/skills Publier, gérer et lier des articles de recherche sur Hugging Face Hub. 10 736
13 gemini-api-dev google-gemini/gemini-skills Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. 3 711
14 gemini-live-api-dev google-gemini/gemini-skills Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. 3 711
15 agent-framework-azure-ai-py microsoft/skills Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. 2 623
16 azure-ai-language-conversations-py microsoft/skills Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié. 2 623
17 azure-ai-projects-py microsoft/skills Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python. 2 623
18 ad-accuracy-debug nvidia/skills Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM. 1 952
19 ad-graph-dump nvidia/skills Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. 1 952
20 adding-model-support nvidia/skills Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. 1 952
21 byob nvidia/skills Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. 1 952
22 deployment nvidia/skills Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. 1 952
23 jetson-package nvidia/skills Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA. 1 952
24 jetson-speculative-decoding nvidia/skills Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3. 1 952
25 launching-evals nvidia/skills Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. 1 952
26 nemotron-speech nvidia/skills Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM. 1 952
27 nemotron-voice-agent-deploy nvidia/skills Déployer un agent vocal IA conversationnel en temps réel avec NVIDIA NIMs. 1 952
28 rag-blueprint nvidia/skills Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés. 1 952
29 rag-perf nvidia/skills Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML. 1 952
30 serve-config-guide nvidia/skills Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. 1 952
31 trtllm-serve-config-guide nvidia/skills Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. 1 952
32 deep-agents-core langchain-ai/langchain-skills Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches. 827
33 langchain-dependencies langchain-ai/langchain-skills Configurer les dépendances LangChain selon les versions et cas d'usage requis. 827
34 langchain-fundamentals langchain-ai/langchain-skills Construire des agents IA production avec create_agent(), middleware et décorateur @tool. 827
35 langchain-middleware langchain-ai/langchain-skills Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain. 827
36 langchain-rag langchain-ai/langchain-skills Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes. 827
37 langgraph-fundamentals langchain-ai/langchain-skills Concevoir et gérer des graphes d'agents LangGraph avec état et reducers. 827
38 langgraph-human-in-the-loop langchain-ai/langchain-skills Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines. 827
39 langgraph-persistence langchain-ai/langchain-skills Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. 827
40 developing-genkit-python firebase/agent-skills Construire des applications IA en Python avec le SDK Genkit et Google Gemini. 363
41 guardrails-ai mkurman/zorai Valider et sécuriser les sorties de LLMs avec des contraintes structurées. 315
42 huggingface-tgi mkurman/zorai Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible. 315
43 hypogenic mkurman/zorai Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature. 315
44 langgraph mkurman/zorai Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants. 315
45 lighteval mkurman/zorai Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables. 315
46 llama-cpp mkurman/zorai Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python. 315
47 lm-evaluation-harness mkurman/zorai Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée. 315
48 nvidia-nemo-guardrails mkurman/zorai Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo. 315
49 ollama mkurman/zorai Exécuter des LLMs localement avec accélération GPU et API compatible OpenAI. 315
50 openai-evals mkurman/zorai Évaluer systématiquement la qualité des LLMs via un framework de tests et régression. 315

À propos de cette sélection

L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle. Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.