LLM & Inférence

Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.

60 skills

# Skill Source Description Δ
1 open-source browser-use/browser-use Automatiser la navigation web en Python avec des agents IA configurables. 100 973 8
2 adding-model-support nvidia/skills Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. 1 960 8
3 deployment nvidia/skills Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. 1 960 8
4 launching-evals nvidia/skills Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. 1 960 8
5 byob nvidia/skills Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. 1 960 8
6 ad-graph-dump nvidia/skills Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. 1 960 8
7 serve-config-guide nvidia/skills Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. 1 960 8
8 nemotron-voice-agent-deploy nvidia/skills Déployer un agent vocal IA conversationnel en temps réel avec NVIDIA NIMs. 1 960 8
9 rag-blueprint nvidia/skills Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés. 1 960 8
10 trtllm-serve-config-guide nvidia/skills Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. 1 960 8
11 ad-accuracy-debug nvidia/skills Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM. 1 960 8
12 rag-perf nvidia/skills Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML. 1 960 8
13 nemotron-speech nvidia/skills Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM. 1 960 8
14 jetson-package nvidia/skills Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA. 1 960 8
15 jetson-speculative-decoding nvidia/skills Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3. 1 960 8
16 langchain-architecture wshobson/agents Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. 37 258 2
17 llm-evaluation wshobson/agents Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. 37 258 2
18 agent-framework-azure-ai-py microsoft/skills Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. 2 624 1
19 azure-ai-language-conversations-py microsoft/skills Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié. 2 624 1
20 azure-ai-projects-py microsoft/skills Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python. 2 624 1
21 arize-instrumentation github/awesome-copilot Instrumenter une application avec le tracing Arize AX via une analyse guidée. 35 826 1
22 phoenix-evals github/awesome-copilot Construire et valider des évaluateurs LLM pour applications IA en production. 35 826 1
23 phoenix-tracing github/awesome-copilot Instrumenter des applications LLM avec Phoenix via le tracing OpenInference. 35 826 1
24 agentic-eval github/awesome-copilot Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA. 35 826 1
25 eval-driven-dev github/awesome-copilot Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. 35 826 1
26 gemini-api-dev google-gemini/gemini-skills Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. 3 712 1
27 gemini-live-api-dev google-gemini/gemini-skills Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. 3 712 1
28 hf-mcp huggingface/skills Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU. 10 736 0
29 hf-cli huggingface/skills Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. 10 736 0
30 huggingface-paper-publisher huggingface/skills Publier, gérer et lier des articles de recherche sur Hugging Face Hub. 10 736 0
31 developing-genkit-python firebase/agent-skills Construire des applications IA en Python avec le SDK Genkit et Google Gemini. 363 0
32 eval-bootstrap datadog-labs/agent-skills Générer du code d'évaluation Python à partir de traces de production LLM Datadog. 136 0
33 experiment-analyzer datadog-labs/agent-skills Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements. 136 0
34 deep-agents-core langchain-ai/langchain-skills Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches. 827 0
35 langchain-dependencies langchain-ai/langchain-skills Configurer les dépendances LangChain selon les versions et cas d'usage requis. 827 0
36 langchain-fundamentals langchain-ai/langchain-skills Construire des agents IA production avec create_agent(), middleware et décorateur @tool. 827 0
37 langchain-middleware langchain-ai/langchain-skills Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain. 827 0
38 langchain-rag langchain-ai/langchain-skills Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes. 827 0
39 langgraph-fundamentals langchain-ai/langchain-skills Concevoir et gérer des graphes d'agents LangGraph avec état et reducers. 827 0
40 langgraph-human-in-the-loop langchain-ai/langchain-skills Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines. 827 0
41 langgraph-persistence langchain-ai/langchain-skills Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. 827 0
42 omnibus-instrument-llm-analytics posthog/skills Intégrer PostHog pour tracer et analyser les appels LLM dans n'importe quel projet IA. 48 0
43 guardrails-ai mkurman/zorai Valider et sécuriser les sorties de LLMs avec des contraintes structurées. 315 0
44 huggingface-tgi mkurman/zorai Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible. 315 0
45 hypogenic mkurman/zorai Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature. 315 0
46 langgraph mkurman/zorai Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants. 315 0
47 lighteval mkurman/zorai Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables. 315 0
48 llama-cpp mkurman/zorai Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python. 315 0
49 lm-evaluation-harness mkurman/zorai Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée. 315 0
50 nvidia-nemo-guardrails mkurman/zorai Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo. 315 0

À propos de cette sélection

L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle. Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.