LLM & Inférence

Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.

60 skills

# Skill Source Description Maj
1 hf-cli huggingface/skills Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. 10 736 2j
2 jetson-package nvidia/skills Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA. 1 960 5j
3 jetson-speculative-decoding nvidia/skills Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3. 1 960 5j
4 hf-mem huggingface/skills Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face. 10 736 15j
5 gemini-live-api-dev google-gemini/gemini-skills Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. 3 712 18j
6 llm-obs-eval-pipeline datadog-labs/agent-skills Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production. 136 22j
7 llm-obs-experiment-py-bootstrap datadog-labs/agent-skills Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs. 136 25j
8 nemotron-speech nvidia/skills Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM. 1 960 26j
9 rag-perf nvidia/skills Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML. 1 960 29j
10 rag-blueprint nvidia/skills Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés. 1 960 29j
11 llm-obs-session-classify datadog-labs/agent-skills Classifier la satisfaction des sessions et traces LLM Observability Datadog en verdicts automatisés. 136 1mo
12 langchain-architecture wshobson/agents Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. 37 258 1mo
13 llm-evaluation wshobson/agents Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. 37 258 1mo
14 ad-graph-dump nvidia/skills Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. 1 960 1mo
15 ad-accuracy-debug nvidia/skills Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM. 1 960 1mo
16 adding-model-support nvidia/skills Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. 1 960 1mo
17 trtllm-serve-config-guide nvidia/skills Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. 1 960 1mo
18 gemini-api-dev google-gemini/gemini-skills Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. 3 712 1mo
19 langgraph-persistence langchain-ai/langchain-skills Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. 827 1mo
20 arize-instrumentation github/awesome-copilot Instrumenter une application avec le tracing Arize AX via une analyse guidée. 35 826 1mo
21 byob nvidia/skills Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. 1 960 1mo
22 experiment-analyzer datadog-labs/agent-skills Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements. 136 1mo
23 eval-bootstrap datadog-labs/agent-skills Générer du code d'évaluation Python à partir de traces de production LLM Datadog. 136 1mo
24 textarena mkurman/zorai Évaluer et entraîner des LLMs via 100+ jeux textuels multi-agents compétitifs. 315 1mo
25 lighteval mkurman/zorai Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables. 315 1mo
26 lm-evaluation-harness mkurman/zorai Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée. 315 1mo
27 openai-evals mkurman/zorai Évaluer systématiquement la qualité des LLMs via un framework de tests et régression. 315 1mo
28 sglang mkurman/zorai Déployer et interroger des LLMs avec génération structurée et cache de préfixes optimisé. 315 1mo
29 vllm mkurman/zorai Déployer des LLMs avec inférence rapide et API compatible OpenAI via vLLM. 315 1mo
30 guardrails-ai mkurman/zorai Valider et sécuriser les sorties de LLMs avec des contraintes structurées. 315 1mo
31 huggingface-tgi mkurman/zorai Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible. 315 1mo
32 langgraph mkurman/zorai Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants. 315 1mo
33 llama-cpp mkurman/zorai Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python. 315 1mo
34 nvidia-nemo-guardrails mkurman/zorai Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo. 315 1mo
35 ollama mkurman/zorai Exécuter des LLMs localement avec accélération GPU et API compatible OpenAI. 315 1mo
36 transformers mkurman/zorai Charger, inférer et affiner des modèles pré-entraînés via Hugging Face Transformers. 315 1mo
37 hypogenic mkurman/zorai Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature. 315 1mo
38 deep-agents-core langchain-ai/langchain-skills Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches. 827 1mo
39 langchain-dependencies langchain-ai/langchain-skills Configurer les dépendances LangChain selon les versions et cas d'usage requis. 827 1mo
40 langchain-fundamentals langchain-ai/langchain-skills Construire des agents IA production avec create_agent(), middleware et décorateur @tool. 827 1mo
41 langchain-middleware langchain-ai/langchain-skills Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain. 827 1mo
42 langchain-rag langchain-ai/langchain-skills Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes. 827 1mo
43 langgraph-fundamentals langchain-ai/langchain-skills Concevoir et gérer des graphes d'agents LangGraph avec état et reducers. 827 1mo
44 langgraph-human-in-the-loop langchain-ai/langchain-skills Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines. 827 1mo
45 deployment nvidia/skills Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. 1 960 2mo
46 launching-evals nvidia/skills Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. 1 960 2mo
47 eval-driven-dev github/awesome-copilot Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. 35 826 2mo
48 agent-framework-azure-ai-py microsoft/skills Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. 2 624 2mo
49 azure-ai-projects-py microsoft/skills Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python. 2 624 2mo
50 developing-genkit-python firebase/agent-skills Construire des applications IA en Python avec le SDK Genkit et Google Gemini. 363 2mo

À propos de cette sélection

L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle. Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.