LLM & Inférence

Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.

60 skills

#	Skill	Source	Description		Maj
1	hf-cli	huggingface/skills	Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI.	10 736	2j
2	jetson-package	nvidia/skills	Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA.	1 960	5j
3	jetson-speculative-decoding	nvidia/skills	Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3.	1 960	5j
4	hf-mem	huggingface/skills	Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face.	10 736	15j
5	gemini-live-api-dev	google-gemini/gemini-skills	Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live.	3 712	18j
6	llm-obs-eval-pipeline	datadog-labs/agent-skills	Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production.	136	22j
7	llm-obs-experiment-py-bootstrap	datadog-labs/agent-skills	Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs.	136	25j
8	nemotron-speech	nvidia/skills	Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM.	1 960	26j
9	rag-perf	nvidia/skills	Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML.	1 960	29j
10	rag-blueprint	nvidia/skills	Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés.	1 960	29j
11	llm-obs-session-classify	datadog-labs/agent-skills	Classifier la satisfaction des sessions et traces LLM Observability Datadog en verdicts automatisés.	136	1mo
12	langchain-architecture	wshobson/agents	Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état.	37 258	1mo
13	llm-evaluation	wshobson/agents	Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing.	37 258	1mo
14	ad-graph-dump	nvidia/skills	Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump.	1 960	1mo
15	ad-accuracy-debug	nvidia/skills	Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM.	1 960	1mo
16	adding-model-support	nvidia/skills	Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge.	1 960	1mo
17	trtllm-serve-config-guide	nvidia/skills	Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve.	1 960	1mo
18	gemini-api-dev	google-gemini/gemini-skills	Intégrer et utiliser l'API Gemini avec les SDK officiels à jour.	3 712	1mo
19	langgraph-persistence	langchain-ai/langchain-skills	Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph.	827	1mo
20	arize-instrumentation	github/awesome-copilot	Instrumenter une application avec le tracing Arize AX via une analyse guidée.	35 826	1mo
21	byob	nvidia/skills	Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator.	1 960	1mo
22	experiment-analyzer	datadog-labs/agent-skills	Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements.	136	1mo
23	eval-bootstrap	datadog-labs/agent-skills	Générer du code d'évaluation Python à partir de traces de production LLM Datadog.	136	1mo
24	textarena	mkurman/zorai	Évaluer et entraîner des LLMs via 100+ jeux textuels multi-agents compétitifs.	315	1mo
25	lighteval	mkurman/zorai	Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables.	315	1mo
26	lm-evaluation-harness	mkurman/zorai	Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée.	315	1mo
27	openai-evals	mkurman/zorai	Évaluer systématiquement la qualité des LLMs via un framework de tests et régression.	315	1mo
28	sglang	mkurman/zorai	Déployer et interroger des LLMs avec génération structurée et cache de préfixes optimisé.	315	1mo
29	vllm	mkurman/zorai	Déployer des LLMs avec inférence rapide et API compatible OpenAI via vLLM.	315	1mo
30	guardrails-ai	mkurman/zorai	Valider et sécuriser les sorties de LLMs avec des contraintes structurées.	315	1mo
31	huggingface-tgi	mkurman/zorai	Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible.	315	1mo
32	langgraph	mkurman/zorai	Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants.	315	1mo
33	llama-cpp	mkurman/zorai	Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python.	315	1mo
34	nvidia-nemo-guardrails	mkurman/zorai	Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo.	315	1mo
35	ollama	mkurman/zorai	Exécuter des LLMs localement avec accélération GPU et API compatible OpenAI.	315	1mo
36	transformers	mkurman/zorai	Charger, inférer et affiner des modèles pré-entraînés via Hugging Face Transformers.	315	1mo
37	hypogenic	mkurman/zorai	Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature.	315	1mo
38	deep-agents-core	langchain-ai/langchain-skills	Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches.	827	1mo
39	langchain-dependencies	langchain-ai/langchain-skills	Configurer les dépendances LangChain selon les versions et cas d'usage requis.	827	1mo
40	langchain-fundamentals	langchain-ai/langchain-skills	Construire des agents IA production avec create_agent(), middleware et décorateur @tool.	827	1mo
41	langchain-middleware	langchain-ai/langchain-skills	Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain.	827	1mo
42	langchain-rag	langchain-ai/langchain-skills	Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes.	827	1mo
43	langgraph-fundamentals	langchain-ai/langchain-skills	Concevoir et gérer des graphes d'agents LangGraph avec état et reducers.	827	1mo
44	langgraph-human-in-the-loop	langchain-ai/langchain-skills	Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines.	827	1mo
45	deployment	nvidia/skills	Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI.	1 960	2mo
46	launching-evals	nvidia/skills	Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator.	1 960	2mo
47	eval-driven-dev	github/awesome-copilot	Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM.	35 826	2mo
48	agent-framework-azure-ai-py	microsoft/skills	Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation.	2 624	2mo
49	azure-ai-projects-py	microsoft/skills	Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python.	2 624	2mo
50	developing-genkit-python	firebase/agent-skills	Construire des applications IA en Python avec le SDK Genkit et Google Gemini.	363	2mo

À propos de cette sélection

L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle. Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.