LLM & Inférence

Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.

60 skills

#	Skill	Source	Description		Δ
1	open-source	browser-use/browser-use	Automatiser la navigation web en Python avec des agents IA configurables.	100 973	8
2	adding-model-support	nvidia/skills	Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge.	1 960	8
3	deployment	nvidia/skills	Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI.	1 960	8
4	launching-evals	nvidia/skills	Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator.	1 960	8
5	byob	nvidia/skills	Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator.	1 960	8
6	ad-graph-dump	nvidia/skills	Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump.	1 960	8
7	serve-config-guide	nvidia/skills	Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve.	1 960	8
8	nemotron-voice-agent-deploy	nvidia/skills	Déployer un agent vocal IA conversationnel en temps réel avec NVIDIA NIMs.	1 960	8
9	rag-blueprint	nvidia/skills	Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés.	1 960	8
10	trtllm-serve-config-guide	nvidia/skills	Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve.	1 960	8
11	ad-accuracy-debug	nvidia/skills	Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM.	1 960	8
12	rag-perf	nvidia/skills	Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML.	1 960	8
13	nemotron-speech	nvidia/skills	Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM.	1 960	8
14	jetson-package	nvidia/skills	Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA.	1 960	8
15	jetson-speculative-decoding	nvidia/skills	Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3.	1 960	8
16	langchain-architecture	wshobson/agents	Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état.	37 258	2
17	llm-evaluation	wshobson/agents	Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing.	37 258	2
18	agent-framework-azure-ai-py	microsoft/skills	Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation.	2 624	1
19	azure-ai-language-conversations-py	microsoft/skills	Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié.	2 624	1
20	azure-ai-projects-py	microsoft/skills	Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python.	2 624	1
21	arize-instrumentation	github/awesome-copilot	Instrumenter une application avec le tracing Arize AX via une analyse guidée.	35 826	1
22	phoenix-evals	github/awesome-copilot	Construire et valider des évaluateurs LLM pour applications IA en production.	35 826	1
23	phoenix-tracing	github/awesome-copilot	Instrumenter des applications LLM avec Phoenix via le tracing OpenInference.	35 826	1
24	agentic-eval	github/awesome-copilot	Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA.	35 826	1
25	eval-driven-dev	github/awesome-copilot	Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM.	35 826	1
26	gemini-api-dev	google-gemini/gemini-skills	Intégrer et utiliser l'API Gemini avec les SDK officiels à jour.	3 712	1
27	gemini-live-api-dev	google-gemini/gemini-skills	Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live.	3 712	1
28	hf-mcp	huggingface/skills	Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU.	10 736	0
29	hf-cli	huggingface/skills	Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI.	10 736	0
30	huggingface-paper-publisher	huggingface/skills	Publier, gérer et lier des articles de recherche sur Hugging Face Hub.	10 736	0
31	developing-genkit-python	firebase/agent-skills	Construire des applications IA en Python avec le SDK Genkit et Google Gemini.	363	0
32	eval-bootstrap	datadog-labs/agent-skills	Générer du code d'évaluation Python à partir de traces de production LLM Datadog.	136	0
33	experiment-analyzer	datadog-labs/agent-skills	Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements.	136	0
34	deep-agents-core	langchain-ai/langchain-skills	Créer des agents IA multi-étapes avec planification, mémoire persistante et délégation de tâches.	827	0
35	langchain-dependencies	langchain-ai/langchain-skills	Configurer les dépendances LangChain selon les versions et cas d'usage requis.	827	0
36	langchain-fundamentals	langchain-ai/langchain-skills	Construire des agents IA production avec create_agent(), middleware et décorateur @tool.	827	0
37	langchain-middleware	langchain-ai/langchain-skills	Implémenter des middlewares HITL pour approuver, modifier ou rejeter les appels d'outils d'agents LangChain.	827	0
38	langchain-rag	langchain-ai/langchain-skills	Construire un pipeline RAG complet pour enrichir les réponses LLM avec des sources externes.	827	0
39	langgraph-fundamentals	langchain-ai/langchain-skills	Concevoir et gérer des graphes d'agents LangGraph avec état et reducers.	827	0
40	langgraph-human-in-the-loop	langchain-ai/langchain-skills	Implémenter des pauses interactives dans un graphe LangGraph pour valider des actions humaines.	827	0
41	langgraph-persistence	langchain-ai/langchain-skills	Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph.	827	0
42	omnibus-instrument-llm-analytics	posthog/skills	Intégrer PostHog pour tracer et analyser les appels LLM dans n'importe quel projet IA.	48	0
43	guardrails-ai	mkurman/zorai	Valider et sécuriser les sorties de LLMs avec des contraintes structurées.	315	0
44	huggingface-tgi	mkurman/zorai	Déployer un serveur LLM optimisé via Hugging Face TGI avec API OpenAI-compatible.	315	0
45	hypogenic	mkurman/zorai	Générer et tester automatiquement des hypothèses scientifiques à partir de données et de littérature.	315	0
46	langgraph	mkurman/zorai	Orchestrer des workflows d'agents multi-étapes sous forme de graphes conditionnels persistants.	315	0
47	lighteval	mkurman/zorai	Évaluer des LLMs sur 1000+ tâches multilingues avec métriques personnalisables.	315	0
48	llama-cpp	mkurman/zorai	Exécuter des LLMs localement en CPU ou GPU via llama.cpp et llama-cpp-python.	315	0
49	lm-evaluation-harness	mkurman/zorai	Évaluer des LLMs sur 200+ benchmarks standardisés via une interface unifiée.	315	0
50	nvidia-nemo-guardrails	mkurman/zorai	Implémenter des garde-fous programmables pour modérer et contrôler les LLM avec NeMo.	315	0

À propos de cette sélection

L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle. Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.