LLM & Inférence

Fournisseurs LLM et inference : Anthropic, OpenAI, Hugging Face, agents conversationnels.

129 skills

#	Skill	Source	Description		Maj
1	claude-api	anthropics/skills	Construire des applications LLM avec Claude via le SDK officiel adapté au langage.	155 892	7h
2	omni-ai-optimizer	exploreomni/omni-agent-skills	Optimiser un modèle sémantique Omni pour des réponses précises de l'agent IA.	22	1j
3	ai-sdk	vercel/ai	Intégrer et utiliser correctement l'AI SDK Vercel avec APIs et modèles à jour.	25 187	2j
4	hf-cli	huggingface/skills	Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI.	10 736	2j
5	agents	elevenlabs/skills	Créer et déployer des agents IA vocaux conversationnels via ElevenLabs.	352	4j
6	neon-ai-gateway	neondatabase/agent-skills	Accéder à plusieurs LLMs via une seule API unifiée intégrée à Neon.	71	4j
7	firebase-ai-logic-basics	firebase/agent-skills	Intégrer l'IA générative Gemini dans des apps mobiles et web via Firebase.	363	5j
8	gemini-interactions-api	google-gemini/gemini-skills	Interagir avec les modèles Gemini via une API unifiée et conversationnelle.	3 712	5j
9	jetson-llm-serve	nvidia/skills	Déployer un LLM ou VLM sur Jetson avec vLLM ou SGLang via Docker.	1 960	5j
10	jetson-package	nvidia/skills	Sélectionner les conteneurs et wheels Python compatibles GPU pour appareils Jetson NVIDIA.	1 960	5j
11	jetson-speculative-decoding	nvidia/skills	Accélérer la génération de tokens vLLM sur Jetson via le décodage spéculatif EAGLE-3.	1 960	5j
12	openai-docs	openai/skills	Consulter la documentation officielle OpenAI pour guider développeurs, migrations et sélection de modèles.	22 950	10j
13	update-provider-models	vercel/ai	Mettre à jour les identifiants de modèles IA en ajoutant ou supprimant des références dans une codebase.	25 187	11j
14	ai-agent	rivet-dev/skills	Construire des agents IA conversationnels persistants avec mémoire et streaming par acteur.	17	12j
15	creating-replay-vision-scanners	posthog/skills	Créer et calibrer des scanners d'analyse de sessions avec contrôle budgétaire préalable.	48	13j
16	exploring-llm-clusters	posthog/skills	Explorer et analyser les clusters de traces LLM pour identifier des patterns dans le trafic IA.	48	13j
17	exploring-llm-costs	posthog/skills	Analyser et décomposer les coûts LLM par modèle, utilisateur ou trace dans PostHog.	48	13j
18	exploring-llm-traces	posthog/skills	Explorer et déboguer des traces LLM d'agents IA via PostHog.	48	13j
19	signals-scout-ai-observability	posthog/skills	Surveiller les anomalies d'observabilité LLM pour détecter coûts, latences et erreurs.	48	13j
20	hf-mem	huggingface/skills	Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face.	10 736	15j
21	vss-ask-video	nvidia/skills	Interroger un agent VLM pour analyser visuellement le contenu d'un clip vidéo.	1 960	16j
22	vss-ask-video	nvidia-ai-blueprints/video-search-and-summarization	Interroger une vidéo via VLM pour analyser visuellement frames, objets et actions.	1 677	17j
23	langfuse	langfuse/skills	Instrumenter, déboguer et interroger Langfuse via CLI, docs et SDK à jour.	181	17j
24	gemini-live-api-dev	google-gemini/gemini-skills	Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live.	3 712	18j
25	llm-obs-eval-pipeline	datadog-labs/agent-skills	Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production.	136	22j
26	nemotron-policy-generator	nvidia/skills	Générer des politiques de sécurité structurées pour les modèles Nemotron Content Safety de NVIDIA.	1 960	23j
27	prompt-engineering-patterns	wshobson/agents	Concevoir et optimiser des prompts avancés pour maximiser les performances des LLMs.	37 258	24j
28	llm-obs-experiment-py-bootstrap	datadog-labs/agent-skills	Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs.	136	25j
29	nemotron-speech	nvidia/skills	Déployer et configurer des pipelines ASR, TTS et NMT avec NVIDIA Riva NIM.	1 960	26j
30	rag-perf	nvidia/skills	Benchmarker les performances d'un serveur RAG via une CLI pilotée par YAML.	1 960	29j
31	rag-blueprint	nvidia/skills	Déployer, configurer et dépanner un pipeline RAG NVIDIA via des workflows automatisés.	1 960	29j
32	exploring-llm-evaluations	posthog/skills	Gérer et exécuter des évaluations LLM sur des événements de génération IA dans PostHog.	48	29j
33	nemoclaw-user-configure-inference	nvidia/skills	Configurer un sous-agent spécialisé dans un sandbox NemoClaw avec OpenClaw.	1 960	1mo
34	nemoclaw-user-overview	nvidia/skills	Naviguer l'écosystème NemoClaw, OpenShell et OpenClaw pour choisir le bon outil.	1 960	1mo
35	llm-obs-session-classify	datadog-labs/agent-skills	Classifier la satisfaction des sessions et traces LLM Observability Datadog en verdicts automatisés.	136	1mo
36	langchain-architecture	wshobson/agents	Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état.	37 258	1mo
37	llm-evaluation	wshobson/agents	Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing.	37 258	1mo
38	ad-graph-dump	nvidia/skills	Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump.	1 960	1mo
39	ad-accuracy-debug	nvidia/skills	Déboguer les écarts de précision entre AutoDeploy et le backend PyTorch de TRT-LLM.	1 960	1mo
40	adding-model-support	nvidia/skills	Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge.	1 960	1mo
41	trtllm-serve-config-guide	nvidia/skills	Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve.	1 960	1mo
42	gemini-api-dev	google-gemini/gemini-skills	Intégrer et utiliser l'API Gemini avec les SDK officiels à jour.	3 712	1mo
43	langgraph-persistence	langchain-ai/langchain-skills	Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph.	827	1mo
44	add-provider-package	vercel/ai	Créer et intégrer un nouveau package provider dans l'AI SDK Vercel.	25 187	1mo
45	prompt-optimizer	github/awesome-copilot	Transformer n'importe quelle ébauche en prompt optimisé prêt à l'emploi pour LLM.	35 826	1mo
46	arize-ai-provider-integration	github/awesome-copilot	Gérer les intégrations LLM dans Arize AI via des commandes CLI dédiées.	35 826	1mo
47	arize-evaluator	github/awesome-copilot	Concevoir et exécuter des évaluateurs LLM-as-judge sur la plateforme Arize.	35 826	1mo
48	arize-instrumentation	github/awesome-copilot	Instrumenter une application avec le tracing Arize AX via une analyse guidée.	35 826	1mo
49	arize-link	github/awesome-copilot	Générer des liens profonds vers l'interface Arize pour traces, spans, datasets et évaluateurs.	35 826	1mo
50	arize-prompt-optimization	github/awesome-copilot	Optimiser les prompts LLM en analysant les traces et signaux de performance Arize.	35 826	1mo

À propos de cette sélection

L'outillage autour des modèles de langage a mûri vite, mais de façon inégale : certaines briques sont solides, d'autres restent expérimentales ou peu documentées hors des cas standards. Les **skills llm & inférence** de cette section ciblent les devs qui passent de l'expérimentation à la mise en production réelle. Concrètement, ça parle au dev backend Python qui orchestre des appels à Claude ou à des modèles Hugging Face avec gestion fine des tokens et des coûts, et au fullstack TypeScript qui branche un agent conversationnel sur une UI existante. Les contraintes d'inférence, de latence et de traçabilité divergent vite entre ces deux profils. Les skills couvrent aussi l'évaluation de prompts et le monitoring de traces, deux angles souvent négligés dans les tutos d'entrée de gamme.