Data & IA

Skills pour LLM, bases vectorielles, training de modeles et scraping web.

789 skills

#	Skill	Source	Description		Δ
1	claude-api	anthropics/skills	Construire des applications LLM avec Claude via le SDK officiel adapté au langage.	155 898	47
2	cudaq-guide	nvidia/skills	Guider l'utilisateur dans CUDA-Q : installation, simulation GPU et accès QPU.	1 970	18
3	adding-model-support	nvidia/skills	Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge.	1 970	18
4	mlm-bridge-training	nvidia/skills	Comparer et valider les pertes entre Megatron-LM et Bridge sur GPU.	1 970	18
5	parity-testing	nvidia/skills	Vérifier la parité des poids et des passes avant entre modèles HF et Megatron.	1 970	18
6	perf-activation-recompute	nvidia/skills	Optimiser la mémoire GPU en recomputant sélectivement les activations pendant la rétropropagation.	1 970	18
7	perf-cpu-offloading	nvidia/skills	Décharger activations ou états d'optimiseur du GPU vers le CPU pour économiser de la mémoire.	1 970	18
8	perf-cuda-graphs	nvidia/skills	Configurer et optimiser les CUDA graphs GPU pour accélérer l'entraînement de modèles.	1 970	18
9	perf-expert-parallel-overlap	nvidia/skills	Masquer la latence des communications all-to-all dans les modèles MoE via un chevauchement calcul/communication.	1 970	18
10	perf-hybrid-context-parallel	nvidia/skills	Configurer le parallélisme de contexte hybride hiérarchique pour l'entraînement distribué de LLMs.	1 970	18
11	perf-megatron-fsdp	nvidia/skills	Configurer et valider l'entraînement distribué avec Megatron FSDP dans Bridge.	1 970	18
12	perf-memory-tuning	nvidia/skills	Optimiser la mémoire GPU pour éviter les erreurs OOM lors de l'entraînement de modèles.	1 970	18
13	perf-moe-comm-overlap	nvidia/skills	Activer et configurer le chevauchement des communications MoE en parallélisme expert.	1 970	18
14	perf-moe-dispatcher-selection	nvidia/skills	Sélectionner le dispatcher MoE optimal selon le matériel, le modèle et le degré EP.	1 970	18
15	perf-moe-hardware-configs	nvidia/skills	Configurer les paramètres matériels optimaux pour entraîner des modèles MoE sur GPU.	1 970	18
16	perf-moe-long-context	nvidia/skills	Optimiser l'entraînement long-contexte des modèles MoE avec parallélisme et recompute.	1 970	18
17	perf-moe-optimization-workflow	nvidia/skills	Optimiser l'entraînement de modèles MoE en gérant mémoire, communication et calcul.	1 970	18
18	perf-moe-vlm-training	nvidia/skills	Optimiser l'entraînement de VLM MoE avec FSDP ou parallélisme 3D.	1 970	18
19	perf-parallelism-strategies	nvidia/skills	Sélectionner la stratégie de parallélisme optimale selon la taille du modèle et le matériel.	1 970	18
20	perf-sequence-packing	nvidia/skills	Configurer le packing de séquences pour le finetuning LLM et VLM optimisé.	1 970	18
21	perf-tp-dp-comm-overlap	nvidia/skills	Configurer le chevauchement des communications TP/DP/PP pour optimiser l'entraînement distribué.	1 970	18
22	recipe-recommender	nvidia/skills	Indexer les recettes d'entraînement et recommander la configuration optimale pour LLM.	1 970	18
23	resiliency	nvidia/skills	Configurer la tolérance aux pannes, détection de stragglers et préemption pour entraînements distribués.	1 970	18
24	accessing-mlflow	nvidia/skills	Interroger et comparer des runs MLflow via langage naturel et MCP.	1 970	18
25	deployment	nvidia/skills	Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI.	1 970	18
26	evaluation	nvidia/skills	Générer et exécuter des configurations YAML d'évaluation de modèles LLM via NeMo Evaluator.	1 970	18
27	launching-evals	nvidia/skills	Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator.	1 970	18
28	ptq	nvidia/skills	Quantifier un modèle pré-entraîné en checkpoint optimisé via ModelOpt PTQ.	1 970	18
29	nel-assistant	nvidia/skills	Générer et exécuter des configurations YAML d'évaluation de modèles via NeMo Evaluator.	1 970	18
30	byob	nvidia/skills	Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator.	1 970	18
31	ad-graph-dump	nvidia/skills	Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump.	1 970	18
32	ad-model-onboard	nvidia/skills	Automatiser l'intégration de modèles HuggingFace dans AutoDeploy avec tests et rapport.	1 970	18
33	exec-local-compile	nvidia/skills	Compiler TensorRT-LLM depuis les sources sur un nœud de calcul avec GPU.	1 970	18
34	kernel-triton-writing	nvidia/skills	Écrire des kernels Triton corrects, performants et précis pour agents IA.	1 970	18
35	add-benchmark	nvidia/skills	Intégrer un benchmark natif ou externe dans le framework NeMo-Gym.	1 970	18
36	nemoclaw-user-configure-inference	nvidia/skills	Configurer un sous-agent spécialisé dans un sandbox NemoClaw avec OpenClaw.	1 970	18
37	nemoclaw-user-overview	nvidia/skills	Naviguer l'écosystème NemoClaw, OpenShell et OpenClaw pour choisir le bon outil.	1 970	18
38	ad-add-fusion-transformation	nvidia/skills	Ajouter, étendre ou auditer un pass de fusion dans AutoDeploy de TensorRT-LLM.	1 970	18
39	kernel-cute-writing	nvidia/skills	Développer des kernels GPU optimisés en Python via JIT compilation CUDA avec CUTLASS.	1 970	18
40	kernel-tileir-optimization	nvidia/skills	Optimiser des kernels Triton existants pour le backend TileIR de Blackwell GPUs.	1 970	18
41	perf-analysis	nvidia/skills	Analyser les performances GPU en classifiant les goulots d'étranglement et produisant des rapports structurés.	1 970	18
42	perf-host-optimization	nvidia/skills	Détecter et optimiser automatiquement les goulots d'étranglement CPU dans TensorRT-LLM.	1 970	18
43	perf-optimization	nvidia/skills	Coordonner des spécialistes GPU pour optimiser et valider les performances de kernels.	1 970	18
44	perf-torch-cuda-graphs	nvidia/skills	Optimiser les workloads PyTorch en capturant et rejouant des séquences GPU via CUDA Graphs.	1 970	18
45	perf-torch-sync-free	nvidia/skills	Écrire du code PyTorch asynchrone en éliminant les synchronisations CPU-GPU inutiles.	1 970	18
46	serve-config-guide	nvidia/skills	Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve.	1 970	18
47	cuopt-installation-api-python	nvidia/skills	Installer cuOpt via pip, conda ou Docker pour optimiser des routes en Python.	1 970	18
48	cuopt-lp-milp-api-c	nvidia/skills	Résoudre des problèmes LP/MILP avec l'API C de cuOpt via CSR sparse.	1 970	18
49	cuopt-lp-milp-api-cli	nvidia/skills	Résoudre des problèmes LP/MILP via CLI avec des fichiers MPS et cuOpt.	1 970	18
50	cuopt-lp-milp-api-python	nvidia/skills	Modéliser et résoudre des programmes linéaires LP/MILP avec le solveur GPU cuOpt.	1 970	18

À propos de cette sélection

L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.