Data & IA
Skills pour LLM, bases vectorielles, training de modeles et scraping web.
| # | Skill | Source | Description | Δ | |
|---|---|---|---|---|---|
| 1 | claude-api | anthropics/skills | Construire des applications LLM avec Claude via le SDK officiel adapté au langage. | 155 898 | 47 |
| 2 | cudaq-guide | nvidia/skills | Guider l'utilisateur dans CUDA-Q : installation, simulation GPU et accès QPU. | 1 970 | 18 |
| 3 | adding-model-support | nvidia/skills | Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. | 1 970 | 18 |
| 4 | mlm-bridge-training | nvidia/skills | Comparer et valider les pertes entre Megatron-LM et Bridge sur GPU. | 1 970 | 18 |
| 5 | parity-testing | nvidia/skills | Vérifier la parité des poids et des passes avant entre modèles HF et Megatron. | 1 970 | 18 |
| 6 | perf-activation-recompute | nvidia/skills | Optimiser la mémoire GPU en recomputant sélectivement les activations pendant la rétropropagation. | 1 970 | 18 |
| 7 | perf-cpu-offloading | nvidia/skills | Décharger activations ou états d'optimiseur du GPU vers le CPU pour économiser de la mémoire. | 1 970 | 18 |
| 8 | perf-cuda-graphs | nvidia/skills | Configurer et optimiser les CUDA graphs GPU pour accélérer l'entraînement de modèles. | 1 970 | 18 |
| 9 | perf-expert-parallel-overlap | nvidia/skills | Masquer la latence des communications all-to-all dans les modèles MoE via un chevauchement calcul/communication. | 1 970 | 18 |
| 10 | perf-hybrid-context-parallel | nvidia/skills | Configurer le parallélisme de contexte hybride hiérarchique pour l'entraînement distribué de LLMs. | 1 970 | 18 |
| 11 | perf-megatron-fsdp | nvidia/skills | Configurer et valider l'entraînement distribué avec Megatron FSDP dans Bridge. | 1 970 | 18 |
| 12 | perf-memory-tuning | nvidia/skills | Optimiser la mémoire GPU pour éviter les erreurs OOM lors de l'entraînement de modèles. | 1 970 | 18 |
| 13 | perf-moe-comm-overlap | nvidia/skills | Activer et configurer le chevauchement des communications MoE en parallélisme expert. | 1 970 | 18 |
| 14 | perf-moe-dispatcher-selection | nvidia/skills | Sélectionner le dispatcher MoE optimal selon le matériel, le modèle et le degré EP. | 1 970 | 18 |
| 15 | perf-moe-hardware-configs | nvidia/skills | Configurer les paramètres matériels optimaux pour entraîner des modèles MoE sur GPU. | 1 970 | 18 |
| 16 | perf-moe-long-context | nvidia/skills | Optimiser l'entraînement long-contexte des modèles MoE avec parallélisme et recompute. | 1 970 | 18 |
| 17 | perf-moe-optimization-workflow | nvidia/skills | Optimiser l'entraînement de modèles MoE en gérant mémoire, communication et calcul. | 1 970 | 18 |
| 18 | perf-moe-vlm-training | nvidia/skills | Optimiser l'entraînement de VLM MoE avec FSDP ou parallélisme 3D. | 1 970 | 18 |
| 19 | perf-parallelism-strategies | nvidia/skills | Sélectionner la stratégie de parallélisme optimale selon la taille du modèle et le matériel. | 1 970 | 18 |
| 20 | perf-sequence-packing | nvidia/skills | Configurer le packing de séquences pour le finetuning LLM et VLM optimisé. | 1 970 | 18 |
| 21 | perf-tp-dp-comm-overlap | nvidia/skills | Configurer le chevauchement des communications TP/DP/PP pour optimiser l'entraînement distribué. | 1 970 | 18 |
| 22 | recipe-recommender | nvidia/skills | Indexer les recettes d'entraînement et recommander la configuration optimale pour LLM. | 1 970 | 18 |
| 23 | resiliency | nvidia/skills | Configurer la tolérance aux pannes, détection de stragglers et préemption pour entraînements distribués. | 1 970 | 18 |
| 24 | accessing-mlflow | nvidia/skills | Interroger et comparer des runs MLflow via langage naturel et MCP. | 1 970 | 18 |
| 25 | deployment | nvidia/skills | Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. | 1 970 | 18 |
| 26 | evaluation | nvidia/skills | Générer et exécuter des configurations YAML d'évaluation de modèles LLM via NeMo Evaluator. | 1 970 | 18 |
| 27 | launching-evals | nvidia/skills | Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. | 1 970 | 18 |
| 28 | ptq | nvidia/skills | Quantifier un modèle pré-entraîné en checkpoint optimisé via ModelOpt PTQ. | 1 970 | 18 |
| 29 | nel-assistant | nvidia/skills | Générer et exécuter des configurations YAML d'évaluation de modèles via NeMo Evaluator. | 1 970 | 18 |
| 30 | byob | nvidia/skills | Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. | 1 970 | 18 |
| 31 | ad-graph-dump | nvidia/skills | Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. | 1 970 | 18 |
| 32 | ad-model-onboard | nvidia/skills | Automatiser l'intégration de modèles HuggingFace dans AutoDeploy avec tests et rapport. | 1 970 | 18 |
| 33 | exec-local-compile | nvidia/skills | Compiler TensorRT-LLM depuis les sources sur un nœud de calcul avec GPU. | 1 970 | 18 |
| 34 | kernel-triton-writing | nvidia/skills | Écrire des kernels Triton corrects, performants et précis pour agents IA. | 1 970 | 18 |
| 35 | add-benchmark | nvidia/skills | Intégrer un benchmark natif ou externe dans le framework NeMo-Gym. | 1 970 | 18 |
| 36 | nemoclaw-user-configure-inference | nvidia/skills | Configurer un sous-agent spécialisé dans un sandbox NemoClaw avec OpenClaw. | 1 970 | 18 |
| 37 | nemoclaw-user-overview | nvidia/skills | Naviguer l'écosystème NemoClaw, OpenShell et OpenClaw pour choisir le bon outil. | 1 970 | 18 |
| 38 | ad-add-fusion-transformation | nvidia/skills | Ajouter, étendre ou auditer un pass de fusion dans AutoDeploy de TensorRT-LLM. | 1 970 | 18 |
| 39 | kernel-cute-writing | nvidia/skills | Développer des kernels GPU optimisés en Python via JIT compilation CUDA avec CUTLASS. | 1 970 | 18 |
| 40 | kernel-tileir-optimization | nvidia/skills | Optimiser des kernels Triton existants pour le backend TileIR de Blackwell GPUs. | 1 970 | 18 |
| 41 | perf-analysis | nvidia/skills | Analyser les performances GPU en classifiant les goulots d'étranglement et produisant des rapports structurés. | 1 970 | 18 |
| 42 | perf-host-optimization | nvidia/skills | Détecter et optimiser automatiquement les goulots d'étranglement CPU dans TensorRT-LLM. | 1 970 | 18 |
| 43 | perf-optimization | nvidia/skills | Coordonner des spécialistes GPU pour optimiser et valider les performances de kernels. | 1 970 | 18 |
| 44 | perf-torch-cuda-graphs | nvidia/skills | Optimiser les workloads PyTorch en capturant et rejouant des séquences GPU via CUDA Graphs. | 1 970 | 18 |
| 45 | perf-torch-sync-free | nvidia/skills | Écrire du code PyTorch asynchrone en éliminant les synchronisations CPU-GPU inutiles. | 1 970 | 18 |
| 46 | serve-config-guide | nvidia/skills | Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. | 1 970 | 18 |
| 47 | cuopt-installation-api-python | nvidia/skills | Installer cuOpt via pip, conda ou Docker pour optimiser des routes en Python. | 1 970 | 18 |
| 48 | cuopt-lp-milp-api-c | nvidia/skills | Résoudre des problèmes LP/MILP avec l'API C de cuOpt via CSR sparse. | 1 970 | 18 |
| 49 | cuopt-lp-milp-api-cli | nvidia/skills | Résoudre des problèmes LP/MILP via CLI avec des fichiers MPS et cuOpt. | 1 970 | 18 |
| 50 | cuopt-lp-milp-api-python | nvidia/skills | Modéliser et résoudre des programmes linéaires LP/MILP avec le solveur GPU cuOpt. | 1 970 | 18 |
À propos de cette sélection
L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.