Data & IA

Skills pour LLM, bases vectorielles, training de modeles et scraping web.

789 skills

# Skill Source Description Δ
1 claude-api anthropics/skills Construire des applications LLM avec Claude via le SDK officiel adapté au langage. 155 898 47
2 cudaq-guide nvidia/skills Guider l'utilisateur dans CUDA-Q : installation, simulation GPU et accès QPU. 1 970 18
3 adding-model-support nvidia/skills Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. 1 970 18
4 mlm-bridge-training nvidia/skills Comparer et valider les pertes entre Megatron-LM et Bridge sur GPU. 1 970 18
5 parity-testing nvidia/skills Vérifier la parité des poids et des passes avant entre modèles HF et Megatron. 1 970 18
6 perf-activation-recompute nvidia/skills Optimiser la mémoire GPU en recomputant sélectivement les activations pendant la rétropropagation. 1 970 18
7 perf-cpu-offloading nvidia/skills Décharger activations ou états d'optimiseur du GPU vers le CPU pour économiser de la mémoire. 1 970 18
8 perf-cuda-graphs nvidia/skills Configurer et optimiser les CUDA graphs GPU pour accélérer l'entraînement de modèles. 1 970 18
9 perf-expert-parallel-overlap nvidia/skills Masquer la latence des communications all-to-all dans les modèles MoE via un chevauchement calcul/communication. 1 970 18
10 perf-hybrid-context-parallel nvidia/skills Configurer le parallélisme de contexte hybride hiérarchique pour l'entraînement distribué de LLMs. 1 970 18
11 perf-megatron-fsdp nvidia/skills Configurer et valider l'entraînement distribué avec Megatron FSDP dans Bridge. 1 970 18
12 perf-memory-tuning nvidia/skills Optimiser la mémoire GPU pour éviter les erreurs OOM lors de l'entraînement de modèles. 1 970 18
13 perf-moe-comm-overlap nvidia/skills Activer et configurer le chevauchement des communications MoE en parallélisme expert. 1 970 18
14 perf-moe-dispatcher-selection nvidia/skills Sélectionner le dispatcher MoE optimal selon le matériel, le modèle et le degré EP. 1 970 18
15 perf-moe-hardware-configs nvidia/skills Configurer les paramètres matériels optimaux pour entraîner des modèles MoE sur GPU. 1 970 18
16 perf-moe-long-context nvidia/skills Optimiser l'entraînement long-contexte des modèles MoE avec parallélisme et recompute. 1 970 18
17 perf-moe-optimization-workflow nvidia/skills Optimiser l'entraînement de modèles MoE en gérant mémoire, communication et calcul. 1 970 18
18 perf-moe-vlm-training nvidia/skills Optimiser l'entraînement de VLM MoE avec FSDP ou parallélisme 3D. 1 970 18
19 perf-parallelism-strategies nvidia/skills Sélectionner la stratégie de parallélisme optimale selon la taille du modèle et le matériel. 1 970 18
20 perf-sequence-packing nvidia/skills Configurer le packing de séquences pour le finetuning LLM et VLM optimisé. 1 970 18
21 perf-tp-dp-comm-overlap nvidia/skills Configurer le chevauchement des communications TP/DP/PP pour optimiser l'entraînement distribué. 1 970 18
22 recipe-recommender nvidia/skills Indexer les recettes d'entraînement et recommander la configuration optimale pour LLM. 1 970 18
23 resiliency nvidia/skills Configurer la tolérance aux pannes, détection de stragglers et préemption pour entraînements distribués. 1 970 18
24 accessing-mlflow nvidia/skills Interroger et comparer des runs MLflow via langage naturel et MCP. 1 970 18
25 deployment nvidia/skills Déployer un checkpoint de modèle comme endpoint d'inférence compatible OpenAI. 1 970 18
26 evaluation nvidia/skills Générer et exécuter des configurations YAML d'évaluation de modèles LLM via NeMo Evaluator. 1 970 18
27 launching-evals nvidia/skills Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. 1 970 18
28 ptq nvidia/skills Quantifier un modèle pré-entraîné en checkpoint optimisé via ModelOpt PTQ. 1 970 18
29 nel-assistant nvidia/skills Générer et exécuter des configurations YAML d'évaluation de modèles via NeMo Evaluator. 1 970 18
30 byob nvidia/skills Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. 1 970 18
31 ad-graph-dump nvidia/skills Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. 1 970 18
32 ad-model-onboard nvidia/skills Automatiser l'intégration de modèles HuggingFace dans AutoDeploy avec tests et rapport. 1 970 18
33 exec-local-compile nvidia/skills Compiler TensorRT-LLM depuis les sources sur un nœud de calcul avec GPU. 1 970 18
34 kernel-triton-writing nvidia/skills Écrire des kernels Triton corrects, performants et précis pour agents IA. 1 970 18
35 add-benchmark nvidia/skills Intégrer un benchmark natif ou externe dans le framework NeMo-Gym. 1 970 18
36 nemoclaw-user-configure-inference nvidia/skills Configurer un sous-agent spécialisé dans un sandbox NemoClaw avec OpenClaw. 1 970 18
37 nemoclaw-user-overview nvidia/skills Naviguer l'écosystème NemoClaw, OpenShell et OpenClaw pour choisir le bon outil. 1 970 18
38 ad-add-fusion-transformation nvidia/skills Ajouter, étendre ou auditer un pass de fusion dans AutoDeploy de TensorRT-LLM. 1 970 18
39 kernel-cute-writing nvidia/skills Développer des kernels GPU optimisés en Python via JIT compilation CUDA avec CUTLASS. 1 970 18
40 kernel-tileir-optimization nvidia/skills Optimiser des kernels Triton existants pour le backend TileIR de Blackwell GPUs. 1 970 18
41 perf-analysis nvidia/skills Analyser les performances GPU en classifiant les goulots d'étranglement et produisant des rapports structurés. 1 970 18
42 perf-host-optimization nvidia/skills Détecter et optimiser automatiquement les goulots d'étranglement CPU dans TensorRT-LLM. 1 970 18
43 perf-optimization nvidia/skills Coordonner des spécialistes GPU pour optimiser et valider les performances de kernels. 1 970 18
44 perf-torch-cuda-graphs nvidia/skills Optimiser les workloads PyTorch en capturant et rejouant des séquences GPU via CUDA Graphs. 1 970 18
45 perf-torch-sync-free nvidia/skills Écrire du code PyTorch asynchrone en éliminant les synchronisations CPU-GPU inutiles. 1 970 18
46 serve-config-guide nvidia/skills Générer une configuration YAML optimisée pour déployer des LLMs via trtllm-serve. 1 970 18
47 cuopt-installation-api-python nvidia/skills Installer cuOpt via pip, conda ou Docker pour optimiser des routes en Python. 1 970 18
48 cuopt-lp-milp-api-c nvidia/skills Résoudre des problèmes LP/MILP avec l'API C de cuOpt via CSR sparse. 1 970 18
49 cuopt-lp-milp-api-cli nvidia/skills Résoudre des problèmes LP/MILP via CLI avec des fichiers MPS et cuOpt. 1 970 18
50 cuopt-lp-milp-api-python nvidia/skills Modéliser et résoudre des programmes linéaires LP/MILP avec le solveur GPU cuOpt. 1 970 18

À propos de cette sélection

L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.