tao-finetune-huggingface-model
Ce skill fait partie du catalogue officiel de skills publiés par NVIDIA dans le repository nvidia/skills. Il s'agit d'un skill pleinement spécifié — le SKILL.md n'est pas un squelette vide mais un document de gouvernance complet qui dicte le comportement d'un agent AI chargé de fine-tuner des modèles HuggingFace sur des GPU NVIDIA locaux, à l'intérieur d'un container NGC PyTorch.
Ce que fait ce skill
Le skill orchestre un workflow en six étapes séquentielles : inspection et qualification du modèle et du dataset, audit matériel et sélection de l'image NGC, recherche live de la recette d'entraînement, génération des scripts et smoke-test, entraînement complet suivi d'évaluation et d'inférence, puis push sur le HuggingFace Hub et émission d'un skill de re-exécution reproductible. Il couvre les tâches de vision par ordinateur (classification d'images, détection d'objets, segmentation sémantique/instance/panoptique, estimation de profondeur), les VLM image-text-to-text (SFT / LoRA), et le fine-tuning de LLM (SFT / DPO / GRPO).
L'ordre d'autorité est explicitement défini : les instructions de l'utilisateur priment, suivies de la documentation live fetchée (model card, scripts de l'auteur, docs de la tâche), puis des références curées en fallback (references/*.md), et enfin la mémoire d'entraînement de l'agent en dernier recours. Cette hiérarchie garantit que l'agent ne génère pas de code ML depuis sa mémoire potentiellement obsolète.
Comment l'utiliser
Ce skill s'installe via le CLI skills (npx skills add nvidia/skills --skill tao-finetune-huggingface-model) et se charge automatiquement dans l'agent (Claude Code, Cursor, Codex, Kiro) lorsqu'une tâche de fine-tuning HuggingFace est détectée. L'agent requiert au minimum un model_id HuggingFace ; le dataset peut être fourni via un identifiant HF, un chemin local, ou laissé à la recommandation de l'agent. Les credentials (HF_TOKEN, WANDB_API_KEY) ne sont chargés que lorsqu'ils sont strictement nécessaires. Des exemples de pipelines complets sont inclus dans les références du skill pour des modèles comme ConvNeXT, DETR, SegFormer et SmolVLM.