tao-validate-dataset-format

Par nvidia · skills

Exécutez `tao-daft validate` pour vérifier les datasets NVIDIA TAO DAFT et détecter les erreurs de structure, de schéma et de références croisées. Do

npx skills add https://github.com/nvidia/skills --skill tao-validate-dataset-format

Valider un dataset TAO DAFT

Démarrage rapide

tao-daft validate <format> --path <dataset-or-parent-dir>

<format> est une sous-commande positionnelle (ex. metropolis-v3.0, cosmos-reason-v1.0) ; --path est obligatoire. Découvrez les formats supportés et les drapeaux par format via tao-daft validate --help et le --help au niveau feuille (voir « Conventions CLI » ci-dessous).

Vérification préalable

python -c "import nvidia_tao_daft" 2>/dev/null || {
  echo "MISSING: tao-daft not installed. Run:"
  echo "  pip install nvidia-tao-daft"
  exit 1
}

Démarrage rapide

Découvrez les formats de validateur installés avant de choisir un slug de format, puis exécutez la validation avec la cible passée via --path :

tao-daft --version
tao-daft validate --help
tao-daft validate <format> --help
tao-daft validate <format> --path /path/to/daft-dataset

Objectif

Exécuter tao-daft validate sur un dataset DAFT (ou un arbre de datasets). La CLI est la spécification ; le skill choisit la sous-commande + drapeaux et explique le résultat.

À déclencher quand l'utilisateur mentionne « TAO DAFT », « format DAFT », la validation d'un dataset DAFT, les erreurs de schéma/références croisées, ou tao-daft validate. Ne déclenchez pas pour les structures non-DAFT (COCO, YOLO, Data Factory JSONL), ou pour tao-daft info / tao-daft convert — ceux-ci ont leurs propres skills.

Si l'ouverture de l'utilisateur est ambiguë, exécutez d'abord quelques commandes --help pour vous orienter, puis revenez et confirmez la tâche.

Prérequis

  • nvidia-tao-daft installé (pip install nvidia-tao-daft ; la wheel suffit, pas besoin du repo source). Confirmez avec tao-daft --version.
  • Un dataset DAFT, ou un répertoire parent les contenant, sur le disque local.

Instructions

Conventions CLI

tao-daft utilise des sous-commandes argparse imbriquées. Les noms et drapeaux varient selon les versions, donc découvrez la surface actuelle via --help plutôt que de faire confiance à une liste dans cette documentation.

  1. Le format est une sous-commande positionnelle, pas --format : tao-daft validate <format> [flags]. Listez les formats actuels via tao-daft validate --help ; les slugs ressemblent à metropolis-v3.0, cosmos-reason-v1.0.
  2. La cible est --path PATH, pas positionnelle. Elle accepte un seul dataset/scène ou un répertoire parent — le validateur parcourt l'arborescence.
  3. Les drapeaux sont par format ; exécutez le help au niveau feuille, ex. tao-daft validate metropolis-v3.0 --help, avant de les choisir. N'assumez pas qu'un drapeau d'un format existe sur un autre.

La boucle est donc : tao-daft --versiontao-daft validate --help → choisissez le format (déduisez-le si non spécifié, voir ci-dessous) → tao-daft validate <format> --help → exécutez → interprétez.

Inférence de format

Utilisez les marqueurs de répertoires, pas les noms de fichiers :

  • meta.json à côté de media/ et text/cosmos-reason-v1.0.
  • Un répertoire (ou répertoires imbriqués) contenant contextual/, généralement aux côtés de raw/ et task/metropolis-v3.0.
  • Aucun marqueur présent ⇒ demandez à l'utilisateur ; ne devinez pas.

Lecture des erreurs

La CLI termine chaque exécution par un bloc VALIDATION RESULTS, puis ✅ VALIDATION PASSED ou ❌ VALIDATION FAILED, et se termine avec un code non-zéro en cas d'échec (sûr à chaîner dans des scripts).

La sortie peut être volumineuse sur de grands arbres — capturez la sortie complète dans un fichier et lisez-la par tranches plutôt que de scroller en ligne.

Limitations

  • Valide DAFT uniquement. Les structures non-DAFT (COCO, YOLO, Data Factory JSONL, etc.) relèvent des skills convertisseurs en amont.
  • Les formats supportés sont ceux que tao-daft validate --help rapporte pour la version installée ; les anciens slugs peuvent avoir été supprimés.
  • Couvre validate uniquement. Reportez-vous aux skills dédiés pour tao-daft info et tao-daft convert.
  • Ne réimplémentez pas la validation en Python ; la CLI est la spécification.

Dépannage

  • tao-daft: command not found — wheel non installée dans l'env actif. pip install nvidia-tao-daft ; vérifiez tao-daft --version.
  • error: argument --path is required — chemin passé positivement. Déplacez-le après --path.
  • invalid choice: '<format>' — slug non configuré dans cette version. Réexécutez tao-daft validate --help et choisissez dans la liste.
  • La détection automatique (type brut / ensemble contextuel) est erronée — outrepassez-la via le drapeau de restriction d'étendue du format ; découvrez le nom depuis le --help au niveau feuille.
  • CI veut que les avertissements échouent — ajoutez --strict.

Skills similaires