tao-convert-dataset-format

Par nvidia · skills

Exécutez `tao-daft convert` pour convertir des ensembles de données NVIDIA TAO DAFT entre les formats pris en charge. Ne pas utiliser pour des données non-DAFT.

npx skills add https://github.com/nvidia/skills --skill tao-convert-dataset-format

Convertir un dataset TAO DAFT

Démarrage rapide

tao-daft convert <source-format> <target-format> --path <input> --output <output>

Source et cible sont des sous-commandes positionnelles ; --path et --output sont des flags. Découvrez les formats supportés et les flags par paire dans l'aide du dernier niveau --help (voir « CLI conventions » ci-dessous).

Vérification préalable

python -c "import nvidia_tao_daft" 2>/dev/null || {
  echo "MISSING: tao-daft not installed. Run:"
  echo "  pip install nvidia-tao-daft"
  exit 1
}

Démarrage rapide

Découvrez la surface CLI installée avant de choisir les slugs de format, puis exécutez la commande de conversion finale avec les flags --path et --output explicites :

tao-daft --version
tao-daft convert --help
tao-daft convert <source-format> --help
tao-daft convert <source-format> <target-format> --path /path/to/daft --output /path/to/converted

Objectif

Pilote tao-daft convert pour transformer un dataset DAFT (ou un arbre de datasets) entre formats supportés. La CLI fait le travail réel ; la skill choisit la bonne paire source/cible et les flags, puis explique le résultat.

Déclenchez sur : conversion d'un dataset DAFT, packaging de tâches DAFT QA / summarization / temporelles pour l'entraînement VLM, production d'un ensemble d'entraînement de style meta.json, ou la commande tao-daft convert. Ne déclenchez pas pour une conversion non-DAFT → DAFT (COCO, YOLO, Data Factory JSONL) — redirigez vers les skills de conversion du repo en amont nvidia-tao-daft.

Si l'utilisateur formule la demande de manière ambiguë, exécutez d'abord quelques appels --help.

Prérequis

  • nvidia-tao-daft installé (wheel uniquement, pas le repo source). Confirmez avec tao-daft --version.
  • Un dataset DAFT, ou un répertoire parent en contenant plusieurs, sur le disque local.

Instructions

Conventions CLI

tao-daft utilise des sous-commandes argparse imbriquées. Les conventions ci-dessous sont stables entre versions même si les noms de formats ou les flags changent, donc découvrez toujours la surface actuelle depuis --help plutôt que de vous appuyer sur les noms que ce document mentionne.

  1. Source et cible sont tous deux des sous-commandes positionnelles, pas --from/--to : tao-daft convert <source> <target> [flags]. Les slugs de format sont versionnés, en minuscules, séparés par des points (metropolis-v3.0, cosmos-reason-v1.0, ...).
  2. Path et output sont des flags--path PATH (source), --output OUTPUT (destination). Les deux requis au dernier niveau ; les passer positivement échoue.
  3. --path accepte les deux granularités — une scène/dataset unique ou un répertoire parent ; le convertisseur parcourt l'arborescence.
  4. Les flags par paire se situent au dernier niveau — les ensembles de flags diffèrent entre cibles (p. ex. gestion des médias). Vérifiez toujours l'aide du dernier niveau --help.

Procédure opérationnelle :

  1. tao-daft --version — confirmez l'installation, épinglez la version dans tout rapport.
  2. tao-daft convert --help — listez les formats source supportés.
  3. tao-daft convert <source> --help — listez les cibles valides pour cette source.
  4. Déduisez la source à partir de la mise en page (mêmes marqueurs de répertoire que la skill « Format inference » de tao-validate-dataset-format). Si vous ne pouvez pas déduire ou que la cible n'est pas spécifiée, demandez.
  5. tao-daft convert <source> <target> --help — choisissez les flags selon l'intention de l'utilisateur (sous-ensemble de tâches, copie vs référence de médias, métadonnées).
  6. Exécutez, puis interprétez (voir ci-dessous).

Lecture de la sortie

La progression par scène s'affiche sur stdout ; sortie non-zéro en cas d'échec. Le dataset converti est écrit sous --output — vérifiez-le rapidement avec la skill tao-validate-dataset-format avant entraînement. Pour de grands arbres, capturez la sortie complète et lisez partiellement si elle est énorme.

Limitations

  • Formats source supportés par DAFT uniquement. Pour les mises en page non-DAFT, utilisez les skills de conversion du repo en amont.
  • Les paires supportées sont celles que --help rapporte pour la version installée — ne passez pas une paire non confirmée.
  • Source et cible sont positionnels ; --path / --output sont des flags.
  • convert uniquement — validate et info ont leurs propres skills.
  • Ne réimplémentez pas la conversion en Python ; la CLI est la spécification.

Dépannage

  • tao-daft: command not found — wheel non installé ; pip install nvidia-tao-daft, vérifiez avec tao-daft --version.
  • error: argument --path/--output is required — passé positivement ; déplacez derrière le flag.
  • invalid choice: '<format>' — slug non câblé dans cette version. Relancez l'aide pertinente --help.
  • Sortie rejetée par tao-daft validate — revérifiez les flags par paire (gestion des médias, sous-ensemble de tâches) via l'aide du dernier niveau --help ; un flag mal défini produit souvent une cible structurellement valide mais sémantiquement incorrecte.

Skills similaires