Convertir un dataset TAO DAFT
Démarrage rapide
tao-daft convert <source-format> <target-format> --path <input> --output <output>
Source et cible sont des sous-commandes positionnelles ; --path et --output sont des flags.
Découvrez les formats supportés et les flags par paire dans l'aide du dernier niveau --help
(voir « CLI conventions » ci-dessous).
Vérification préalable
python -c "import nvidia_tao_daft" 2>/dev/null || {
echo "MISSING: tao-daft not installed. Run:"
echo " pip install nvidia-tao-daft"
exit 1
}
Démarrage rapide
Découvrez la surface CLI installée avant de choisir les slugs de format, puis exécutez
la commande de conversion finale avec les flags --path et --output explicites :
tao-daft --version
tao-daft convert --help
tao-daft convert <source-format> --help
tao-daft convert <source-format> <target-format> --path /path/to/daft --output /path/to/converted
Objectif
Pilote tao-daft convert pour transformer un dataset DAFT (ou un arbre de
datasets) entre formats supportés. La CLI fait le travail réel ; la
skill choisit la bonne paire source/cible et les flags, puis explique le
résultat.
Déclenchez sur : conversion d'un dataset DAFT, packaging de tâches DAFT QA /
summarization / temporelles pour l'entraînement VLM, production d'un
ensemble d'entraînement de style meta.json, ou la commande tao-daft convert. Ne
déclenchez pas pour une conversion non-DAFT → DAFT (COCO, YOLO, Data
Factory JSONL) — redirigez vers les skills de conversion du repo en amont nvidia-tao-daft.
Si l'utilisateur formule la demande de manière ambiguë, exécutez d'abord quelques appels --help.
Prérequis
nvidia-tao-daftinstallé (wheel uniquement, pas le repo source). Confirmez avectao-daft --version.- Un dataset DAFT, ou un répertoire parent en contenant plusieurs, sur le disque local.
Instructions
Conventions CLI
tao-daft utilise des sous-commandes argparse imbriquées. Les conventions ci-dessous sont
stables entre versions même si les noms de formats ou les flags changent, donc
découvrez toujours la surface actuelle depuis --help plutôt que de
vous appuyer sur les noms que ce document mentionne.
- Source et cible sont tous deux des sous-commandes positionnelles, pas
--from/--to:tao-daft convert <source> <target> [flags]. Les slugs de format sont versionnés, en minuscules, séparés par des points (metropolis-v3.0,cosmos-reason-v1.0, ...). - Path et output sont des flags —
--path PATH(source),--output OUTPUT(destination). Les deux requis au dernier niveau ; les passer positivement échoue. --pathaccepte les deux granularités — une scène/dataset unique ou un répertoire parent ; le convertisseur parcourt l'arborescence.- Les flags par paire se situent au dernier niveau — les ensembles de flags diffèrent entre
cibles (p. ex. gestion des médias). Vérifiez toujours l'aide du dernier niveau
--help.
Procédure opérationnelle :
tao-daft --version— confirmez l'installation, épinglez la version dans tout rapport.tao-daft convert --help— listez les formats source supportés.tao-daft convert <source> --help— listez les cibles valides pour cette source.- Déduisez la source à partir de la mise en page (mêmes marqueurs de répertoire que
la skill « Format inference » de
tao-validate-dataset-format). Si vous ne pouvez pas déduire ou que la cible n'est pas spécifiée, demandez. tao-daft convert <source> <target> --help— choisissez les flags selon l'intention de l'utilisateur (sous-ensemble de tâches, copie vs référence de médias, métadonnées).- Exécutez, puis interprétez (voir ci-dessous).
Lecture de la sortie
La progression par scène s'affiche sur stdout ; sortie non-zéro en cas d'échec. Le
dataset converti est écrit sous --output — vérifiez-le rapidement avec
la skill tao-validate-dataset-format avant entraînement. Pour de grands arbres, capturez
la sortie complète et lisez partiellement si elle est énorme.
Limitations
- Formats source supportés par DAFT uniquement. Pour les mises en page non-DAFT, utilisez les skills de conversion du repo en amont.
- Les paires supportées sont celles que
--helprapporte pour la version installée — ne passez pas une paire non confirmée. - Source et cible sont positionnels ;
--path/--outputsont des flags. convertuniquement —validateetinfoont leurs propres skills.- Ne réimplémentez pas la conversion en Python ; la CLI est la spécification.
Dépannage
tao-daft: command not found— wheel non installé ;pip install nvidia-tao-daft, vérifiez avectao-daft --version.error: argument --path/--output is required— passé positivement ; déplacez derrière le flag.invalid choice: '<format>'— slug non câblé dans cette version. Relancez l'aide pertinente--help.- Sortie rejetée par
tao-daft validate— revérifiez les flags par paire (gestion des médias, sous-ensemble de tâches) via l'aide du dernier niveau--help; un flag mal défini produit souvent une cible structurellement valide mais sémantiquement incorrecte.