Convertir un dataset TAO DAFT

Démarrage rapide

tao-daft convert <source-format> <target-format> --path <input> --output <output>

Source et cible sont des sous-commandes positionnelles ; --path et --output sont des flags. Découvrez les formats supportés et les flags par paire dans l'aide du dernier niveau --help (voir « CLI conventions » ci-dessous).

Vérification préalable

python -c "import nvidia_tao_daft" 2>/dev/null || {
  echo "MISSING: tao-daft not installed. Run:"
  echo "  pip install nvidia-tao-daft"
  exit 1
}

Démarrage rapide

Découvrez la surface CLI installée avant de choisir les slugs de format, puis exécutez la commande de conversion finale avec les flags --path et --output explicites :

tao-daft --version
tao-daft convert --help
tao-daft convert <source-format> --help
tao-daft convert <source-format> <target-format> --path /path/to/daft --output /path/to/converted

Objectif

Pilote tao-daft convert pour transformer un dataset DAFT (ou un arbre de datasets) entre formats supportés. La CLI fait le travail réel ; la skill choisit la bonne paire source/cible et les flags, puis explique le résultat.

Déclenchez sur : conversion d'un dataset DAFT, packaging de tâches DAFT QA / summarization / temporelles pour l'entraînement VLM, production d'un ensemble d'entraînement de style meta.json, ou la commande tao-daft convert. Ne déclenchez pas pour une conversion non-DAFT → DAFT (COCO, YOLO, Data Factory JSONL) — redirigez vers les skills de conversion du repo en amont nvidia-tao-daft.

Si l'utilisateur formule la demande de manière ambiguë, exécutez d'abord quelques appels --help.

Prérequis

nvidia-tao-daft installé (wheel uniquement, pas le repo source). Confirmez avec tao-daft --version.
Un dataset DAFT, ou un répertoire parent en contenant plusieurs, sur le disque local.

Instructions

Conventions CLI

tao-daft utilise des sous-commandes argparse imbriquées. Les conventions ci-dessous sont stables entre versions même si les noms de formats ou les flags changent, donc découvrez toujours la surface actuelle depuis --help plutôt que de vous appuyer sur les noms que ce document mentionne.

Source et cible sont tous deux des sous-commandes positionnelles, pas --from/--to : tao-daft convert <source> <target> [flags]. Les slugs de format sont versionnés, en minuscules, séparés par des points (metropolis-v3.0, cosmos-reason-v1.0, ...).
Path et output sont des flags — --path PATH (source), --output OUTPUT (destination). Les deux requis au dernier niveau ; les passer positivement échoue.
--path accepte les deux granularités — une scène/dataset unique ou un répertoire parent ; le convertisseur parcourt l'arborescence.
Les flags par paire se situent au dernier niveau — les ensembles de flags diffèrent entre cibles (p. ex. gestion des médias). Vérifiez toujours l'aide du dernier niveau --help.

Procédure opérationnelle :

tao-daft --version — confirmez l'installation, épinglez la version dans tout rapport.
tao-daft convert --help — listez les formats source supportés.
tao-daft convert <source> --help — listez les cibles valides pour cette source.
Déduisez la source à partir de la mise en page (mêmes marqueurs de répertoire que la skill « Format inference » de tao-validate-dataset-format). Si vous ne pouvez pas déduire ou que la cible n'est pas spécifiée, demandez.
tao-daft convert <source> <target> --help — choisissez les flags selon l'intention de l'utilisateur (sous-ensemble de tâches, copie vs référence de médias, métadonnées).
Exécutez, puis interprétez (voir ci-dessous).

Lecture de la sortie

La progression par scène s'affiche sur stdout ; sortie non-zéro en cas d'échec. Le dataset converti est écrit sous --output — vérifiez-le rapidement avec la skill tao-validate-dataset-format avant entraînement. Pour de grands arbres, capturez la sortie complète et lisez partiellement si elle est énorme.

Limitations

Formats source supportés par DAFT uniquement. Pour les mises en page non-DAFT, utilisez les skills de conversion du repo en amont.
Les paires supportées sont celles que --help rapporte pour la version installée — ne passez pas une paire non confirmée.
Source et cible sont positionnels ; --path / --output sont des flags.
convert uniquement — validate et info ont leurs propres skills.
Ne réimplémentez pas la conversion en Python ; la CLI est la spécification.

Dépannage

tao-daft: command not found — wheel non installé ; pip install nvidia-tao-daft, vérifiez avec tao-daft --version.
error: argument --path/--output is required — passé positivement ; déplacez derrière le flag.
invalid choice: '<format>' — slug non câblé dans cette version. Relancez l'aide pertinente --help.
Sortie rejetée par tao-daft validate — revérifiez les flags par paire (gestion des médias, sous-ensemble de tâches) via l'aide du dernier niveau --help ; un flag mal défini produit souvent une cible structurellement valide mais sémantiquement incorrecte.

tao-convert-dataset-format

Convertir un dataset TAO DAFT

Démarrage rapide

Vérification préalable

Démarrage rapide

Objectif

Prérequis

Instructions

Conventions CLI

Lecture de la sortie

Limitations

Dépannage

Skills similaires