vss-deploy-detection-tracking-3d

Par nvidia-ai-blueprints · video-search-and-summarization

Skill Claude opérationnel pour déployer le microservice RTVI-CV-3D en mode MV3DT (détection DeepStream multi-caméras + BEV Fusion) dans le blueprint VSS de NVIDIA.

npx skills add https://github.com/nvidia-ai-blueprints/video-search-and-summarization --skill vss-deploy-detection-tracking-3d

Rôle du skill

Ce skill guide Claude dans le déploiement et l'exploitation du microservice RTVI-CV-3D en mode MV3DT (MODE=mv3dt) au sein du blueprint Video Search and Summarization (VSS) de NVIDIA. Il couvre la stack de perception multi-caméras : DeepStream par caméra (vss-rtvi-cv-mv3dt), BEV Fusion (vss-rtvi-cv-bev-fusion), bus MQTT mosquitto et stack de capteurs VST — sans le couche agent / LLM / VLM du blueprint warehouse complet.

Le skill s'appuie sur la machinerie Docker Compose située dans deploy/docker/industry-profiles/warehouse-operations/warehouse-mv3dt-app/ et orchestre les surcharges d'environnement, la chaîne de calibration et la vérification du déploiement.

Logique de routage intégrée

Le SKILL.md définit un arbre de décision en quatre questions (Q0 à Q3) que Claude pose à l'utilisateur pour déterminer le chemin exact à suivre :

  • Q0 — profil étendu ou minimal (MINIMAL_PROFILE), qui détermine si ELK, l'API analytics et Kibana sont inclus pour afficher les overlays dans le mur vidéo VST.
  • Q1 — source de données : dataset d'exemple fourni (sample), fichiers vidéo locaux (videos) ou flux RTSP live.
  • Q2 — présence ou absence de fichiers de calibration sur le disque (ignoré pour sample).
  • Q3 — détecteur AMC (resnet ou transformer) et slug du dataset, uniquement si une calibration automatique doit être lancée.

Selon les réponses, Claude enchaîne les références appropriées : calibration-workflow.md, configure-cameras.md, deploy-rtvi-cv-3d-stack.md et verify-and-view.md.

Périmètre et liens avec les autres skills

Ce skill est délibérément limité à MV3DT sans la pile agent. Pour le blueprint warehouse complet (avec agents, LLM, VLM), Claude redirige vers vss-deploy-profile. Pour la génération de calibration via AMC, il s'appuie sur vss-generate-video-calibration. La gestion du mur vidéo VST et des capteurs est couverte par vss-manage-video-io-storage.

Le SKILL.md embarque également des prérequis détaillés (NGC CLI, profil GPU, VSS_DATA_DIR, ACL filesystem) et une table de dépannage couvrant les erreurs les plus fréquentes sur MV3DT, ce qui en fait un skill opérationnel complet plutôt qu'un simple squelette.

Skills similaires