vss-generate-video-report

Par nvidia-ai-blueprints · video-search-and-summarization

Skill fonctionnel du blueprint NVIDIA VSS qui orchestre la génération de rapports d'analyse vidéo en routant vers deux modes : analyse VLM par clip (Mode A) ou rapport d'incidents sur plage temporelle (Mode B).

npx skills add https://github.com/nvidia-ai-blueprints/video-search-and-summarization --skill vss-generate-video-report

vss-generate-video-report

Ce skill fait partie du blueprint NVIDIA AI Blueprint for Video Search and Summarization (VSS), un ensemble d'architectures de référence pour construire des agents de vision GPU-accélérés. Son rôle est d'orchestrer la production de rapports d'analyse vidéo structurés en déterminant automatiquement quel backend invoquer selon la nature de la demande utilisateur.

Deux modes de génération

Le skill distingue deux parcours bien définis. Le Mode A cible un clip vidéo enregistré : il résout l'URL du clip via /vss-manage-video-io-storage, sélectionne l'endpoint VLM approprié (NIM Cosmos ou RT-VLM Cosmos), appelle directement l'API chat/completions avec un bloc video_url, puis remplit le template assets/video-analysis-report.md. Le Mode B cible une plage d'incidents : il délègue la récupération des données à /vss-query-analytics, agrège les résultats par capteur ou catégorie, et remplit le template assets/incident-range-report.md. Si le profil lvs est déployé en Mode A, le skill délègue la synthèse à /vss-summarize-video et se charge uniquement du rendu final.

Routage et prérequis de déploiement

L'aiguillage entre les deux modes repose sur la formulation de la requête : une demande sans plage temporelle explicite ni mention d'incidents bascule par défaut en Mode A. Le skill vérifie également le profil de déploiement actif avant d'exécuter chaque mode — profil base (VST + VLM NIM) pour le Mode A, profil alerts (VA-MCP + Elasticsearch) pour le Mode B — et délègue à /vss-deploy-profile si la sonde de disponibilité échoue.

Contrat de sortie et gestion des URLs

Le skill impose un contrat strict sur les titres et sections des rapports générés (ex. # Video Analysis Report en Mode A, # Incident Range Report en Mode B avec une section ## Basic Information obligatoire). Toutes les URLs de clips exposées dans les rapports sont réécrites depuis l'adresse interne HOST_IP:30888 vers l'adresse publique $VSS_PUBLIC_HOST:$VSS_PUBLIC_PORT, afin de les rendre accessibles depuis le navigateur. En cas d'échec d'une sonde, d'un appel VLM ou d'une requête analytics, le skill s'arrête et reporte l'erreur sans produire de rapport partiel ou inventé.

Skills similaires