VSS Video Embedding (RT-Embed) — skill de déploiement et d'intégration
Ce skill fait partie du repository nvidia-ai-blueprints/video-search-and-summarization, qui fournit des architectures de référence pour construire des agents vision et des applications d'analyse vidéo accélérées par GPU. Il cible spécifiquement le microservice RT-Embed (nommé vss-deploy-video-embedding en VSS 3.2 GA), responsable de la génération d'embeddings vidéo et texte à partir du modèle Cosmos-Embed1-448p — composant clé du workflow de recherche vidéo en langage naturel.
Ce que couvre ce skill
Le skill guide Claude sur l'ensemble du cycle de vie du microservice rtvi-embed : vérification des prérequis matériels et logiciels (driver NVIDIA, Docker Compose, accès NGC), démarrage via Docker Compose sous le profile bp_developer_search_2d, surveillance des logs pendant le téléchargement du modèle Cosmos-Embed1 (jusqu'à 20 minutes au premier démarrage), et arrêt propre avec ou sans suppression des volumes de cache. Il documente également les opérations courantes via l'API REST /v1 : upload de fichiers, génération d'embeddings vidéo ou texte, ingestion de flux RTSP en direct (SSE), et consultation des métriques Prometheus.
Le skill décrit aussi l'intégration du service dans un déploiement VSS complet, notamment le câblage optionnel avec Redis, Kafka et OpenTelemetry, ainsi que la matrice complète des variables d'environnement hôte-vers-conteneur. Une section de dépannage couvre les cas d'échec les plus fréquents : blocage de /v1/ready en 503 pendant le boot, erreurs de permissions sur les répertoires montés, gestion de sudo non interactif en contexte agent, et rate-limiting Hugging Face lors du téléchargement des poids.
Comment utiliser ce skill
Ce skill est activé lorsque l'utilisateur mentionne des phrases-clés telles que RT-Embed, rtvi-embed, Cosmos-Embed1, embed live stream, ou generate video embeddings. Il s'appuie sur des fichiers de référence présents dans le repository (references/deploy-vss-deploy-video-embedding.md, references/rest-api.md, references/environment.md, references/troubleshooting.md) pour les détails exhaustifs, et fournit directement les commandes curl et docker compose essentielles pour valider un déploiement standalone ou intégré.