Auditer la mémoire DRAM d'un Jetson avec données live

jetson-memory-audit

Ce skill fait partie du catalogue officiel NVIDIA Agent Skills (repo nvidia/skills), qui regroupe des instructions portables permettant aux agents IA d'utiliser les outils NVIDIA de façon optimale. Il est conçu pour fonctionner sur les cartes NVIDIA Jetson (architecture Unified Memory Architecture) et cible les questions de diagnostic mémoire en conditions réelles.

Ce que fait ce skill

Il fournit à l'agent un ensemble d'instructions précises pour mesurer l'utilisation mémoire DRAM/NvMap d'un Jetson, capturer des instantanés JSON avant et après une modification, puis vérifier que la mémoire a bien été libérée plutôt que simplement marquée comme cache. Il inclut notamment une procédure drop_caches pour les versions de JetPack inférieures à 7.2 / L4T inférieures à r39.0, où la mémoire peut sembler bloquée après l'arrêt d'un workload CUDA (vLLM, sglang, Ollama).

Le skill s'appuie sur deux scripts auxiliaires — scripts/audit.sh (snapshot JSON) et scripts/drop_caches.sh (vidage du page cache avec mesure des deltas) — et définit précisément comment les invoquer, interpréter leurs sorties et rapporter les résultats à l'utilisateur sans jamais inventer de valeurs.

Comment l'utiliser

Installez le skill via la CLI standard du catalogue NVIDIA :

npx skills add nvidia/skills --skill jetson-memory-audit

Une fois installé, l'agent peut répondre à des questions du type « Combien de mémoire est utilisée sur ce Jetson ? », « Pourquoi free -h affiche encore peu de mémoire après l'arrêt de mon container ? » ou « Combien de mémoire ce changement a-t-il libéré ? ». Le skill guide l'agent pour capturer une baseline avant le changement, appliquer la procédure appropriée selon la version de JetPack, puis comparer les snapshots avant/après.

Limites et conditions préalables

Le skill doit être exécuté sur l'hôte Jetson (ou dans un sandbox avec visibilité sur /proc, tegrastats, les données NvMap et systemd). En environnement sandbox ou conteneur sans visibilité sur l'hôte, l'agent signale l'absence de données plutôt que d'en fabriquer. L'accès root est requis pour les lectures NvMap via debugfs et pour l'exécution de drop_caches.sh. Il se positionne comme une étape de diagnostic et de baseline, et peut déléguer à jetson-headless-mode ou jetson-inference-mem-tune pour les actions correctives.

jetson-memory-audit

Ce que fait ce skill

Comment l'utiliser

Limites et conditions préalables

Skills similaires