Cloud & DevOps
Skills pour deployer, orchestrer et superviser des applications cloud. Azure, AWS, Kubernetes et observabilite.
| # | Skill | Source | Description | Maj | |
|---|---|---|---|---|---|
| 1 | deepstream-sop | nvidia/skills | Construire et déboguer un pipeline DeepStream GPU pour la détection d'actions industrielles. | 2 136 | 3h |
| 2 | deepstream-profile-pipeline | nvidia/skills | Créer et profiler des pipelines DeepStream optimisés avec mesures Nsight Systems automatisées. | 2 136 | 3h |
| 3 | deploying-airflow | astronomer/agents | Déployer des DAGs Airflow en production via Astro, Docker Compose ou Kubernetes. | 395 | 1j |
| 4 | prime-intellect-cli | mkurman/zorai | Gérer ressources compute, pods, sandboxes et disques via CLI Prime Intellect. | 318 | 7j |
| 5 | jetson-validate-image | nvidia/skills | Valider statiquement et sur cible une image BSP Jetson fraîchement déployée. | 2 136 | 9j |
| 6 | jetson-memory-audit | nvidia/skills | Auditer la mémoire d'un Jetson et libérer les caches CUDA bloqués après un workload. | 2 136 | 9j |
| 7 | jetson-customize-pinmux | nvidia/skills | Configurer les broches Tegra (SFIO, direction, état) et générer les DTSIs BCT correspondants. | 2 136 | 9j |
| 8 | tao-run-on-slurm | nvidia/skills | Soumettre et gérer des jobs GPU sur clusters SLURM via SSH et sbatch. | 2 136 | 9j |
| 9 | agent-observability-experiment-py-bootstrap | datadog-labs/agent-skills | Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs. | 138 | 16j |
| 10 | agent-observability-eval-pipeline | datadog-labs/agent-skills | Orchestrer un pipeline d'évaluation en six phases pour analyser et améliorer des agents IA instrumentés. | 138 | 16j |
| 11 | agent-observability-eval-bootstrap | datadog-labs/agent-skills | Analyser des traces LLM de production pour générer et publier une suite d'évaluateurs Datadog. | 138 | 16j |
| 12 | python-appservice-deploy | microsoft/azure-skills | Déployer du code Python (Flask, Django, FastAPI) sur Azure App Service Linux. | 1 247 | 16j |
| 13 | debugging-signals-pipeline | posthog/skills | Déboguer et monitorer un pipeline de traitement de signaux Temporal end-to-end. | 49 | 17j |
| 14 | vss-deploy-profile | nvidia/skills | Déployer tout profil VSS via un workflow compose structuré et reproductible. | 2 136 | 20j |
| 15 | vss-deploy-profile | nvidia-ai-blueprints/video-search-and-summarization | Déployer et configurer des profils VSS multi-GPU via Docker Compose sur divers matériels NVIDIA. | 1 693 | 21j |
| 16 | bdd-container-update | nvidia-ai-blueprints/video-search-and-summarization | Mettre à jour, versionner et pousser un conteneur de tests BDD dans un registry GitLab. | 1 693 | 21j |
| 17 | tao-run-on-lepton | nvidia/skills | Soumettre et gérer des workloads GPU conteneurisés sur la plateforme cloud Lepton. | 2 136 | 23j |
| 18 | huggingface-spaces | huggingface/skills | Créer, déployer et maintenir des applications ML sur Hugging Face Spaces. | 10 753 | 27j |
| 19 | llm-obs-eval-bootstrap | datadog-labs/agent-skills | Générer une suite d'évaluateurs prêts à l'emploi à partir de traces LLM en production. | 138 | 29j |
| 20 | launch-nemo-rl | nvidia/skills | Lancer et gérer des recettes NeMo-RL sur Kubernetes via la CLI nrl-k8s. | 2 136 | 29j |
| 21 | holoscan-install-conda | nvidia/skills | Installer le SDK Holoscan dans un environnement Conda sur Linux x86_64. | 2 136 | 1mo |
| 22 | mcore-run-on-slurm | nvidia/skills | Lancer Megatron-LM sur un cluster SLURM multi-nœuds avec configuration distribuée. | 2 136 | 1mo |
| 23 | namecheap | github/awesome-copilot | Gérer les enregistrements DNS Namecheap via API avec Python. | 36 038 | 1mo |
| 24 | dynamo-troubleshoot | nvidia/skills | Diagnostiquer et classifier les pannes Dynamo pour proposer des actions correctives précises. | 2 136 | 1mo |
| 25 | dynamo-router-starter | nvidia/skills | Configurer et valider un routeur Dynamo en mode KV ou round-robin. | 2 136 | 1mo |
| 26 | dynamo-recipe-runner | nvidia/skills | Déployer et valider un endpoint Dynamo via recettes existantes avec smoke test. | 2 136 | 1mo |
| 27 | dynamo-interconnect-check | nvidia/skills | Vérifier le transport RDMA/NVLink d'un déploiement Dynamo disaggrégé avant benchmark. | 2 136 | 1mo |
| 28 | redis-observability | redis/agent-skills | Surveiller, diagnostiquer et alerter sur les métriques clés d'une instance Redis. | 81 | 1mo |
| 29 | python-observability | wshobson/agents | Instrumenter des applications Python avec logs structurés, métriques et traces distribuées. | 37 411 | 1mo |
| 30 | distributed-tracing | wshobson/agents | Implémenter le traçage distribué avec Jaeger et Tempo pour visualiser les flux de requêtes. | 37 411 | 1mo |
| 31 | perf-host-analysis | nvidia/skills | Analyser les surcharges CPU dans des traces nsys pour les workloads d'inférence TensorRT-LLM. | 2 136 | 1mo |
| 32 | build-and-dependency | nvidia/skills | Construire et gérer des environnements de développement containerisés pour Megatron-LM avec CUDA. | 2 136 | 1mo |
| 33 | multi-node-slurm | nvidia/skills | Convertir des commandes distribuées PyTorch en scripts Slurm multi-nœuds avec conteneurs Enroot. | 2 136 | 1mo |
| 34 | exec-slurm-compile | nvidia/skills | Compiler TensorRT-LLM sur un cluster SLURM via des conteneurs enroot. | 2 136 | 1mo |
| 35 | flowstudio-power-automate-build | github/awesome-copilot | Construire et déployer des flows Power Automate via le serveur MCP FlowStudio. | 36 038 | 1mo |
| 36 | bump-dependency | nvidia/skills | Gérer end-to-end le bump de dépendances GPU dans Megatron Bridge jusqu'au CI vert. | 2 136 | 1mo |
| 37 | modal | mkurman/zorai | Déployer et exécuter du Python serverless sur GPU dans le cloud avec Modal. | 318 | 1mo |
| 38 | wayback-cdx-cloud-ip-workaround | divinevideo/divine-mobile | Contourner le blocage IP cloud de l'API Wayback CDX via GCS comme intermédiaire. | 256 | 1mo |
| 39 | dead-cdn-dns-bypass | divinevideo/divine-mobile | Contourner le DNS mort d'un CDN pour récupérer du contenu archivé disparu. | 256 | 1mo |
| 40 | run-on-slurm | nvidia/skills | Lancer et superviser un entraînement Megatron-LM distribué sur cluster SLURM. | 2 136 | 1mo |
| 41 | python-azure-iot-edge-modules | github/awesome-copilot | Concevoir et déployer des modules Python IoT Edge fiables pour traitement de télémétrie en périphérie. | 36 038 | 2mo |
| 42 | ci-failure-retrieval | nvidia/skills | Récupérer et analyser les échecs CI Jenkins d'une pull request GitHub. | 2 136 | 2mo |
| 43 | publish-models | replicate/skills | Publier et tester un modèle Cog sur Replicate avec validation automatique. | 50 | 2mo |
| 44 | hosted-agents-v2-py | microsoft/skills | Déployer des agents hébergés sur Microsoft Foundry avec protocoles configurables. | 2 652 | 2mo |
| 45 | agents-v2-py | microsoft/skills | Créer et gérer des agents IA hébergés dans des conteneurs Azure via le SDK Python. | 2 652 | 2mo |
| 46 | azure-storage-queue-py | microsoft/skills | Gérer des files d'attente Azure Storage pour communication asynchrone via Python. | 2 652 | 2mo |
| 47 | azure-storage-file-share-py | microsoft/skills | Gérer des partages de fichiers SMB Azure via le SDK Python. | 2 652 | 2mo |
| 48 | azure-storage-file-datalake-py | microsoft/skills | Gérer fichiers et répertoires sur Azure Data Lake Storage Gen2 via Python. | 2 652 | 2mo |
| 49 | azure-storage-blob-py | microsoft/skills | Gérer des blobs Azure Storage via le SDK Python avec upload, download et listing. | 2 652 | 2mo |
| 50 | azure-servicebus-py | microsoft/skills | Envoyer et recevoir des messages fiables via Azure Service Bus avec Python. | 2 652 | 2mo |
À propos de cette sélection
Provisionner une infrastructure depuis une spec Terraform, diagnostiquer une ressource Azure qui dérive en production, optimiser une facture cloud avant qu'elle parte en vrille : ces cas d'usage concrets sont au cœur des skills cloud & devops. Le profil visé va de l'ingénieur backend qui automatise ses pipelines au SRE qui veut déléguer la surveillance de ses ressources à un agent, en passant par le platform engineer qui cherche à brancher de l'infrastructure-as-code sans tout réécrire à la main.
Du côté de l'outillage, l'écosystème est déjà dense. Microsoft et HashiCorp poussent des intégrations solides, et les skills autour de l'observabilité ou du cost management couvrent aujourd'hui la majorité des cas courants. Les couches bas niveau restent plus fragmentées, mais le socle est opérationnel.