Cloud & DevOps

Skills pour deployer, orchestrer et superviser des applications cloud. Azure, AWS, Kubernetes et observabilite.

84 skills

# Skill Source Description Maj
1 deepstream-sop nvidia/skills Construire et déboguer un pipeline DeepStream GPU pour la détection d'actions industrielles. 2 136 3h
2 deepstream-profile-pipeline nvidia/skills Créer et profiler des pipelines DeepStream optimisés avec mesures Nsight Systems automatisées. 2 136 3h
3 deploying-airflow astronomer/agents Déployer des DAGs Airflow en production via Astro, Docker Compose ou Kubernetes. 395 1j
4 prime-intellect-cli mkurman/zorai Gérer ressources compute, pods, sandboxes et disques via CLI Prime Intellect. 318 7j
5 jetson-validate-image nvidia/skills Valider statiquement et sur cible une image BSP Jetson fraîchement déployée. 2 136 9j
6 jetson-memory-audit nvidia/skills Auditer la mémoire d'un Jetson et libérer les caches CUDA bloqués après un workload. 2 136 9j
7 jetson-customize-pinmux nvidia/skills Configurer les broches Tegra (SFIO, direction, état) et générer les DTSIs BCT correspondants. 2 136 9j
8 tao-run-on-slurm nvidia/skills Soumettre et gérer des jobs GPU sur clusters SLURM via SSH et sbatch. 2 136 9j
9 agent-observability-experiment-py-bootstrap datadog-labs/agent-skills Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs. 138 16j
10 agent-observability-eval-pipeline datadog-labs/agent-skills Orchestrer un pipeline d'évaluation en six phases pour analyser et améliorer des agents IA instrumentés. 138 16j
11 agent-observability-eval-bootstrap datadog-labs/agent-skills Analyser des traces LLM de production pour générer et publier une suite d'évaluateurs Datadog. 138 16j
12 python-appservice-deploy microsoft/azure-skills Déployer du code Python (Flask, Django, FastAPI) sur Azure App Service Linux. 1 247 16j
13 debugging-signals-pipeline posthog/skills Déboguer et monitorer un pipeline de traitement de signaux Temporal end-to-end. 49 17j
14 vss-deploy-profile nvidia/skills Déployer tout profil VSS via un workflow compose structuré et reproductible. 2 136 20j
15 vss-deploy-profile nvidia-ai-blueprints/video-search-and-summarization Déployer et configurer des profils VSS multi-GPU via Docker Compose sur divers matériels NVIDIA. 1 693 21j
16 bdd-container-update nvidia-ai-blueprints/video-search-and-summarization Mettre à jour, versionner et pousser un conteneur de tests BDD dans un registry GitLab. 1 693 21j
17 tao-run-on-lepton nvidia/skills Soumettre et gérer des workloads GPU conteneurisés sur la plateforme cloud Lepton. 2 136 23j
18 huggingface-spaces huggingface/skills Créer, déployer et maintenir des applications ML sur Hugging Face Spaces. 10 753 27j
19 llm-obs-eval-bootstrap datadog-labs/agent-skills Générer une suite d'évaluateurs prêts à l'emploi à partir de traces LLM en production. 138 29j
20 launch-nemo-rl nvidia/skills Lancer et gérer des recettes NeMo-RL sur Kubernetes via la CLI nrl-k8s. 2 136 29j
21 holoscan-install-conda nvidia/skills Installer le SDK Holoscan dans un environnement Conda sur Linux x86_64. 2 136 1mo
22 mcore-run-on-slurm nvidia/skills Lancer Megatron-LM sur un cluster SLURM multi-nœuds avec configuration distribuée. 2 136 1mo
23 namecheap github/awesome-copilot Gérer les enregistrements DNS Namecheap via API avec Python. 36 038 1mo
24 dynamo-troubleshoot nvidia/skills Diagnostiquer et classifier les pannes Dynamo pour proposer des actions correctives précises. 2 136 1mo
25 dynamo-router-starter nvidia/skills Configurer et valider un routeur Dynamo en mode KV ou round-robin. 2 136 1mo
26 dynamo-recipe-runner nvidia/skills Déployer et valider un endpoint Dynamo via recettes existantes avec smoke test. 2 136 1mo
27 dynamo-interconnect-check nvidia/skills Vérifier le transport RDMA/NVLink d'un déploiement Dynamo disaggrégé avant benchmark. 2 136 1mo
28 redis-observability redis/agent-skills Surveiller, diagnostiquer et alerter sur les métriques clés d'une instance Redis. 81 1mo
29 python-observability wshobson/agents Instrumenter des applications Python avec logs structurés, métriques et traces distribuées. 37 411 1mo
30 distributed-tracing wshobson/agents Implémenter le traçage distribué avec Jaeger et Tempo pour visualiser les flux de requêtes. 37 411 1mo
31 perf-host-analysis nvidia/skills Analyser les surcharges CPU dans des traces nsys pour les workloads d'inférence TensorRT-LLM. 2 136 1mo
32 build-and-dependency nvidia/skills Construire et gérer des environnements de développement containerisés pour Megatron-LM avec CUDA. 2 136 1mo
33 multi-node-slurm nvidia/skills Convertir des commandes distribuées PyTorch en scripts Slurm multi-nœuds avec conteneurs Enroot. 2 136 1mo
34 exec-slurm-compile nvidia/skills Compiler TensorRT-LLM sur un cluster SLURM via des conteneurs enroot. 2 136 1mo
35 flowstudio-power-automate-build github/awesome-copilot Construire et déployer des flows Power Automate via le serveur MCP FlowStudio. 36 038 1mo
36 bump-dependency nvidia/skills Gérer end-to-end le bump de dépendances GPU dans Megatron Bridge jusqu'au CI vert. 2 136 1mo
37 modal mkurman/zorai Déployer et exécuter du Python serverless sur GPU dans le cloud avec Modal. 318 1mo
38 wayback-cdx-cloud-ip-workaround divinevideo/divine-mobile Contourner le blocage IP cloud de l'API Wayback CDX via GCS comme intermédiaire. 256 1mo
39 dead-cdn-dns-bypass divinevideo/divine-mobile Contourner le DNS mort d'un CDN pour récupérer du contenu archivé disparu. 256 1mo
40 run-on-slurm nvidia/skills Lancer et superviser un entraînement Megatron-LM distribué sur cluster SLURM. 2 136 1mo
41 python-azure-iot-edge-modules github/awesome-copilot Concevoir et déployer des modules Python IoT Edge fiables pour traitement de télémétrie en périphérie. 36 038 2mo
42 ci-failure-retrieval nvidia/skills Récupérer et analyser les échecs CI Jenkins d'une pull request GitHub. 2 136 2mo
43 publish-models replicate/skills Publier et tester un modèle Cog sur Replicate avec validation automatique. 50 2mo
44 hosted-agents-v2-py microsoft/skills Déployer des agents hébergés sur Microsoft Foundry avec protocoles configurables. 2 652 2mo
45 agents-v2-py microsoft/skills Créer et gérer des agents IA hébergés dans des conteneurs Azure via le SDK Python. 2 652 2mo
46 azure-storage-queue-py microsoft/skills Gérer des files d'attente Azure Storage pour communication asynchrone via Python. 2 652 2mo
47 azure-storage-file-share-py microsoft/skills Gérer des partages de fichiers SMB Azure via le SDK Python. 2 652 2mo
48 azure-storage-file-datalake-py microsoft/skills Gérer fichiers et répertoires sur Azure Data Lake Storage Gen2 via Python. 2 652 2mo
49 azure-storage-blob-py microsoft/skills Gérer des blobs Azure Storage via le SDK Python avec upload, download et listing. 2 652 2mo
50 azure-servicebus-py microsoft/skills Envoyer et recevoir des messages fiables via Azure Service Bus avec Python. 2 652 2mo

À propos de cette sélection

Provisionner une infrastructure depuis une spec Terraform, diagnostiquer une ressource Azure qui dérive en production, optimiser une facture cloud avant qu'elle parte en vrille : ces cas d'usage concrets sont au cœur des skills cloud & devops. Le profil visé va de l'ingénieur backend qui automatise ses pipelines au SRE qui veut déléguer la surveillance de ses ressources à un agent, en passant par le platform engineer qui cherche à brancher de l'infrastructure-as-code sans tout réécrire à la main. Du côté de l'outillage, l'écosystème est déjà dense. Microsoft et HashiCorp poussent des intégrations solides, et les skills autour de l'observabilité ou du cost management couvrent aujourd'hui la majorité des cas courants. Les couches bas niveau restent plus fragmentées, mais le socle est opérationnel.