Cloud & DevOps

Skills pour deployer, orchestrer et superviser des applications cloud. Azure, AWS, Kubernetes et observabilite.

82 skills

# Skill Source Description Maj
1 deploying-airflow astronomer/agents Déployer des DAGs Airflow en production via Astro, Docker Compose ou Kubernetes. 395 1j
2 prime-intellect-cli mkurman/zorai Gérer ressources compute, pods, sandboxes et disques via CLI Prime Intellect. 318 7j
3 jetson-validate-image nvidia/skills Valider statiquement et sur cible une image BSP Jetson fraîchement déployée. 2 138 9j
4 jetson-memory-audit nvidia/skills Auditer la mémoire d'un Jetson et libérer les caches CUDA bloqués après un workload. 2 138 9j
5 jetson-customize-pinmux nvidia/skills Configurer les broches Tegra (SFIO, direction, état) et générer les DTSIs BCT correspondants. 2 138 9j
6 tao-run-on-slurm nvidia/skills Soumettre et gérer des jobs GPU sur clusters SLURM via SSH et sbatch. 2 138 9j
7 agent-observability-experiment-py-bootstrap datadog-labs/agent-skills Générer un script Python ou notebook Jupyter d'expérimentation LLM avec ddtrace.llmobs. 138 16j
8 agent-observability-eval-pipeline datadog-labs/agent-skills Orchestrer un pipeline d'évaluation en six phases pour analyser et améliorer des agents IA instrumentés. 138 16j
9 agent-observability-eval-bootstrap datadog-labs/agent-skills Analyser des traces LLM de production pour générer et publier une suite d'évaluateurs Datadog. 138 16j
10 python-appservice-deploy microsoft/azure-skills Déployer du code Python (Flask, Django, FastAPI) sur Azure App Service Linux. 1 247 16j
11 debugging-signals-pipeline posthog/skills Déboguer et monitorer un pipeline de traitement de signaux Temporal end-to-end. 49 17j
12 vss-deploy-profile nvidia/skills Déployer tout profil VSS via un workflow compose structuré et reproductible. 2 138 20j
13 vss-deploy-profile nvidia-ai-blueprints/video-search-and-summarization Déployer et configurer des profils VSS multi-GPU via Docker Compose sur divers matériels NVIDIA. 1 694 21j
14 bdd-container-update nvidia-ai-blueprints/video-search-and-summarization Mettre à jour, versionner et pousser un conteneur de tests BDD dans un registry GitLab. 1 694 21j
15 tao-run-on-lepton nvidia/skills Soumettre et gérer des workloads GPU conteneurisés sur la plateforme cloud Lepton. 2 138 23j
16 huggingface-spaces huggingface/skills Créer, déployer et maintenir des applications ML sur Hugging Face Spaces. 10 753 27j
17 llm-obs-eval-bootstrap datadog-labs/agent-skills Générer une suite d'évaluateurs prêts à l'emploi à partir de traces LLM en production. 138 29j
18 launch-nemo-rl nvidia/skills Lancer et gérer des recettes NeMo-RL sur Kubernetes via la CLI nrl-k8s. 2 138 29j
19 holoscan-install-conda nvidia/skills Installer le SDK Holoscan dans un environnement Conda sur Linux x86_64. 2 138 1mo
20 mcore-run-on-slurm nvidia/skills Lancer Megatron-LM sur un cluster SLURM multi-nœuds avec configuration distribuée. 2 138 1mo
21 namecheap github/awesome-copilot Gérer les enregistrements DNS Namecheap via API avec Python. 36 038 1mo
22 dynamo-troubleshoot nvidia/skills Diagnostiquer et classifier les pannes Dynamo pour proposer des actions correctives précises. 2 138 1mo
23 dynamo-router-starter nvidia/skills Configurer et valider un routeur Dynamo en mode KV ou round-robin. 2 138 1mo
24 dynamo-recipe-runner nvidia/skills Déployer et valider un endpoint Dynamo via recettes existantes avec smoke test. 2 138 1mo
25 dynamo-interconnect-check nvidia/skills Vérifier le transport RDMA/NVLink d'un déploiement Dynamo disaggrégé avant benchmark. 2 138 1mo
26 redis-observability redis/agent-skills Surveiller, diagnostiquer et alerter sur les métriques clés d'une instance Redis. 81 1mo
27 python-observability wshobson/agents Instrumenter des applications Python avec logs structurés, métriques et traces distribuées. 37 414 1mo
28 distributed-tracing wshobson/agents Implémenter le traçage distribué avec Jaeger et Tempo pour visualiser les flux de requêtes. 37 414 1mo
29 perf-host-analysis nvidia/skills Analyser les surcharges CPU dans des traces nsys pour les workloads d'inférence TensorRT-LLM. 2 138 1mo
30 build-and-dependency nvidia/skills Construire et gérer des environnements de développement containerisés pour Megatron-LM avec CUDA. 2 138 1mo
31 multi-node-slurm nvidia/skills Convertir des commandes distribuées PyTorch en scripts Slurm multi-nœuds avec conteneurs Enroot. 2 138 1mo
32 exec-slurm-compile nvidia/skills Compiler TensorRT-LLM sur un cluster SLURM via des conteneurs enroot. 2 138 1mo
33 flowstudio-power-automate-build github/awesome-copilot Construire et déployer des flows Power Automate via le serveur MCP FlowStudio. 36 038 1mo
34 bump-dependency nvidia/skills Gérer end-to-end le bump de dépendances GPU dans Megatron Bridge jusqu'au CI vert. 2 138 1mo
35 modal mkurman/zorai Déployer et exécuter du Python serverless sur GPU dans le cloud avec Modal. 318 1mo
36 wayback-cdx-cloud-ip-workaround divinevideo/divine-mobile Contourner le blocage IP cloud de l'API Wayback CDX via GCS comme intermédiaire. 256 1mo
37 dead-cdn-dns-bypass divinevideo/divine-mobile Contourner le DNS mort d'un CDN pour récupérer du contenu archivé disparu. 256 1mo
38 run-on-slurm nvidia/skills Lancer et superviser un entraînement Megatron-LM distribué sur cluster SLURM. 2 138 1mo
39 python-azure-iot-edge-modules github/awesome-copilot Concevoir et déployer des modules Python IoT Edge fiables pour traitement de télémétrie en périphérie. 36 038 2mo
40 ci-failure-retrieval nvidia/skills Récupérer et analyser les échecs CI Jenkins d'une pull request GitHub. 2 138 2mo
41 publish-models replicate/skills Publier et tester un modèle Cog sur Replicate avec validation automatique. 50 2mo
42 hosted-agents-v2-py microsoft/skills Déployer des agents hébergés sur Microsoft Foundry avec protocoles configurables. 2 652 2mo
43 agents-v2-py microsoft/skills Créer et gérer des agents IA hébergés dans des conteneurs Azure via le SDK Python. 2 652 2mo
44 azure-storage-queue-py microsoft/skills Gérer des files d'attente Azure Storage pour communication asynchrone via Python. 2 652 2mo
45 azure-storage-file-share-py microsoft/skills Gérer des partages de fichiers SMB Azure via le SDK Python. 2 652 2mo
46 azure-storage-file-datalake-py microsoft/skills Gérer fichiers et répertoires sur Azure Data Lake Storage Gen2 via Python. 2 652 2mo
47 azure-storage-blob-py microsoft/skills Gérer des blobs Azure Storage via le SDK Python avec upload, download et listing. 2 652 2mo
48 azure-servicebus-py microsoft/skills Envoyer et recevoir des messages fiables via Azure Service Bus avec Python. 2 652 2mo
49 azure-monitor-query-py microsoft/skills Interroger logs et métriques Azure Monitor via le SDK Python. 2 652 2mo
50 azure-monitor-opentelemetry-py microsoft/skills Configurer Azure Monitor avec OpenTelemetry pour instrumenter automatiquement des apps Python. 2 652 2mo

À propos de cette sélection

Provisionner une infrastructure depuis une spec Terraform, diagnostiquer une ressource Azure qui dérive en production, optimiser une facture cloud avant qu'elle parte en vrille : ces cas d'usage concrets sont au cœur des skills cloud & devops. Le profil visé va de l'ingénieur backend qui automatise ses pipelines au SRE qui veut déléguer la surveillance de ses ressources à un agent, en passant par le platform engineer qui cherche à brancher de l'infrastructure-as-code sans tout réécrire à la main. Du côté de l'outillage, l'écosystème est déjà dense. Microsoft et HashiCorp poussent des intégrations solides, et les skills autour de l'observabilité ou du cost management couvrent aujourd'hui la majorité des cas courants. Les couches bas niveau restent plus fragmentées, mais le socle est opérationnel.