Pipelines de données
Orchestration et transformation de donnees : Airflow, dbt, Astronomer, ETL et ELT.
| # | Skill | Source | Description | Maj | |
|---|---|---|---|---|---|
| 1 | clickhouse-js-node-troubleshooting | clickhouse/agent-skills | Diagnostiquer et résoudre les problèmes courants du client Node.js ClickHouse. | 425 | 6h |
| 2 | power-bi-model-design-review | github/awesome-copilot | Auditer et optimiser la conception d'un modèle de données Power BI. | 32 878 | 20h |
| 3 | arize-dataset | github/awesome-copilot | Gérer et exporter des datasets versionnés dans l'espace Arize via CLI. | 32 878 | 20h |
| 4 | tinybird | tinybirdco/tinybird-agent-skills | Créer, optimiser et valider des fichiers Tinybird selon les meilleures pratiques. | 16 | 2j |
| 5 | delegating-to-otto | astronomer/agents | Déléguer des tâches complexes Airflow à l'agent Otto via l'Astro CLI. | 362 | 5j |
| 6 | video-analytics | nvidia/skills | Interroger incidents, alertes et métriques vidéo via Elasticsearch et MCP JSON-RPC. | 85 | 5j |
| 7 | cuopt-routing-api-python | nvidia/skills | Résoudre des problèmes de routage VRP/TSP/PDP avec l'API Python cuOpt. | 85 | 5j |
| 8 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 483 | 7j |
| 9 | omni-model-builder | exploreomni/omni-agent-skills | Créer et modifier un modèle sémantique Omni via l'API YAML en branches sécurisées. | 16 | 8j |
| 10 | using-dbt-index | dbt-labs/dbt-agent-skills | Interroger localement les artefacts dbt via une base DuckDB sans connexion entrepôt. | 495 | 8j |
| 11 | running-dbt-commands | dbt-labs/dbt-agent-skills | Exécuter des commandes dbt efficacement avec sélecteurs, prévisualisation et variables. | 495 | 8j |
| 12 | mini-context-graph | github/awesome-copilot | Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. | 32 878 | 8j |
| 13 | setting-up-astro-project | astronomer/agents | Initialiser et configurer un projet Airflow avec l'Astro CLI. | 362 | 9j |
| 14 | airflow | astronomer/agents | Gérer, diagnostiquer et opérer des workflows Airflow via des commandes CLI dédiées. | 362 | 9j |
| 15 | data-analytics | elophanto/elophanto | Analyser des données, créer des dashboards et automatiser des rapports décisionnels. | 59 | 10j |
| 16 | data-consolidation | elophanto/elophanto | Agréger et visualiser les performances commerciales par territoire, représentant et période. | 59 | 10j |
| 17 | data-engineering | elophanto/elophanto | Concevoir et opérer des pipelines de données fiables, scalables et observables à grande échelle. | 59 | 10j |
| 18 | sales-data-extraction | elophanto/elophanto | Surveiller des répertoires Excel et extraire automatiquement les métriques de vente normalisées. | 59 | 10j |
| 19 | airflow-hitl | astronomer/agents | Intégrer des points de validation humaine dans un DAG Airflow via des opérateurs déférables. | 362 | 13j |
| 20 | authoring-dags | astronomer/agents | Créer et valider des DAGs Airflow via le CLI af en suivant les bonnes pratiques. | 362 | 13j |
| 21 | debugging-dags | astronomer/agents | Diagnostiquer et résoudre les échecs de DAGs Airflow avec des actions correctives ciblées. | 362 | 13j |
| 22 | testing-dags | astronomer/agents | Tester, déboguer et corriger des DAGs Airflow via des cycles trigger-wait itératifs. | 362 | 13j |
| 23 | querying-posthog-data | posthog/skills | Interroger et analyser des données PostHog via SQL pour trouver entités et métriques analytiques. | 36 | 13j |
| 24 | migrating-ai-sdk-to-common-ai | astronomer/agents | Migrer un projet Airflow de airflow-ai-sdk vers apache-airflow-providers-common-ai. | 362 | 13j |
| 25 | dag-factory | astronomer/agents | Générer des DAGs Apache Airflow déclarativement depuis des fichiers YAML avec dag-factory. | 362 | 16j |
| 26 | omni-model-explorer | exploreomni/omni-agent-skills | Explorer un modèle sémantique Omni via la CLI pour comprendre sa structure. | 16 | 19j |
| 27 | auditing-warehouse-data-health | posthog/skills | Auditer l'ensemble du pipeline d'entrepôt de données pour identifier les défaillances actives. | 36 | 19j |
| 28 | diagnosing-failed-warehouse-syncs | posthog/skills | Diagnostiquer et réparer les synchronisations défaillantes d'un entrepôt de données. | 36 | 19j |
| 29 | tuning-incremental-sync-config | posthog/skills | Modifier la configuration de synchronisation incrémentale d'une table déjà connectée. | 36 | 19j |
| 30 | omni-to-databricks-metric-view | exploreomni/omni-agent-skills | Convertir un topic Omni en Databricks Metric View via CLI et YAML. | 16 | 20j |
| 31 | omni-to-snowflake-semantic-view | exploreomni/omni-agent-skills | Convertir un topic Omni en définition YAML Snowflake Semantic View via API. | 16 | 20j |
| 32 | creating-mermaid-dbt-dag | dbt-labs/dbt-agent-skills | Générer un diagramme Mermaid visuel du DAG dbt d'un modèle donné. | 495 | 20j |
| 33 | migrating-dbt-core-to-fusion | dbt-labs/dbt-agent-skills | Trier et classer les erreurs de migration dbt pour guider leur résolution. | 495 | 20j |
| 34 | migrating-dbt-project-across-platforms | dbt-labs/dbt-agent-skills | Migrer un projet dbt entre plateformes de données avec validation automatisée. | 495 | 20j |
| 35 | building-dbt-semantic-layer | dbt-labs/dbt-agent-skills | Créer et modifier des composants dbt Semantic Layer : modèles, entités, dimensions et métriques. | 495 | 20j |
| 36 | working-with-dbt-mesh | dbt-labs/dbt-agent-skills | Configurer et naviguer dans un projet dbt Mesh multi-projets avec des références croisées. | 495 | 20j |
| 37 | instrument-logs | posthog/skills | Intégrer la capture de logs PostHog via OpenTelemetry dans tout projet existant. | 36 | 22j |
| 38 | clickhouse-best-practices | clickhouse/agent-skills | Appliquer les meilleures pratiques ClickHouse pour schémas, requêtes et ingestion de données. | 425 | 23j |
| 39 | routing-formulation | nvidia/skills | Formuler et structurer un problème de routage de véhicules (TSP, VRP, PDP). | 85 | 26j |
| 40 | chdb-datastore | clickhouse/agent-skills | Remplacer pandas par une alternative ClickHouse-backed, plus rapide et sans changer son code. | 425 | 29j |
| 41 | chdb-sql | clickhouse/agent-skills | Exécuter des requêtes SQL ClickHouse en Python sans serveur sur fichiers, bases et cloud. | 425 | 29j |
| 42 | clickhouse-architecture-advisor | clickhouse/agent-skills | Conseiller en architecture ClickHouse adapté au profil de charge et aux données. | 425 | 29j |
| 43 | dagster-expert | dagster-io/skills | Gérer des pipelines Dagster via CLI, assets, automatisation et intégrations externes. | 145 | 1mo |
| 44 | clickhousectl-local-dev | clickhouse/agent-skills | Configurer un environnement ClickHouse local complet avec clickhousectl, étape par étape. | 425 | 1mo |
| 45 | migrating-airflow-2-to-3 | astronomer/agents | Migrer des DAGs Airflow 2.x vers Airflow 3.x en corrigeant imports et API. | 362 | 1mo |
| 46 | azure-ai-document-intelligence-dotnet | microsoft/skills | Extraire texte, tableaux et données structurées depuis des documents Azure. | 2 300 | 1mo |
| 47 | huggingface-tool-builder | huggingface/skills | Créer des scripts CLI réutilisables pour interagir avec l'API Hugging Face. | 10 483 | 1mo |
| 48 | qdrant-scaling-data-volume | qdrant/skills | Scaler des volumes de données massifs via multi-tenancy, fenêtre temporelle ou sharding distribué. | 116 | 1mo |
| 49 | logs-other | posthog/skills | Intégrer PostHog log ingestion via OpenTelemetry dans des applications multi-langages. | 36 | 1mo |
| 50 | logs-python | posthog/skills | Intégrer la collecte de logs PostHog dans des applications Python via OpenTelemetry. | 36 | 1mo |
À propos de cette sélection
L'orchestration de données a longtemps reposé sur des scripts fragiles qu'on ne touchait plus par peur de tout casser. Des acteurs comme Astronomer et dbt Labs ont depuis industrialisé la discipline : DAGs versionnés, transformations testables, lignage de bout en bout. Les skills pipelines de données rassemblés ici couvrent des cas concrets, auditer un pipeline BigQuery pour détecter des dérives de coût ou de fraîcheur, modéliser un dataset pour l'exposer proprement à une couche BI sans multiplier les joins à la main. L'outillage disponible est solide, majoritairement Python, et couvre le spectre du prototypage local au déploiement en production supervisé. Ça parle autant aux data engineers qu'aux ML engineers qui branchent des flux en amont de leurs modèles.