Pipelines de données

Orchestration et transformation de donnees : Airflow, dbt, Astronomer, ETL et ELT.

95 skills

# Skill Source Description Maj
1 clickhouse-js-node-troubleshooting clickhouse/agent-skills Diagnostiquer et résoudre les problèmes courants du client Node.js ClickHouse. 425 6h
2 power-bi-model-design-review github/awesome-copilot Auditer et optimiser la conception d'un modèle de données Power BI. 32 878 20h
3 arize-dataset github/awesome-copilot Gérer et exporter des datasets versionnés dans l'espace Arize via CLI. 32 878 20h
4 tinybird tinybirdco/tinybird-agent-skills Créer, optimiser et valider des fichiers Tinybird selon les meilleures pratiques. 16 2j
5 delegating-to-otto astronomer/agents Déléguer des tâches complexes Airflow à l'agent Otto via l'Astro CLI. 362 5j
6 video-analytics nvidia/skills Interroger incidents, alertes et métriques vidéo via Elasticsearch et MCP JSON-RPC. 85 5j
7 cuopt-routing-api-python nvidia/skills Résoudre des problèmes de routage VRP/TSP/PDP avec l'API Python cuOpt. 85 5j
8 hf-cli huggingface/skills Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. 10 483 7j
9 omni-model-builder exploreomni/omni-agent-skills Créer et modifier un modèle sémantique Omni via l'API YAML en branches sécurisées. 16 8j
10 using-dbt-index dbt-labs/dbt-agent-skills Interroger localement les artefacts dbt via une base DuckDB sans connexion entrepôt. 495 8j
11 running-dbt-commands dbt-labs/dbt-agent-skills Exécuter des commandes dbt efficacement avec sélecteurs, prévisualisation et variables. 495 8j
12 mini-context-graph github/awesome-copilot Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. 32 878 8j
13 setting-up-astro-project astronomer/agents Initialiser et configurer un projet Airflow avec l'Astro CLI. 362 9j
14 airflow astronomer/agents Gérer, diagnostiquer et opérer des workflows Airflow via des commandes CLI dédiées. 362 9j
15 data-analytics elophanto/elophanto Analyser des données, créer des dashboards et automatiser des rapports décisionnels. 59 10j
16 data-consolidation elophanto/elophanto Agréger et visualiser les performances commerciales par territoire, représentant et période. 59 10j
17 data-engineering elophanto/elophanto Concevoir et opérer des pipelines de données fiables, scalables et observables à grande échelle. 59 10j
18 sales-data-extraction elophanto/elophanto Surveiller des répertoires Excel et extraire automatiquement les métriques de vente normalisées. 59 10j
19 airflow-hitl astronomer/agents Intégrer des points de validation humaine dans un DAG Airflow via des opérateurs déférables. 362 13j
20 authoring-dags astronomer/agents Créer et valider des DAGs Airflow via le CLI af en suivant les bonnes pratiques. 362 13j
21 debugging-dags astronomer/agents Diagnostiquer et résoudre les échecs de DAGs Airflow avec des actions correctives ciblées. 362 13j
22 testing-dags astronomer/agents Tester, déboguer et corriger des DAGs Airflow via des cycles trigger-wait itératifs. 362 13j
23 querying-posthog-data posthog/skills Interroger et analyser des données PostHog via SQL pour trouver entités et métriques analytiques. 36 13j
24 migrating-ai-sdk-to-common-ai astronomer/agents Migrer un projet Airflow de airflow-ai-sdk vers apache-airflow-providers-common-ai. 362 13j
25 dag-factory astronomer/agents Générer des DAGs Apache Airflow déclarativement depuis des fichiers YAML avec dag-factory. 362 16j
26 omni-model-explorer exploreomni/omni-agent-skills Explorer un modèle sémantique Omni via la CLI pour comprendre sa structure. 16 19j
27 auditing-warehouse-data-health posthog/skills Auditer l'ensemble du pipeline d'entrepôt de données pour identifier les défaillances actives. 36 19j
28 diagnosing-failed-warehouse-syncs posthog/skills Diagnostiquer et réparer les synchronisations défaillantes d'un entrepôt de données. 36 19j
29 tuning-incremental-sync-config posthog/skills Modifier la configuration de synchronisation incrémentale d'une table déjà connectée. 36 19j
30 omni-to-databricks-metric-view exploreomni/omni-agent-skills Convertir un topic Omni en Databricks Metric View via CLI et YAML. 16 20j
31 omni-to-snowflake-semantic-view exploreomni/omni-agent-skills Convertir un topic Omni en définition YAML Snowflake Semantic View via API. 16 20j
32 creating-mermaid-dbt-dag dbt-labs/dbt-agent-skills Générer un diagramme Mermaid visuel du DAG dbt d'un modèle donné. 495 20j
33 migrating-dbt-core-to-fusion dbt-labs/dbt-agent-skills Trier et classer les erreurs de migration dbt pour guider leur résolution. 495 20j
34 migrating-dbt-project-across-platforms dbt-labs/dbt-agent-skills Migrer un projet dbt entre plateformes de données avec validation automatisée. 495 20j
35 building-dbt-semantic-layer dbt-labs/dbt-agent-skills Créer et modifier des composants dbt Semantic Layer : modèles, entités, dimensions et métriques. 495 20j
36 working-with-dbt-mesh dbt-labs/dbt-agent-skills Configurer et naviguer dans un projet dbt Mesh multi-projets avec des références croisées. 495 20j
37 instrument-logs posthog/skills Intégrer la capture de logs PostHog via OpenTelemetry dans tout projet existant. 36 22j
38 clickhouse-best-practices clickhouse/agent-skills Appliquer les meilleures pratiques ClickHouse pour schémas, requêtes et ingestion de données. 425 23j
39 routing-formulation nvidia/skills Formuler et structurer un problème de routage de véhicules (TSP, VRP, PDP). 85 26j
40 chdb-datastore clickhouse/agent-skills Remplacer pandas par une alternative ClickHouse-backed, plus rapide et sans changer son code. 425 29j
41 chdb-sql clickhouse/agent-skills Exécuter des requêtes SQL ClickHouse en Python sans serveur sur fichiers, bases et cloud. 425 29j
42 clickhouse-architecture-advisor clickhouse/agent-skills Conseiller en architecture ClickHouse adapté au profil de charge et aux données. 425 29j
43 dagster-expert dagster-io/skills Gérer des pipelines Dagster via CLI, assets, automatisation et intégrations externes. 145 1mo
44 clickhousectl-local-dev clickhouse/agent-skills Configurer un environnement ClickHouse local complet avec clickhousectl, étape par étape. 425 1mo
45 migrating-airflow-2-to-3 astronomer/agents Migrer des DAGs Airflow 2.x vers Airflow 3.x en corrigeant imports et API. 362 1mo
46 azure-ai-document-intelligence-dotnet microsoft/skills Extraire texte, tableaux et données structurées depuis des documents Azure. 2 300 1mo
47 huggingface-tool-builder huggingface/skills Créer des scripts CLI réutilisables pour interagir avec l'API Hugging Face. 10 483 1mo
48 qdrant-scaling-data-volume qdrant/skills Scaler des volumes de données massifs via multi-tenancy, fenêtre temporelle ou sharding distribué. 116 1mo
49 logs-other posthog/skills Intégrer PostHog log ingestion via OpenTelemetry dans des applications multi-langages. 36 1mo
50 logs-python posthog/skills Intégrer la collecte de logs PostHog dans des applications Python via OpenTelemetry. 36 1mo

À propos de cette sélection

L'orchestration de données a longtemps reposé sur des scripts fragiles qu'on ne touchait plus par peur de tout casser. Des acteurs comme Astronomer et dbt Labs ont depuis industrialisé la discipline : DAGs versionnés, transformations testables, lignage de bout en bout. Les skills pipelines de données rassemblés ici couvrent des cas concrets, auditer un pipeline BigQuery pour détecter des dérives de coût ou de fraîcheur, modéliser un dataset pour l'exposer proprement à une couche BI sans multiplier les joins à la main. L'outillage disponible est solide, majoritairement Python, et couvre le spectre du prototypage local au déploiement en production supervisé. Ça parle autant aux data engineers qu'aux ML engineers qui branchent des flux en amont de leurs modèles.