Data & IA
Skills pour LLM, bases vectorielles, training de modeles et scraping web.
| # | Skill | Source | Description | Maj | |
|---|---|---|---|---|---|
| 1 | arize-annotation | github/awesome-copilot | Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize. | 32 871 | 18h |
| 2 | arize-experiment | github/awesome-copilot | Gérer et exporter des expériences d'évaluation de modèles IA via Arize. | 32 871 | 18h |
| 3 | web3-polymarket | elophanto/elophanto | Interagir avec Polymarket pour placer des ordres et gérer un portefeuille de prédiction. | 59 | 2j |
| 4 | monkey-patch-kernels-to-transformers | nvidia/skills | Intégrer des kernels TileGym dans Transformers via monkey-patching pour optimiser les LLM. | 85 | 4j |
| 5 | delegating-to-otto | astronomer/agents | Déléguer des tâches complexes Airflow à l'agent Otto via l'Astro CLI. | 362 | 5j |
| 6 | adding-cutile-kernel | nvidia/skills | Intégrer un nouvel opérateur cuTile dans TileGym selon un workflow structuré étape par étape. | 85 | 5j |
| 7 | converting-cutile-to-triton | nvidia/skills | Convertir des kernels cuTile en kernels Triton via un workflow structuré en cinq phases. | 85 | 5j |
| 8 | cutile-python | nvidia/skills | Écrire, déboguer et optimiser des kernels GPU haute performance avec cuTile Python. | 85 | 5j |
| 9 | byob | nvidia/skills | Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. | 85 | 5j |
| 10 | cuopt-numerical-optimization-api-python | nvidia/skills | Modéliser et résoudre des problèmes LP, MILP et QP avec cuOpt GPU d'NVIDIA. | 85 | 5j |
| 11 | cuopt-routing-api-python | nvidia/skills | Résoudre des problèmes de routage VRP/TSP/PDP avec l'API Python cuOpt. | 85 | 5j |
| 12 | cuopt-user-rules | nvidia/skills | Optimiser des problèmes de routage et logistique avec cuOpt via des échanges guidés. | 85 | 5j |
| 13 | experiment-analyzer | datadog-labs/agent-skills | Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements. | 107 | 6j |
| 14 | eval-bootstrap | datadog-labs/agent-skills | Générer du code d'évaluation Python à partir de traces de production LLM Datadog. | 107 | 6j |
| 15 | train-sentence-transformers | huggingface/skills | Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage. | 10 483 | 6j |
| 16 | pinecone-full-text-search | pinecone-io/skills | Créer et interroger un index full-text-search Pinecone avec l'API preview. | 12 | 6j |
| 17 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 483 | 7j |
| 18 | using-dbt-index | dbt-labs/dbt-agent-skills | Interroger localement les artefacts dbt via une base DuckDB sans connexion entrepôt. | 494 | 8j |
| 19 | running-dbt-commands | dbt-labs/dbt-agent-skills | Exécuter des commandes dbt efficacement avec sélecteurs, prévisualisation et variables. | 494 | 8j |
| 20 | mini-context-graph | github/awesome-copilot | Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. | 32 871 | 8j |
| 21 | setting-up-astro-project | astronomer/agents | Initialiser et configurer un projet Airflow avec l'Astro CLI. | 362 | 9j |
| 22 | airflow | astronomer/agents | Gérer, diagnostiquer et opérer des workflows Airflow via des commandes CLI dédiées. | 362 | 9j |
| 23 | ai-engineering | elophanto/elophanto | Concevoir, déployer et optimiser des modèles IA/ML en production de bout en bout. | 59 | 10j |
| 24 | autonomous-experimentation | elophanto/elophanto | Exécuter une boucle d'expérimentation autonome pour optimiser métriquement n'importe quel code. | 59 | 10j |
| 25 | data-analytics | elophanto/elophanto | Analyser des données, créer des dashboards et automatiser des rapports décisionnels. | 59 | 10j |
| 26 | data-engineering | elophanto/elophanto | Concevoir et opérer des pipelines de données fiables, scalables et observables à grande échelle. | 59 | 10j |
| 27 | sales-data-extraction | elophanto/elophanto | Surveiller des répertoires Excel et extraire automatiquement les métriques de vente normalisées. | 59 | 10j |
| 28 | adding-model-support | nvidia/skills | Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge. | 85 | 12j |
| 29 | mlm-bridge-training | nvidia/skills | Comparer et valider les pertes entre Megatron-LM et Bridge sur GPU. | 85 | 12j |
| 30 | parity-testing | nvidia/skills | Vérifier la parité des poids et des passes avant entre modèles HF et Megatron. | 85 | 12j |
| 31 | perf-activation-recompute | nvidia/skills | Optimiser la mémoire GPU en recomputant sélectivement les activations pendant la rétropropagation. | 85 | 12j |
| 32 | perf-megatron-fsdp | nvidia/skills | Configurer et valider l'entraînement distribué avec Megatron FSDP dans Bridge. | 85 | 12j |
| 33 | perf-moe-dispatcher-selection | nvidia/skills | Sélectionner le dispatcher MoE optimal selon le matériel, le modèle et le degré EP. | 85 | 12j |
| 34 | perf-moe-hardware-configs | nvidia/skills | Configurer les paramètres matériels optimaux pour entraîner des modèles MoE sur GPU. | 85 | 12j |
| 35 | perf-moe-long-context | nvidia/skills | Optimiser l'entraînement long-contexte des modèles MoE avec parallélisme et recompute. | 85 | 12j |
| 36 | perf-moe-optimization-workflow | nvidia/skills | Optimiser l'entraînement de modèles MoE en gérant mémoire, communication et calcul. | 85 | 12j |
| 37 | perf-moe-vlm-training | nvidia/skills | Optimiser l'entraînement de VLM MoE avec FSDP ou parallélisme 3D. | 85 | 12j |
| 38 | perf-parallelism-strategies | nvidia/skills | Sélectionner la stratégie de parallélisme optimale selon la taille du modèle et le matériel. | 85 | 12j |
| 39 | perf-sequence-packing | nvidia/skills | Configurer le packing de séquences pour le finetuning LLM et VLM optimisé. | 85 | 12j |
| 40 | perf-tp-dp-comm-overlap | nvidia/skills | Configurer le chevauchement des communications TP/DP/PP pour optimiser l'entraînement distribué. | 85 | 12j |
| 41 | recipe-recommender | nvidia/skills | Indexer les recettes d'entraînement et recommander la configuration optimale pour LLM. | 85 | 12j |
| 42 | speech-to-text | elevenlabs/skills | Transcrire de l'audio en texte avec détection de locuteurs et horodatage précis. | 235 | 12j |
| 43 | airflow-hitl | astronomer/agents | Intégrer des points de validation humaine dans un DAG Airflow via des opérateurs déférables. | 362 | 13j |
| 44 | authoring-dags | astronomer/agents | Créer et valider des DAGs Airflow via le CLI af en suivant les bonnes pratiques. | 362 | 13j |
| 45 | debugging-dags | astronomer/agents | Diagnostiquer et résoudre les échecs de DAGs Airflow avec des actions correctives ciblées. | 362 | 13j |
| 46 | testing-dags | astronomer/agents | Tester, déboguer et corriger des DAGs Airflow via des cycles trigger-wait itératifs. | 362 | 13j |
| 47 | feature-usage-feed | posthog/skills | Créer un flux Slack automatique des cas d'usage réels d'une feature IA via LLM evals. | 36 | 13j |
| 48 | migrating-ai-sdk-to-common-ai | astronomer/agents | Migrer un projet Airflow de airflow-ai-sdk vers apache-airflow-providers-common-ai. | 362 | 13j |
| 49 | langgraph-persistence | langchain-ai/langchain-skills | Gérer la persistance d'état par threads et checkpoints dans un graphe LangGraph. | 681 | 14j |
| 50 | cudaq-guide | nvidia/skills | Guider l'utilisateur dans CUDA-Q : installation, simulation GPU et accès QPU. | 85 | 14j |
À propos de cette sélection
L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.