Data & IA
Skills pour LLM, bases vectorielles, training de modeles et scraping web.
| # | Skill | Source | Description | Δ | |
|---|---|---|---|---|---|
| 1 | open-source | browser-use/browser-use | Automatiser la navigation web en Python avec des agents IA configurables. | 93 761 | 1266 |
| 2 | jupyter-notebook | openai/skills | Créer et structurer des notebooks Jupyter reproductibles pour expériences ou tutoriels. | 19 023 | 592 |
| 3 | arize-annotation | github/awesome-copilot | Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize. | 32 871 | 588 |
| 4 | arize-experiment | github/awesome-copilot | Gérer et exporter des expériences d'évaluation de modèles IA via Arize. | 32 871 | 588 |
| 5 | dataverse-python-advanced-patterns | github/awesome-copilot | Générer du code Python production-ready pour interagir avec l'API Dataverse via son SDK. | 32 871 | 588 |
| 6 | dataverse-python-production-code | github/awesome-copilot | Générer du code Python production-ready pour interagir avec l'API Dataverse. | 32 871 | 588 |
| 7 | doublecheck | github/awesome-copilot | Vérifier automatiquement les affirmations d'une réponse IA avec sourçage détaillé. | 32 871 | 588 |
| 8 | geofeed-tuner | github/awesome-copilot | Créer et optimiser des feeds de géolocalisation IP au format CSV selon RFC 8805. | 32 871 | 588 |
| 9 | phoenix-evals | github/awesome-copilot | Construire et valider des évaluateurs LLM pour applications IA en production. | 32 871 | 588 |
| 10 | phoenix-tracing | github/awesome-copilot | Instrumenter des applications LLM avec Phoenix via le tracing OpenInference. | 32 871 | 588 |
| 11 | python-mcp-server-generator | github/awesome-copilot | Générer un serveur MCP Python complet, production-ready, avec outils typés et gestion d'erreurs. | 32 871 | 588 |
| 12 | agent-governance | github/awesome-copilot | Appliquer des règles de sécurité et de conformité aux actions d'un agent IA. | 32 871 | 588 |
| 13 | agentic-eval | github/awesome-copilot | Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA. | 32 871 | 588 |
| 14 | bigquery-pipeline-audit | github/awesome-copilot | Auditer un pipeline BigQuery pour coûts, sécurité et fiabilité en production. | 32 871 | 588 |
| 15 | datanalysis-credit-risk | github/awesome-copilot | Nettoyer et sélectionner des variables pour modélisation de risque crédit. | 32 871 | 588 |
| 16 | eval-driven-dev | github/awesome-copilot | Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. | 32 871 | 588 |
| 17 | mini-context-graph | github/awesome-copilot | Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. | 32 871 | 588 |
| 18 | nextflow-development | anthropics/knowledge-work-plugins | Déployer et exécuter des pipelines bioinformatiques nf-core sur données locales ou publiques. | 12 099 | 241 |
| 19 | single-cell-rna-qc | anthropics/knowledge-work-plugins | Automatiser le contrôle qualité de données single-cell RNA-seq selon les bonnes pratiques scverse. | 12 099 | 241 |
| 20 | create-viz | anthropics/knowledge-work-plugins | Générer des visualisations de données professionnelles avec Python selon les meilleures pratiques. | 12 099 | 241 |
| 21 | instrument-data-to-allotrope | anthropics/knowledge-work-plugins | Convertir des fichiers instruments au format standardisé Allotrope Simple Model pour LIMS. | 12 099 | 241 |
| 22 | scvi-tools | anthropics/knowledge-work-plugins | Analyser des données single-cell multi-modales avec les modèles probabilistes scvi-tools. | 12 099 | 241 |
| 23 | data-visualization | anthropics/knowledge-work-plugins | Créer des visualisations de données efficaces avec Python selon les meilleures pratiques. | 12 099 | 241 |
| 24 | statistical-analysis | anthropics/knowledge-work-plugins | Analyser des données statistiques avec tendances, distributions et tests d'hypothèses. | 12 099 | 241 |
| 25 | aoti-debug | pytorch/pytorch | Diagnostiquer et corriger les erreurs courantes d'AOTInductor avec méthode. | 99 883 | 191 |
| 26 | pt2-bug-basher | pytorch/pytorch | Déboguer les erreurs de compilation PyTorch 2 via Dynamo, Inductor et AOTAutograd. | 99 883 | 191 |
| 27 | hf-mcp | huggingface/skills | Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU. | 10 483 | 77 |
| 28 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 483 | 77 |
| 29 | huggingface-community-evals | huggingface/skills | Évaluer localement des modèles Hugging Face Hub avec inspect-ai ou lighteval. | 10 483 | 77 |
| 30 | huggingface-paper-publisher | huggingface/skills | Publier, gérer et lier des articles de recherche sur Hugging Face Hub. | 10 483 | 77 |
| 31 | huggingface-llm-trainer | huggingface/skills | Entraîner des modèles de langage avec TRL sur l'infrastructure cloud Hugging Face Jobs. | 10 483 | 77 |
| 32 | huggingface-trackio | huggingface/skills | Suivre, visualiser et piloter des expériences d'entraînement ML en temps réel. | 10 483 | 77 |
| 33 | huggingface-vision-trainer | huggingface/skills | Entraîner des modèles de vision (détection, classification, segmentation) sur GPU cloud Hugging Face. | 10 483 | 77 |
| 34 | train-sentence-transformers | huggingface/skills | Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage. | 10 483 | 77 |
| 35 | agent-framework-azure-ai-py | microsoft/skills | Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. | 2 300 | 68 |
| 36 | azure-ai-contentunderstanding-py | microsoft/skills | Extraire du contenu sémantique multimodal depuis documents, vidéos, audios et images. | 2 300 | 68 |
| 37 | azure-ai-language-conversations-py | microsoft/skills | Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié. | 2 300 | 68 |
| 38 | azure-ai-ml-py | microsoft/skills | Gérer les ressources Azure ML via le SDK Python v2. | 2 300 | 68 |
| 39 | azure-ai-projects-py | microsoft/skills | Créer et déployer des agents IA sur Microsoft Azure Foundry via le SDK Python. | 2 300 | 68 |
| 40 | azure-ai-transcription-py | microsoft/skills | Transcrire de l'audio en texte via Azure AI, en temps réel ou par lot. | 2 300 | 68 |
| 41 | azure-ai-vision-imageanalysis-py | microsoft/skills | Analyser des images Azure AI pour extraire texte, objets, légendes et tags. | 2 300 | 68 |
| 42 | azure-search-documents-py | microsoft/skills | Implémenter la recherche full-text, vectorielle et hybride avec Azure AI Search. | 2 300 | 68 |
| 43 | azure-speech-to-text-rest-py | microsoft/skills | Transcrire des fichiers audio courts en texte via l'API REST Azure Speech. | 2 300 | 68 |
| 44 | gemini-api-dev | google-gemini/gemini-skills | Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. | 3 473 | 55 |
| 45 | gemini-live-api-dev | google-gemini/gemini-skills | Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. | 3 473 | 55 |
| 46 | creating-mermaid-dbt-dag | dbt-labs/dbt-agent-skills | Générer un diagramme Mermaid visuel du DAG dbt d'un modèle donné. | 494 | 29 |
| 47 | using-dbt-index | dbt-labs/dbt-agent-skills | Interroger localement les artefacts dbt via une base DuckDB sans connexion entrepôt. | 494 | 29 |
| 48 | migrating-dbt-core-to-fusion | dbt-labs/dbt-agent-skills | Trier et classer les erreurs de migration dbt pour guider leur résolution. | 494 | 29 |
| 49 | migrating-dbt-project-across-platforms | dbt-labs/dbt-agent-skills | Migrer un projet dbt entre plateformes de données avec validation automatisée. | 494 | 29 |
| 50 | running-dbt-commands | dbt-labs/dbt-agent-skills | Exécuter des commandes dbt efficacement avec sélecteurs, prévisualisation et variables. | 494 | 29 |
À propos de cette sélection
L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.