Data & IA
Skills pour LLM, bases vectorielles, training de modeles et scraping web.
| # | Skill | Source | Description | ||
|---|---|---|---|---|---|
| 1 | aoti-debug | pytorch/pytorch | Diagnostiquer et corriger les erreurs courantes d'AOTInductor avec méthode. | 101 064 | |
| 2 | pt2-bug-basher | pytorch/pytorch | Déboguer les erreurs de compilation PyTorch 2 via Dynamo, Inductor et AOTAutograd. | 101 064 | |
| 3 | open-source | browser-use/browser-use | Automatiser la navigation web en Python avec des agents IA configurables. | 100 965 | |
| 4 | airflow-dag-patterns | wshobson/agents | Orchestrer des pipelines de données Apache Airflow avec patterns, opérateurs et déploiement. | 37 256 | |
| 5 | backtesting-frameworks | wshobson/agents | Construire des systèmes de backtesting robustes pour évaluer fiablement des stratégies de trading. | 37 256 | |
| 6 | data-quality-frameworks | wshobson/agents | Implémenter des frameworks de qualité de données avec Great Expectations, dbt et contrats. | 37 256 | |
| 7 | hybrid-search-implementation | wshobson/agents | Combiner recherche vectorielle et par mots-clés pour améliorer le rappel RAG. | 37 256 | |
| 8 | langchain-architecture | wshobson/agents | Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. | 37 256 | |
| 9 | llm-evaluation | wshobson/agents | Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. | 37 256 | |
| 10 | ml-pipeline-workflow | wshobson/agents | Orchestrer un pipeline MLOps complet de l'ingestion des données au déploiement en production. | 37 256 | |
| 11 | risk-metrics-calculation | wshobson/agents | Calculer la VaR, CVaR et métriques de risque pour la gestion de portefeuille. | 37 256 | |
| 12 | similarity-search-patterns | wshobson/agents | Implémenter une recherche vectorielle sémantique efficace et scalable en production. | 37 256 | |
| 13 | spark-optimization | wshobson/agents | Optimiser les jobs Apache Spark avec partitionnement, mémoire et gestion des shuffles. | 37 256 | |
| 14 | vector-index-tuning | wshobson/agents | Optimiser les index vectoriels HNSW pour maximiser rappel, vitesse et mémoire. | 37 256 | |
| 15 | agentic-eval | github/awesome-copilot | Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA. | 35 825 | |
| 16 | arize-annotation | github/awesome-copilot | Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize. | 35 825 | |
| 17 | arize-experiment | github/awesome-copilot | Gérer et exporter des expériences d'évaluation de modèles IA via Arize. | 35 825 | |
| 18 | arize-instrumentation | github/awesome-copilot | Instrumenter une application avec le tracing Arize AX via une analyse guidée. | 35 825 | |
| 19 | bigquery-pipeline-audit | github/awesome-copilot | Auditer un pipeline BigQuery pour coûts, sécurité et fiabilité en production. | 35 825 | |
| 20 | datanalysis-credit-risk | github/awesome-copilot | Nettoyer et sélectionner des variables pour modélisation de risque crédit. | 35 825 | |
| 21 | eval-driven-dev | github/awesome-copilot | Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. | 35 825 | |
| 22 | mini-context-graph | github/awesome-copilot | Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. | 35 825 | |
| 23 | phoenix-evals | github/awesome-copilot | Construire et valider des évaluateurs LLM pour applications IA en production. | 35 825 | |
| 24 | phoenix-tracing | github/awesome-copilot | Instrumenter des applications LLM avec Phoenix via le tracing OpenInference. | 35 825 | |
| 25 | pinecone-rag | github/awesome-copilot | Construire un pipeline RAG ou une mémoire d'agent persistante avec Pinecone. | 35 825 | |
| 26 | create-viz | anthropics/knowledge-work-plugins | Générer des visualisations de données professionnelles avec Python selon les meilleures pratiques. | 22 076 | |
| 27 | data-visualization | anthropics/knowledge-work-plugins | Créer des visualisations de données efficaces avec Python selon les meilleures pratiques. | 22 076 | |
| 28 | instrument-data-to-allotrope | anthropics/knowledge-work-plugins | Convertir des fichiers instruments au format standardisé Allotrope Simple Model pour LIMS. | 22 076 | |
| 29 | nextflow-development | anthropics/knowledge-work-plugins | Déployer et exécuter des pipelines bioinformatiques nf-core sur données locales ou publiques. | 22 076 | |
| 30 | scvi-tools | anthropics/knowledge-work-plugins | Analyser des données single-cell multi-modales avec les modèles probabilistes scvi-tools. | 22 076 | |
| 31 | single-cell-rna-qc | anthropics/knowledge-work-plugins | Automatiser le contrôle qualité de données single-cell RNA-seq selon les bonnes pratiques scverse. | 22 076 | |
| 32 | statistical-analysis | anthropics/knowledge-work-plugins | Analyser des données statistiques avec tendances, distributions et tests d'hypothèses. | 22 076 | |
| 33 | hf-cli | huggingface/skills | Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. | 10 736 | |
| 34 | hf-mcp | huggingface/skills | Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU. | 10 736 | |
| 35 | hf-mem | huggingface/skills | Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face. | 10 736 | |
| 36 | huggingface-community-evals | huggingface/skills | Évaluer localement des modèles Hugging Face Hub avec inspect-ai ou lighteval. | 10 736 | |
| 37 | huggingface-llm-trainer | huggingface/skills | Entraîner des modèles de langage avec TRL sur l'infrastructure cloud Hugging Face Jobs. | 10 736 | |
| 38 | huggingface-lora-space-builder | huggingface/skills | Créer et publier un espace Gradio sur Hugging Face pour inférence avec un LoRA. | 10 736 | |
| 39 | huggingface-paper-publisher | huggingface/skills | Publier, gérer et lier des articles de recherche sur Hugging Face Hub. | 10 736 | |
| 40 | huggingface-trackio | huggingface/skills | Suivre, visualiser et piloter des expériences d'entraînement ML en temps réel. | 10 736 | |
| 41 | huggingface-vision-trainer | huggingface/skills | Entraîner des modèles de vision (détection, classification, segmentation) sur GPU cloud Hugging Face. | 10 736 | |
| 42 | huggingface-zerogpu | huggingface/skills | Configurer et optimiser des démos ML Gradio sur Hugging Face ZeroGPU. | 10 736 | |
| 43 | train-sentence-transformers | huggingface/skills | Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage. | 10 736 | |
| 44 | trl-training | huggingface/skills | Affiner et aligner des LLMs via SFT, DPO, GRPO, RLOO ou reward modeling. | 10 736 | |
| 45 | gemini-api-dev | google-gemini/gemini-skills | Intégrer et utiliser l'API Gemini avec les SDK officiels à jour. | 3 711 | |
| 46 | gemini-live-api-dev | google-gemini/gemini-skills | Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live. | 3 711 | |
| 47 | upload-parity-experiments | harbor-framework/harbor | Publier des résultats d'expériences de parité Harbor sur Hugging Face via Git sparse checkout. | 2 763 | |
| 48 | agent-framework-azure-ai-py | microsoft/skills | Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. | 2 623 | |
| 49 | azure-ai-contentunderstanding-py | microsoft/skills | Extraire du contenu sémantique multimodal depuis documents, vidéos, audios et images. | 2 623 | |
| 50 | azure-ai-language-conversations-py | microsoft/skills | Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié. | 2 623 |
À propos de cette sélection
L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.