Data & IA

Skills pour LLM, bases vectorielles, training de modeles et scraping web.

528 skills

#	Skill	Source	Description
1	aoti-debug	pytorch/pytorch	Diagnostiquer et corriger les erreurs courantes d'AOTInductor avec méthode.	101 064
2	pt2-bug-basher	pytorch/pytorch	Déboguer les erreurs de compilation PyTorch 2 via Dynamo, Inductor et AOTAutograd.	101 064
3	open-source	browser-use/browser-use	Automatiser la navigation web en Python avec des agents IA configurables.	100 965
4	airflow-dag-patterns	wshobson/agents	Orchestrer des pipelines de données Apache Airflow avec patterns, opérateurs et déploiement.	37 256
5	backtesting-frameworks	wshobson/agents	Construire des systèmes de backtesting robustes pour évaluer fiablement des stratégies de trading.	37 256
6	data-quality-frameworks	wshobson/agents	Implémenter des frameworks de qualité de données avec Great Expectations, dbt et contrats.	37 256
7	hybrid-search-implementation	wshobson/agents	Combiner recherche vectorielle et par mots-clés pour améliorer le rappel RAG.	37 256
8	langchain-architecture	wshobson/agents	Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état.	37 256
9	llm-evaluation	wshobson/agents	Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing.	37 256
10	ml-pipeline-workflow	wshobson/agents	Orchestrer un pipeline MLOps complet de l'ingestion des données au déploiement en production.	37 256
11	risk-metrics-calculation	wshobson/agents	Calculer la VaR, CVaR et métriques de risque pour la gestion de portefeuille.	37 256
12	similarity-search-patterns	wshobson/agents	Implémenter une recherche vectorielle sémantique efficace et scalable en production.	37 256
13	spark-optimization	wshobson/agents	Optimiser les jobs Apache Spark avec partitionnement, mémoire et gestion des shuffles.	37 256
14	vector-index-tuning	wshobson/agents	Optimiser les index vectoriels HNSW pour maximiser rappel, vitesse et mémoire.	37 256
15	agentic-eval	github/awesome-copilot	Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA.	35 825
16	arize-annotation	github/awesome-copilot	Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize.	35 825
17	arize-experiment	github/awesome-copilot	Gérer et exporter des expériences d'évaluation de modèles IA via Arize.	35 825
18	arize-instrumentation	github/awesome-copilot	Instrumenter une application avec le tracing Arize AX via une analyse guidée.	35 825
19	bigquery-pipeline-audit	github/awesome-copilot	Auditer un pipeline BigQuery pour coûts, sécurité et fiabilité en production.	35 825
20	datanalysis-credit-risk	github/awesome-copilot	Nettoyer et sélectionner des variables pour modélisation de risque crédit.	35 825
21	eval-driven-dev	github/awesome-copilot	Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM.	35 825
22	mini-context-graph	github/awesome-copilot	Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes.	35 825
23	phoenix-evals	github/awesome-copilot	Construire et valider des évaluateurs LLM pour applications IA en production.	35 825
24	phoenix-tracing	github/awesome-copilot	Instrumenter des applications LLM avec Phoenix via le tracing OpenInference.	35 825
25	pinecone-rag	github/awesome-copilot	Construire un pipeline RAG ou une mémoire d'agent persistante avec Pinecone.	35 825
26	create-viz	anthropics/knowledge-work-plugins	Générer des visualisations de données professionnelles avec Python selon les meilleures pratiques.	22 076
27	data-visualization	anthropics/knowledge-work-plugins	Créer des visualisations de données efficaces avec Python selon les meilleures pratiques.	22 076
28	instrument-data-to-allotrope	anthropics/knowledge-work-plugins	Convertir des fichiers instruments au format standardisé Allotrope Simple Model pour LIMS.	22 076
29	nextflow-development	anthropics/knowledge-work-plugins	Déployer et exécuter des pipelines bioinformatiques nf-core sur données locales ou publiques.	22 076
30	scvi-tools	anthropics/knowledge-work-plugins	Analyser des données single-cell multi-modales avec les modèles probabilistes scvi-tools.	22 076
31	single-cell-rna-qc	anthropics/knowledge-work-plugins	Automatiser le contrôle qualité de données single-cell RNA-seq selon les bonnes pratiques scverse.	22 076
32	statistical-analysis	anthropics/knowledge-work-plugins	Analyser des données statistiques avec tendances, distributions et tests d'hypothèses.	22 076
33	hf-cli	huggingface/skills	Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI.	10 736
34	hf-mcp	huggingface/skills	Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU.	10 736
35	hf-mem	huggingface/skills	Estimer la mémoire VRAM nécessaire pour inférer un modèle Hugging Face.	10 736
36	huggingface-community-evals	huggingface/skills	Évaluer localement des modèles Hugging Face Hub avec inspect-ai ou lighteval.	10 736
37	huggingface-llm-trainer	huggingface/skills	Entraîner des modèles de langage avec TRL sur l'infrastructure cloud Hugging Face Jobs.	10 736
38	huggingface-lora-space-builder	huggingface/skills	Créer et publier un espace Gradio sur Hugging Face pour inférence avec un LoRA.	10 736
39	huggingface-paper-publisher	huggingface/skills	Publier, gérer et lier des articles de recherche sur Hugging Face Hub.	10 736
40	huggingface-trackio	huggingface/skills	Suivre, visualiser et piloter des expériences d'entraînement ML en temps réel.	10 736
41	huggingface-vision-trainer	huggingface/skills	Entraîner des modèles de vision (détection, classification, segmentation) sur GPU cloud Hugging Face.	10 736
42	huggingface-zerogpu	huggingface/skills	Configurer et optimiser des démos ML Gradio sur Hugging Face ZeroGPU.	10 736
43	train-sentence-transformers	huggingface/skills	Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage.	10 736
44	trl-training	huggingface/skills	Affiner et aligner des LLMs via SFT, DPO, GRPO, RLOO ou reward modeling.	10 736
45	gemini-api-dev	google-gemini/gemini-skills	Intégrer et utiliser l'API Gemini avec les SDK officiels à jour.	3 711
46	gemini-live-api-dev	google-gemini/gemini-skills	Développer des interactions vocales et vidéo temps réel avec l'API Gemini Live.	3 711
47	upload-parity-experiments	harbor-framework/harbor	Publier des résultats d'expériences de parité Harbor sur Hugging Face via Git sparse checkout.	2 763
48	agent-framework-azure-ai-py	microsoft/skills	Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation.	2 623
49	azure-ai-contentunderstanding-py	microsoft/skills	Extraire du contenu sémantique multimodal depuis documents, vidéos, audios et images.	2 623
50	azure-ai-language-conversations-py	microsoft/skills	Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié.	2 623

À propos de cette sélection

L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.