Bases vectorielles
Stockage et recherche d'embeddings : Pinecone, Qdrant, recherche semantique.
| # | Skill | Source | Description | ||
|---|---|---|---|---|---|
| 1 | embedding-strategies | wshobson/agents | Choisir et optimiser les modèles d'embedding pour la recherche vectorielle. | 36 831 | |
| 2 | hybrid-search-implementation | wshobson/agents | Combiner recherche vectorielle et par mots-clés pour améliorer le rappel RAG. | 36 831 | |
| 3 | rag-implementation | wshobson/agents | Implémenter la RAG pour construire des applications LLM avec réponses factuelles et sourcées. | 36 831 | |
| 4 | similarity-search-patterns | wshobson/agents | Implémenter une recherche vectorielle sémantique efficace et scalable en production. | 36 831 | |
| 5 | vector-index-tuning | wshobson/agents | Optimiser les index vectoriels HNSW pour maximiser rappel, vitesse et mémoire. | 36 831 | |
| 6 | pinecone-rag | github/awesome-copilot | Construire un pipeline RAG ou une mémoire d'agent persistante avec Pinecone. | 35 120 | |
| 7 | qdrant-clients-sdk | github/awesome-copilot | Rechercher des exemples de code pour interagir avec l'API Qdrant via ses SDKs officiels. | 35 120 | |
| 8 | qdrant-deployment-options | github/awesome-copilot | Choisir le bon déploiement Qdrant selon ses besoins de production ou prototypage. | 35 120 | |
| 9 | qdrant-horizontal-scaling | github/awesome-copilot | Planifier la scalabilité verticale et horizontale d'un cluster Qdrant efficacement. | 35 120 | |
| 10 | qdrant-indexing-performance-optimization | github/awesome-copilot | Diagnostiquer et résoudre les problèmes de lenteur d'indexation dans Qdrant. | 35 120 | |
| 11 | qdrant-memory-usage-optimization | github/awesome-copilot | Optimiser et surveiller l'utilisation mémoire de Qdrant pour des performances maximales. | 35 120 | |
| 12 | qdrant-minimize-latency | github/awesome-copilot | Optimiser la latence des requêtes Qdrant via RAM, CPU et configuration HNSW. | 35 120 | |
| 13 | qdrant-model-migration | github/awesome-copilot | Migrer une collection Qdrant lors d'un changement de modèle d'embedding sans interruption. | 35 120 | |
| 14 | qdrant-performance-optimization | github/awesome-copilot | Optimiser les performances Qdrant : vitesse, indexation et mémoire. | 35 120 | |
| 15 | qdrant-scaling | github/awesome-copilot | Choisir et appliquer la bonne stratégie de scaling Qdrant selon l'objectif visé. | 35 120 | |
| 16 | qdrant-scaling-data-volume | github/awesome-copilot | Scaler des volumes de données massifs via multi-tenancy, fenêtre temporelle ou sharding distribué. | 35 120 | |
| 17 | qdrant-scaling-qps | github/awesome-copilot | Optimiser le débit de requêtes Qdrant via segmentation, quantification et réplication horizontale. | 35 120 | |
| 18 | qdrant-scaling-query-volume | github/awesome-copilot | Optimiser les requêtes multi-shards via sous-échantillonnage statistique de Poisson. | 35 120 | |
| 19 | qdrant-search-quality | github/awesome-copilot | Diagnostiquer et optimiser la qualité de recherche vectorielle dans Qdrant. | 35 120 | |
| 20 | qdrant-search-quality-diagnosis | github/awesome-copilot | Diagnostiquer et corriger la qualité de recherche vectorielle dans Qdrant. | 35 120 | |
| 21 | qdrant-search-speed-optimization | github/awesome-copilot | Diagnostiquer et résoudre les problèmes de performance de recherche vectorielle. | 35 120 | |
| 22 | qdrant-search-strategies | github/awesome-copilot | Optimiser la recherche vectorielle avec hybridation, reranking et feedback de pertinence. | 35 120 | |
| 23 | qdrant-sliding-time-window | github/awesome-copilot | Gérer une fenêtre temporelle glissante dans Qdrant avec rotation de shards ou collections. | 35 120 | |
| 24 | qdrant-tenant-scaling | github/awesome-copilot | Partitionner efficacement Qdrant multi-tenant selon le volume et les contraintes d'isolation. | 35 120 | |
| 25 | qdrant-version-upgrade | github/awesome-copilot | Gérer les mises à niveau de version Qdrant en garantissant compatibilité et continuité de service. | 35 120 | |
| 26 | qdrant-vertical-scaling | github/awesome-copilot | Dimensionner verticalement un cluster Qdrant en augmentant CPU, RAM ou disque. | 35 120 | |
| 27 | azure-search-documents-dotnet | microsoft/skills | Créer des applications de recherche full-text, vectorielle et hybride sur Azure. | 2 568 | |
| 28 | azure-search-documents-py | microsoft/skills | Implémenter la recherche full-text, vectorielle et hybride avec Azure AI Search. | 2 568 | |
| 29 | azure-search-documents-ts | microsoft/skills | Implémenter la recherche vectorielle, hybride et sémantique avec Azure AI Search en TypeScript. | 2 568 | |
| 30 | nemo-retriever | nvidia/skills | Indexer et interroger des dossiers de fichiers multimédias via une CLI RAG optimisée. | 1 285 | |
| 31 | chromadb | mkurman/zorai | Stocker et interroger des documents via une base vectorielle embarquée avec filtrage sémantique. | 312 | |
| 32 | embedding-analysis | mkurman/zorai | Dédupliquer et filtrer des datasets textuels via analyse d'embeddings sémantiques. | 312 | |
| 33 | lancedb | mkurman/zorai | Stocker et interroger des vecteurs multimodaux avec LanceDB sans serveur dédié. | 312 | |
| 34 | milvus | mkurman/zorai | Déployer et interroger une base vectorielle Milvus pour la recherche de similarité à grande échelle. | 312 | |
| 35 | qdrant | mkurman/zorai | Indexer et rechercher des vecteurs dans une base Qdrant haute performance. | 312 | |
| 36 | weaviate | mkurman/zorai | Gérer une base vectorielle Weaviate avec recherche hybride et RAG intégré. | 312 | |
| 37 | qdrant-clients-sdk | qdrant/skills | Rechercher des exemples de code pour interagir avec l'API Qdrant via ses SDKs officiels. | 166 | |
| 38 | qdrant-deployment-options | qdrant/skills | Choisir le bon déploiement Qdrant selon ses besoins de production ou prototypage. | 166 | |
| 39 | qdrant-horizontal-scaling | qdrant/skills | Configurer et dimensionner un cluster Qdrant distribué pour maximiser capacité et tolérance aux pannes. | 166 | |
| 40 | qdrant-hybrid-search | qdrant/skills | Construire des pipelines de recherche hybride dans Qdrant via l'API Query. | 166 | |
| 41 | qdrant-hybrid-search-combining | qdrant/skills | Fusionner des résultats de recherche parallèles via RRF, DBSF ou late interaction. | 166 | |
| 42 | qdrant-hybrid-search-prefetches | qdrant/skills | Gérer plusieurs types de recherche vectorielle en parallèle dans une seule requête Qdrant. | 166 | |
| 43 | qdrant-indexing-performance-optimization | qdrant/skills | Optimiser la vitesse d'indexation et d'ingestion dans Qdrant. | 166 | |
| 44 | qdrant-memory-usage-optimization | qdrant/skills | Optimiser et surveiller l'utilisation mémoire de Qdrant pour réduire l'empreinte RAM. | 166 | |
| 45 | qdrant-minimize-latency | qdrant/skills | Optimiser la latence des requêtes Qdrant via RAM, CPU et segmentation. | 166 | |
| 46 | qdrant-model-migration | qdrant/skills | Migrer une collection Qdrant lors d'un changement de modèle d'embedding sans interruption. | 166 | |
| 47 | qdrant-monitoring | qdrant/skills | Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production. | 166 | |
| 48 | qdrant-monitoring-debugging | qdrant/skills | Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire. | 166 | |
| 49 | qdrant-performance-optimization | qdrant/skills | Optimiser les performances Qdrant : vitesse, indexation et mémoire. | 166 | |
| 50 | qdrant-relevance-feedback | qdrant/skills | Calibrer et utiliser la recherche vectorielle enrichie par retour de pertinence avec Qdrant. | 166 |
À propos de cette sélection
Relier un LLM à une mémoire persistante exige bien plus qu'un appel HTTP. Il faut créer des collections typées, gérer les namespaces par tenant, calibrer les paramètres HNSW pour que la latence reste acceptable sous charge, et piloter les mises à jour d'embeddings sans corrompre les vecteurs existants. Ce sont ces opérations que couvrent les skills bases vectorielles répertoriés ici. Le profil ciblé est le dev backend ou ML engineer qui intègre de la recherche sémantique dans un pipeline RAG ou un moteur de recommandation. Qdrant concentre une part importante de la sélection, avec des skills dédiés à la migration de modèles, au scaling et à l'optimisation d'indexation. Pinecone est aussi représenté. L'outillage est mature côté SDK, mais reste fragmenté dès qu'on touche à l'observabilité ou au fine-tuning des index en production.