qdrant-scaling-query-volume

Par qdrant · skills

Guide la mise à l'échelle du volume de requêtes Qdrant. À utiliser quand quelqu'un demande « la requête retourne trop de résultats », « performance du scroll », « grandes valeurs de limit », « pagination des résultats de recherche », « récupération de nombreux vecteurs », ou « résultats à haute cardinalité ».

npx skills add https://github.com/qdrant/skills --skill qdrant-scaling-query-volume

Mise à l'échelle pour le volume de requêtes

Problème : Quand une requête a une limite élevée (par ex. 1000) et qu'il y a plusieurs shards (par ex. 10), naïvement chaque shard doit retourner les 1000 résultats complets — totalisant 10 000 points notés transférés et fusionnés. C'est inefficace puisque les données sont distribuées aléatoirement entre les auto-shards.

Idée centrale

Au lieu de demander à chaque shard la limite complète, demander à chaque shard une limite plus petite calculée via les statistiques de la distribution de Poisson, puis fusionner. C'est sûr parce que l'auto-sharding garantit une distribution de données aléatoire et indépendante.

Quand cela s'active

Plus de 1 shard
L'auto-sharding est en use (tous les shards interrogés partagent la même shard key)
La limite + offset de la requête >= SHARD_QUERY_SUBSAMPLING_LIMIT (128)
La requête n'est pas exacte

Compromis clé

La stratégie échange une petite probabilité de résultats légèrement incomplets contre une réduction importante du transfert de données inter-shards, particulièrement pour les requêtes à limite élevée sur plusieurs shards. Le facteur de sécurité 1.2x et le seuil de Poisson à 99,9% maintiennent le taux d'erreur très bas — comparable aux imprécisions déjà introduites par les indices vectoriels approximatifs comme HNSW.

Étoiles: 213
Découvert: 2026-04-29
Mis à jour: 2026-03-27
Licence: Apache-2.0
Dernière release: v0.1.0 · 2026-03-31
Source: GitHub ↗

Santé du projet
Dernier push: hier
Forks: 25
Issues ouvertes: 13
Watchers: 2

Utile ?

Skills similaires

qdrant-model-migration

qdrant / skills

Migrer une collection Qdrant lors d'un changement de modèle d'embedding sans interruption.

213

qdrant-hybrid-search-prefetches

qdrant / skills

Gérer plusieurs types de recherche vectorielle en parallèle dans une seule requête Qdrant.

213

qdrant-model-migration

github / awesome-copilot

Migrer une collection Qdrant lors d'un changement de modèle d'embedding sans interruption.

37 307

qdrant-clients-sdk

github / awesome-copilot

Rechercher des exemples de code pour interagir avec l'API Qdrant via ses SDKs officiels.

37 307

qdrant-clients-sdk

qdrant / skills

Rechercher des exemples de code pour interagir avec l'API Qdrant via ses SDKs officiels.

213