qdrant-scaling

npx skills add https://github.com/qdrant/skills --skill qdrant-scaling

Mise à l'échelle de Qdrant

Commencez par déterminer ce que vous souhaitez mettre à l'échelle :

  • volume de données
  • débit de requêtes (QPS)
  • latence des requêtes
  • volume de requêtes

Après avoir déterminé l'objectif de mise à l'échelle, vous pouvez choisir une stratégie de mise à l'échelle en fonction des compromis et des hypothèses. Chacun favorise des stratégies différentes. La mise à l'échelle du débit et de la latence vont dans des directions d'optimisation opposées.

Mise à l'échelle du volume de données

C'est pertinent lorsque le volume du dataset dépasse la capacité d'un seul nœud. En savoir plus sur la mise à l'échelle du volume de données dans Scaling Data Volume

Mise à l'échelle du débit de requêtes

Si votre système doit traiter plus de requêtes parallèles qu'un seul nœud ne peut le faire, vous devez mettre à l'échelle le débit de requêtes.

En savoir plus sur la mise à l'échelle du débit de requêtes dans Scaling for Query Throughput

Mise à l'échelle de la latence des requêtes

La latence d'une seule requête est déterminée par le composant le plus lent du chemin d'exécution de la requête. Elle est parfois corrélée au débit, mais pas toujours. Elle pourrait nécessiter des stratégies différentes pour la mise à l'échelle.

En savoir plus sur la mise à l'échelle de la latence des requêtes dans Scaling for Query Latency

Mise à l'échelle du volume de requêtes

Par volume de requêtes, nous entendons la quantité de résultats qu'une seule requête retourne. Si le volume de requêtes est trop élevé, il peut causer des problèmes de performance et augmenter la latence.

L'optimisation du volume de requêtes pourrait nécessiter des stratégies spéciales.

En savoir plus sur la mise à l'échelle du volume de requêtes dans Scaling for Query Volume

Skills similaires