Mise à l'échelle de Qdrant
Commencez par déterminer ce que vous souhaitez mettre à l'échelle :
- volume de données
- débit de requêtes (QPS)
- latence des requêtes
- volume de requêtes
Après avoir déterminé l'objectif de mise à l'échelle, vous pouvez choisir une stratégie de mise à l'échelle en fonction des compromis et des hypothèses. Chacun favorise des stratégies différentes. La mise à l'échelle du débit et de la latence vont dans des directions d'optimisation opposées.
Mise à l'échelle du volume de données
C'est pertinent lorsque le volume du dataset dépasse la capacité d'un seul nœud. En savoir plus sur la mise à l'échelle du volume de données dans Scaling Data Volume
Mise à l'échelle du débit de requêtes
Si votre système doit traiter plus de requêtes parallèles qu'un seul nœud ne peut le faire, vous devez mettre à l'échelle le débit de requêtes.
En savoir plus sur la mise à l'échelle du débit de requêtes dans Scaling for Query Throughput
Mise à l'échelle de la latence des requêtes
La latence d'une seule requête est déterminée par le composant le plus lent du chemin d'exécution de la requête. Elle est parfois corrélée au débit, mais pas toujours. Elle pourrait nécessiter des stratégies différentes pour la mise à l'échelle.
En savoir plus sur la mise à l'échelle de la latence des requêtes dans Scaling for Query Latency
Mise à l'échelle du volume de requêtes
Par volume de requêtes, nous entendons la quantité de résultats qu'une seule requête retourne. Si le volume de requêtes est trop élevé, il peut causer des problèmes de performance et augmenter la latence.
L'optimisation du volume de requêtes pourrait nécessiter des stratégies spéciales.
En savoir plus sur la mise à l'échelle du volume de requêtes dans Scaling for Query Volume