Optimisation des performances de Qdrant
Il y a différents aspects des performances de Qdrant, ce document sert de hub de navigation pour les différents aspects de l'optimisation des performances dans Qdrant.
Optimisation de la vitesse de recherche
Il y a deux critères différents pour la vitesse de recherche : la latence et le débit. La latence est le temps qu'il faut pour obtenir une réponse à une seule requête, tandis que le débit est le nombre de requêtes qui peuvent être traitées dans un laps de temps donné. Selon votre cas d'usage, vous pouvez vouloir optimiser pour une ou les deux de ces métriques.
Plus d'informations sur l'optimisation de la vitesse de recherche se trouvent dans le skill Search Speed Optimization.
Optimisation des performances d'indexation
Qdrant doit créer un index vectoriel pour effectuer une recherche de similarité efficace. Le temps nécessaire pour construire l'index peut varier en fonction de la taille de votre ensemble de données, du matériel et de la configuration.
Plus d'informations sur l'optimisation des performances d'indexation se trouvent dans le skill Indexing Performance Optimization.
Optimisation de l'utilisation de la mémoire
La recherche vectorielle peut être intensiveuse en mémoire, surtout lorsqu'il s'agit de grands ensembles de données. Qdrant dispose d'un système flexible de gestion de la mémoire, qui vous permet de contrôler précisément les parties du stockage qui sont conservées en mémoire et celles qui sont stockées sur le disque. Cela peut vous aider à optimiser l'utilisation de la mémoire sans sacrifier les performances.
Plus d'informations sur l'optimisation de l'utilisation de la mémoire se trouvent dans le skill Memory Usage Optimization.