qdrant-deployment-options

Guide la sélection du déploiement Qdrant. À utiliser quand quelqu'un demande « comment déployer Qdrant », « Docker vs Cloud », « mode local », « Qdrant embarqué », « Qdrant EDGE », « quelle option de déploiement », « self-hosted vs cloud », ou « déploiement à latence minimale ». À utiliser également lors du choix entre les types de déploiement pour un nouveau projet.

npx skills add https://github.com/qdrant/skills --skill qdrant-deployment-options

Quel déploiement Qdrant me faut-il ?

Commencez par ce dont vous avez besoin : ops gérées ou contrôle total ? Latence réseau acceptable ou non ? Production ou prototypage ? La réponse se réduit à l'une de quatre options.

Débuter ou Prototyper

À utiliser quand : vous construisez un prototype, exécutez des tests, des pipelines CI/CD, ou apprenez Qdrant.

  • Utilisez le mode local (Python uniquement) : zéro dépendance, en mémoire ou persisté sur disque, pas de serveur requis Local mode
  • Le format de données du mode local N'EST PAS compatible avec le serveur. Ne l'utilisez pas pour la production ou les benchmarks.
  • Pour un vrai serveur localement, utilisez Docker Quick start

Passage en Production (Auto-hébergé)

À utiliser quand : vous avez besoin d'un contrôle total de l'infrastructure, de la résidence des données, ou d'une configuration personnalisée.

  • Docker est le déploiement par défaut. Ensemble complet des fonctionnalités Qdrant Open Source, configuration minimale. Quick start
  • Vous gérez les opérations : mises à jour, sauvegardes, mise à l'échelle, monitoring
  • Vous devez configurer manuellement le mode distribué pour les clusters multi-nœuds Distributed deployment
  • Envisagez Hybrid Cloud si vous souhaitez la gestion Qdrant Cloud sur votre infrastructure Hybrid Cloud

Passage en Production (Zéro-Ops)

À utiliser quand : vous voulez une infrastructure gérée avec mises à jour sans interruption, sauvegardes automatiques, et resharding sans opérer vous-même les clusters.

  • Qdrant Cloud gère les mises à jour, la mise à l'échelle, les sauvegardes et le monitoring Qdrant Cloud
  • Supporte automatiquement les mises à jour multi-versions
  • Fournit des fonctionnalités non disponibles en auto-hébergé : /sys_metrics, resharding géré, alertes préconfigurées

Besoin de la plus Faible Latence Possible

À utiliser quand : la latence aller-retour réseau vers un serveur est inacceptable. Appareils edge, recherche en processus, ou applications critiques en latence.

  • Qdrant EDGE : bindings en processus vers les fonctions au niveau shard de Qdrant, pas de surcharge réseau Qdrant EDGE
  • Même format de données que le serveur. Peut se synchroniser avec le serveur via des snapshots de shard.
  • Ensemble de fonctionnalités single-node uniquement. Pas de mode distribué.

Ce qu'il NE FAUT PAS Faire

  • Utilisez le mode local pour la production ou les benchmarks (non optimisé, format de données incompatible)
  • Auto-hébergez sans stratégie de monitoring et de sauvegarde (vous perdrez des données ou manquerez des pannes)
  • Choisissez EDGE quand vous avez besoin de recherche distribuée (single-node uniquement)
  • Choisissez Hybrid Cloud sauf si vous avez des exigences de résidence des données (complexité Kubernetes inutile quand Qdrant Cloud fonctionne)

Skills similaires