Aperçu
BentoML empaquette les modèles ML avec des définitions de service, des dépendances, la configuration d'environnement et les cibles de déploiement dans un « Bento » portable. Déploiez sur Kubernetes (Kserve, Seldon), AWS SageMaker, GCP Vertex AI, ou en tant que conteneur Docker autonome.
Installation
uv pip install bentoml
Définition du service
import bentoml
from bentoml.io import JSON
import numpy as np
iris_clf = bentoml.sklearn.get("iris_model:latest")
@bentoml.service
class IrisClassifier:
def __init__(self):
self.model = iris_clf.to_runner()
self.model.init_local()
@bentoml.api(input=JSON(), output=JSON())
def classify(self, input_data):
result = self.model.run(np.array([input_data["features"]]))
return {"class": int(result[0]), "probabilities": result[1].tolist()}
Build & Déploiement
bentoml build # creates a Bento
bentoml containerize iris_classifier:latest # Docker image
docker run -p 3000:3000 iris_classifier:latest