bentoml

Par mkurman · zorai

BentoML — service et déploiement de modèles. Créez des services de prédiction depuis n'importe quel framework ML avec OpenAPI/Swagger. Conteneurisez et déployez sur Kubernetes, AWS, GCP, Azure. Batching adaptatif et support GPU.

npx skills add https://github.com/mkurman/zorai --skill bentoml

Aperçu

BentoML empaquette les modèles ML avec des définitions de service, des dépendances, la configuration d'environnement et les cibles de déploiement dans un « Bento » portable. Déploiez sur Kubernetes (Kserve, Seldon), AWS SageMaker, GCP Vertex AI, ou en tant que conteneur Docker autonome.

Installation

uv pip install bentoml

Définition du service

import bentoml
from bentoml.io import JSON
import numpy as np

iris_clf = bentoml.sklearn.get("iris_model:latest")

@bentoml.service
class IrisClassifier:
    def __init__(self):
        self.model = iris_clf.to_runner()
        self.model.init_local()

    @bentoml.api(input=JSON(), output=JSON())
    def classify(self, input_data):
        result = self.model.run(np.array([input_data["features"]]))
        return {"class": int(result[0]), "probabilities": result[1].tolist()}

Build & Déploiement

bentoml build      # creates a Bento
bentoml containerize iris_classifier:latest  # Docker image
docker run -p 3000:3000 iris_classifier:latest

Références

Étoiles: 319
Découvert: 2026-05-18
Langage: Python
Mis à jour: 2026-05-05
Licence: MIT
Dernière release: v0.9.35 · 2026-07-19
Source: GitHub ↗

Santé du projet
Dernier push: hier
Forks: 27
Issues ouvertes: 2
Watchers: 4

Utile ?

Skills similaires

claude-api

anthropics / skills

Construire des applications LLM avec Claude via le SDK officiel adapté au langage.

162 941

trtllm-moe-develop

nvidia / skills

Auditer et aligner le code MoE TensorRT-LLM avec l'architecture de référence.

2 609

huggingface-zerogpu

huggingface / skills

Configurer et optimiser des démos ML Gradio sur Hugging Face ZeroGPU.

10 848

llm-obs-eval-pipeline

datadog-labs / agent-skills

Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production.

145

nemo-relay-plugin-adaptive-tuning

nvidia / skills

Optimiser latence, parallélisme et cache d'un agent via le plugin adaptatif NeMo Relay.

2 609