ollama

Par mkurman · zorai

Exécuteur LLM local. Configuration en une seule commande pour Llama, Mistral, Gemma, Qwen, DeepSeek, Phi et plus de 100 modèles. API compatible OpenAI, gestion des modèles, accélération GPU et création de Modelfile personnalisés.

npx skills add https://github.com/mkurman/zorai --skill ollama

Aperçu

Ollama exécute les LLMs localement avec une seule commande. Supporte Llama 3, Mistral, Gemma, Qwen 2.5, DeepSeek, Phi et 100+ modèles avec accélération GPU (CUDA/Metal), API compatible OpenAI et Modelfiles personnalisés pour la configuration.

Installation

# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh

Utilisation basique

ollama pull llama3.1:8b
ollama run llama3.1:8b "Explain quantum computing"

API Python

import openai
client = openai.OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")
resp = client.chat.completions.create(
    model="llama3.1:8b",
    messages=[{"role": "user", "content": "What is ML?"}],
)
print(resp.choices[0].message.content)

Modelfile personnalisé

FROM llama3.1:8b
PARAMETER temperature 0.3
SYSTEM "You are a medical coding assistant."
ollama create my-coder -f Modelfile

Références

Skills similaires