ollama

Par mkurman · zorai

Exécuteur LLM local. Configuration en une seule commande pour Llama, Mistral, Gemma, Qwen, DeepSeek, Phi et plus de 100 modèles. API compatible OpenAI, gestion des modèles, accélération GPU et création de Modelfile personnalisés.

npx skills add https://github.com/mkurman/zorai --skill ollama

Aperçu

Ollama exécute les LLMs localement avec une seule commande. Supporte Llama 3, Mistral, Gemma, Qwen 2.5, DeepSeek, Phi et 100+ modèles avec accélération GPU (CUDA/Metal), API compatible OpenAI et Modelfiles personnalisés pour la configuration.

Installation

# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh

Utilisation basique

ollama pull llama3.1:8b
ollama run llama3.1:8b "Explain quantum computing"

API Python

import openai
client = openai.OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")
resp = client.chat.completions.create(
    model="llama3.1:8b",
    messages=[{"role": "user", "content": "What is ML?"}],
)
print(resp.choices[0].message.content)

Modelfile personnalisé

FROM llama3.1:8b
PARAMETER temperature 0.3
SYSTEM "You are a medical coding assistant."

ollama create my-coder -f Modelfile

Références

Étoiles: 319
Découvert: 2026-05-18
Langage: Python
Mis à jour: 2026-05-05
Licence: MIT
Dernière release: v0.9.35 · 2026-07-19
Source: GitHub ↗

Santé du projet
Dernier push: hier
Forks: 27
Issues ouvertes: 2
Watchers: 4

Utile ?

Skills similaires

nemoclaw-user-configure-inference

nvidia / skills

Configurer un sous-agent spécialisé dans un sandbox NemoClaw avec OpenClaw.

2 609

jetson-llm-benchmark

nvidia / skills

Mesurer les performances LLM sur Jetson avec sortie JSON structurée et comparable.

2 609

claude-api

anthropics / skills

Construire des applications LLM avec Claude via le SDK officiel adapté au langage.

162 941

huggingface-lora-space-builder

huggingface / skills

Créer et publier un espace Gradio sur Hugging Face pour inférence avec un LoRA.

10 848

llm-obs-eval-pipeline

datadog-labs / agent-skills

Orchestrer un pipeline complet classify→RCA→bootstrap pour évaluer une app LLM en production.

145