Ollama, la opinión de Joute

Lo esencial

Aplicación para descargar y ejecutar modelos IA open source en local
Gratuito y open source, sin necesidad de cuenta
Compatible con Mac (Apple Silicon), Linux y Windows
Interfaz CLI y API local compatible con OpenAI

¿Qué es Ollama?

Ollama es una aplicación que te permite descargar y ejecutar modelos IA open source directamente en tu ordenador. Sin cloud, sin API key, sin datos enviados al exterior. Eliges un modelo (Llama 4, Mistral, Qwen, Gemma, Phi y docenas más), lo instalas con un comando y lo interrogas desde tu terminal o cualquier aplicación que soporte la API local de OpenAI. En Mac con Apple Silicon el rendimiento es excelente. En PC con GPU Nvidia, igual.

Puntos fuertes

100% local, cero cloud

Tus datos nunca salen de tu máquina. Para casos de uso con información confidencial o simplemente para probar sin conexión, no hay sustituto.

Gratuito, sin tokens que pagar

Coste de tokens cero. Pagas el consumo eléctrico de tu máquina, nada más. Para uso intensivo, es un argumento económico real frente a las APIs en la nube.

API compatible con OpenAI

Ollama expone una API local que replica la interfaz de OpenAI. Todas las herramientas que soportan OpenAI (LangChain, Mastra, Continue, Roo Code) pueden apuntar a Ollama local sin cambiar su código.

Límites

Rendimiento inferior a los modelos en la nube

Los modelos que puedes ejecutar en local están limitados por la RAM y la GPU de tu máquina. Los modelos más grandes (70B+) requieren hardware serio. La calidad está por debajo de GPT-4o o Claude Opus para tareas complejas.

Mayor latencia

Incluso con buen Apple Silicon, un modelo local es más lento que una API en la nube con arquitectura distribuida.

Precios

Completamente gratuito y open source. Sin costes más allá de la infraestructura de tu máquina.

Alternativas

Ollama = modelos IA en local. Alternativa LM Studio (lmstudio.ai) = interfaz gráfica más amigable, mismo concepto. Alternativa Jan (jan.ai) = también open source, interfaz más completa, mismo uso.

Veredicto

Ollama es imprescindible en la caja de herramientas de cualquier desarrollador IA. Para prototipos, pruebas sin exponer datos e integración de modelos locales en pipelines, es la herramienta de referencia. Para producción con solicitudes de máxima calidad, las APIs en la nube siguen siendo superiores.

FAQ

¿Qué modelos funcionan con Ollama?

Llama (Meta), Mistral, Phi (Microsoft), Qwen (Alibaba), Gemma (Google) y docenas más. El catálogo está en ollama.com/library.

¿Ollama funciona en Windows?

Sí, desde la versión 0.1.x. El rendimiento es bueno con una GPU Nvidia.

¿Se puede usar Ollama con Cursor o VS Code?

Sí, mediante una extensión o configurando Roo Code / Continue para apuntar a la API local de Ollama.

¿Cuánta RAM se necesita como mínimo?

8 GB de RAM para modelos 7B (correcto), 16 GB para modelos 13B (bien), 32 GB+ para modelos 30B+.

Joute puede percibir una comisión sobre las suscripciones contratadas a través de los enlaces de este artículo. Esto no cambia nuestras opiniones.