Instructor, opinión de Joute
Opinión sobre Instructor. Librería Python para la extracción de datos estructurados desde LLM con validación Pydantic. Precios, límites, alternativas.
Enlace afiliado. Joute recibe una comisión sin coste extra para ti. Nuestra opinión es independiente.

Instructor en breve
Instructor es una librería imprescindible para quien construye pipelines LLM que necesitan salidas estructuradas fiables. Simple, robusta y bien mantenida.
- PrecioGratis
- CategoríaCode
- RecomendadoSí
Lo esencial en 20 segundos
- Librería Python que envuelve las llamadas LLM para garantizar salidas estructuradas validadas por Pydantic
- Reintento automático si la salida del LLM no corresponde al esquema esperado
- Compatible con OpenAI, Anthropic, Google y cualquier LLM compatible con OpenAI
- Precio: gratuito, open source MIT
Veredicto: Instructor es la forma más simple y fiable de extraer datos estructurados desde un LLM. Si usas Pydantic (y deberías), la integración es natural. Imprescindible.
¿Qué es Instructor?
Instructor es una librería Python creada por Jason Liu que simplifica radicalmente la extracción de datos estructurados desde LLM. Defines un modelo Pydantic, llamas al LLM y obtienes un objeto Python validado.
Si el LLM devuelve algo que no corresponde al esquema, Instructor relanza automáticamente la llamada con el mensaje de error en contexto.
from instructor import patch
from openai import OpenAI
from pydantic import BaseModel
client = patch(OpenAI())
class Person(BaseModel):
name: str
age: int
person = client.chat.completions.create(
model="gpt-4",
response_model=Person,
messages=[{"role": "user", "content": "Jason Liu, 30 ans"}]
)
# person.name == "Jason Liu", person.age == 30
Puntos fuertes
Validación Pydantic nativa
Tus modelos Pydantic existentes funcionan directamente. No hace falta aprender un nuevo formato de esquema.
Reintento inteligente
Cuando el LLM produce una salida inválida, Instructor reinyecta el error de validación en el prompt para que el LLM se corrija. La tasa de éxito sube significativamente.
Soporte multi-LLM
OpenAI, Anthropic (Claude), Google (Gemini), Mistral y cualquier endpoint compatible con OpenAI.
Límites
Solo Python
No hay versión JavaScript/TypeScript nativa (BAML cubre está necesidad del lado TypeScript).
Dependencia fuerte de Pydantic
Si tu proyecto no usa Pydantic, hay que adoptarlo. En la práctica no es una limitación ya que Pydantic se ha convertido en un estándar.
Precios
- Gratuito, open source MIT
Alternativas
- BAML para extracción estructurada TypeScript-first
- DSPy para un enfoque más completo de programación de pipelines LLM
- Outlines para la generación estructurada con modelos locales
Veredicto
Instructor es una de las librerías más útiles del ecosistema Python LLM. Si construyes pipelines que extraen datos de textos o documentos, instala Instructor inmediatamente.
FAQ
¿Instructor funciona con modelos locales vía Ollama?
Sí. Instructor soporta cualquier endpoint compatible con OpenAI, incluido Ollama.
¿Se pueden extraer listas de objetos?
Sí. List[Person] en tu modelo Pydantic funciona perfectamente.
¿Cuántos reintentos hace Instructor?
Por defecto, 3 intentos. Configurable mediante el parámetro max_retries.
Instructor es open source y gratuito. Joute no percibe comisión sobre esta herramienta. Saber más sobre nuestra política de afiliación.
Capturas Instructor
7






Instructor.
Instructor es una librería imprescindible para quien construye pipelines LLM que necesitan salidas estructuradas fiables. Simple, robusta y bien mantenida..
Prueba Instructor tú mismo
Hay una prueba gratuita disponible. Calcula treinta minutos para formar tu propia opinión.
Enlace afiliado. Joute recibe una comisión sin coste extra para ti. Nuestra opinión es independiente.
Instructor
Gratis
