Extended Thinking en Claude: cuando y como usarlo

Que es Extended Thinking

Extended Thinking permite que Claude razone internamente antes de responder. Genera un bloque de pensamiento (no visible al usuario) y luego la respuesta final. Similar a chain-of-thought pero integrado nativamente.

Cuando usarlo

SI: análisis de código complejo (+20% accuracy), problemas matematicos (+25%), planificacion multi-paso (+23%). NO: clasificación simple, extraccion de datos, respuestas cortas (mejora marginal, no justifica el coste).

Budget tokens

Controla cuanto puede pensar Claude. 1K-3K: razonamiento rápido. 5K-10K: análisis medio. 10K-50K: problemas complejos. Requiere temperature=1.

Ejemplo

message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 5000},
    messages=[{"role": "user", "content": "Analiza..."}]
)
for block in message.content:
    if block.type == "thinking": print("Pensamiento:", block.thinking[:200])
    elif block.type == "text": print("Respuesta:", block.text)

Combinar con Structured Outputs

Thinking para razonar + Structured Outputs para formato JSON garantizado. El combo más potente de la API de Claude.

Aprende más en IAcademy

Los 3 primeros módulos son gratis. Cubre desde prompting hasta agentes IA y deploy en producción.

Empieza gratis

Curso completo: 151 módulos de IA aplicada

13 especializaciones. Claude API, LangChain, Ollama, fine-tuning. Dashboard con progreso. Desde 399 EUR.

Ver precios Acceder al portal