Que es Extended Thinking
Extended Thinking permite que Claude razone internamente antes de responder. Genera un bloque de pensamiento (no visible al usuario) y luego la respuesta final. Similar a chain-of-thought pero integrado nativamente.
Cuando usarlo
SI: análisis de código complejo (+20% accuracy), problemas matematicos (+25%), planificacion multi-paso (+23%). NO: clasificación simple, extraccion de datos, respuestas cortas (mejora marginal, no justifica el coste).
Budget tokens
Controla cuanto puede pensar Claude. 1K-3K: razonamiento rápido. 5K-10K: análisis medio. 10K-50K: problemas complejos. Requiere temperature=1.
Ejemplo
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 5000},
messages=[{"role": "user", "content": "Analiza..."}]
)
for block in message.content:
if block.type == "thinking": print("Pensamiento:", block.thinking[:200])
elif block.type == "text": print("Respuesta:", block.text)
Combinar con Structured Outputs
Thinking para razonar + Structured Outputs para formato JSON garantizado. El combo más potente de la API de Claude.
Aprende más en IAcademy
Los 3 primeros módulos son gratis. Cubre desde prompting hasta agentes IA y deploy en producción.
Empieza gratisCurso completo: 151 módulos de IA aplicada
13 especializaciones. Claude API, LangChain, Ollama, fine-tuning. Dashboard con progreso. Desde 399 EUR.