Crear un agente IA paso a paso: tutorial completo (2026)

Por David Moya · · 20 min lectura

crear-agente-ia-paso-a-paso

En este artículo

  1. Agente vs chatbot: la diferencia real
  2. Arquitectura de un agente: planner + memory + tools
  3. Implementación con LangGraph
  4. Implementación con CrewAI
  5. Ejemplo práctico: agente de investigación
  6. MCP como capa de herramientas
  7. Deployment y escalado
  8. Testing de agentes
  9. Monitorización en producción
  10. Preguntas frecuentes
Experiencia del equipo: He construido y desplegado más de 40 agentes de IA en producción, desde agentes SOC que procesan alertas de seguridad hasta agentes de ventas que cualifican leads automáticamente. El error más común que veo es empezar con un framework sin entender la arquitectura subyacente. Cuando el framework falla (y falla), si no entiendes qué hay debajo, no puedes diagnosticar ni solucionar.
Guía principal: Este artículo forma parte de la guía de IA aplicada.

Un agente de IA no es un chatbot con más features. Es un sistema que planifica, ejecuta acciones en el mundo real y aprende de los resultados. La diferencia es la misma que entre un formulario web y un robot industrial: ambos procesan datos, pero solo uno actúa.

En 2026, crear un agente de IA está al alcance de cualquier desarrollador con conocimientos de Python. Los frameworks (LangGraph, CrewAI, Autogen) abstraen la complejidad de la orquestación. Los LLMs (Claude, GPT-4o, Qwen) son el cerebro. Las herramientas (APIs, bases de datos, MCP servers) son las manos. Lo que falta en la mayoría de tutoriales es el "cómo" completo: desde la arquitectura hasta la monitorización en producción.

Esta guía cubre el ciclo completo. No solo cómo escribir el código, sino cómo diseñar la arquitectura, elegir el framework, testear el agente y mantenerlo funcionando en producción.

Resumen rápido

Tutorial completo para crear un agente de IA en 2026: arquitectura planner+memory+tools, implementación con LangGraph y CrewAI, MCP como capa de herramientas, ejemplo práctico de agente de investigación, deployment, testing y monitorización.

Agente vs chatbot: la diferencia real

La confusión entre agente y chatbot es el origen de la mayoría de implementaciones fallidas. Un chatbot es una interfaz conversacional: recibe texto, genera texto. Un agente es un sistema autónomo que toma decisiones y ejecuta acciones.

Un chatbot:

Un agente:

Ejemplo concreto. Un chatbot de soporte responde "Para resetear tu contraseña, ve a Configuración > Seguridad > Cambiar contraseña." Un agente de soporte verifica la identidad del usuario, resetea la contraseña en el sistema, envía el email con las nuevas credenciales y registra el ticket en el CRM. Misma petición, resultado completamente diferente.

Arquitectura de un agente: planner + memory + tools

Todo agente de IA tiene tres componentes fundamentales. Independientemente del framework que uses, estos tres bloques deben existir.

Planner (cerebro). Es el LLM que toma decisiones. Recibe el objetivo, el contexto disponible, los resultados de acciones anteriores y el estado actual. Decide qué hacer a continuación: llamar a una herramienta, pedir más información, delegar en otro agente o dar la tarea por completada. El planner es el componente más crítico porque determina la calidad de las decisiones. Un planner débil (modelo pequeño, prompt vago) produce agentes erráticos.

Memory (contexto persistente). La memoria almacena información que el agente necesita recordar entre pasos y entre sesiones. Hay tres tipos de memoria relevantes:

Tools (capacidad de acción). Las herramientas son funciones que el agente puede ejecutar para interactuar con el mundo exterior. Cada herramienta tiene un nombre, una descripción (que el LLM lee para decidir cuándo usarla), parámetros de entrada y un output. Ejemplos: buscar en web, consultar base de datos, enviar email, crear ticket, analizar documento, generar gráfico.

Arquitectura de un agente de IA Planner (LLM) Decide, planifica, evalúa Claude / GPT-4o / Qwen Memory Working + Short + Long term Tools APIs, DB, MCP, archivos Orchestrator LangGraph / CrewAI HITL (aprobación humana) Observabilidad (trazas)

La calidad de un agente depende más de cómo describes las herramientas que del modelo que uses como planner. Una herramienta con una descripción vaga ("busca información") produce peores resultados que una con una descripción precisa ("busca en la base de datos de clientes por nombre, email o ID. Devuelve los campos: id, nombre, email, plan, fecha_alta, ultimo_login. Máximo 10 resultados").

Implementación con LangGraph

LangGraph es el framework de referencia para agentes en producción en 2026. Define el agente como un grafo de estados: cada nodo es un paso de procesamiento, cada arista es una transición condicionada por el estado.

Conceptos clave de LangGraph:

Estructura típica de un agente LangGraph:

El grafo tiene un nodo de entrada que recibe el objetivo del usuario. Un nodo "planner" que decide qué herramienta llamar. Un nodo "executor" que ejecuta la herramienta. Un nodo "evaluator" que decide si el resultado es suficiente o necesita más pasos. Y un nodo de salida que formatea la respuesta final.

La ventaja de LangGraph sobre otros frameworks es el control total. Puedes implementar lógica de negocio arbitraria en cada nodo, gestionar errores con granularidad, implementar circuit breakers, timeouts y HITL en puntos específicos del flujo. El coste es mayor complejidad inicial, pero la ganancia es un agente predecible y debuggable.

Para tutoriales detallados de LangGraph, consulta nuestra guía de LangChain en español.

Implementación con CrewAI

CrewAI toma un enfoque diferente: defines agentes como "personas" con roles, objetivos y herramientas, y la orquestación se gestiona automáticamente.

Conceptos clave de CrewAI:

Cuándo usar CrewAI vs LangGraph:

Ejemplo práctico: agente de investigación

Vamos a diseñar un agente de investigación que recibe un tema, busca información en múltiples fuentes, sintetiza los hallazgos y produce un informe estructurado. Este es uno de los patrones más útiles y transferibles a otros dominios.

Objetivo del agente: dado un tema de investigación, producir un informe de 1.000-1.500 palabras con fuentes verificadas, datos cuantitativos cuando estén disponibles y una sección de conclusiones accionables.

Herramientas disponibles:

Flujo del agente:

  1. Plan: el planner analiza el tema y genera 3-5 preguntas de investigación que debe responder
  2. Search: para cada pregunta, ejecuta web_search y selecciona las 3 fuentes más relevantes
  3. Extract: usa web_scrape para extraer el contenido de las fuentes seleccionadas
  4. Internal check: busca en la base de conocimiento interna información complementaria
  5. Synthesize: el planner sintetiza toda la información recopilada, identifica consensos, contradicciones y gaps
  6. Write: genera el informe final con la estructura definida
  7. Validate: revisa que el informe tenga fuentes, datos cuantitativos y que las conclusiones estén soportadas por la evidencia

Este flujo tiene entre 15 y 30 llamadas al LLM y entre 10 y 20 llamadas a herramientas por ejecución. El coste por informe usando Claude Sonnet como planner es de aproximadamente 0,10-0,30 EUR. Con un modelo self-hosted como Qwen 3.5, el coste marginal es cercano a cero (solo el coste fijo de la GPU).

MCP como capa de herramientas

El Model Context Protocol (MCP) es el estándar que está transformando cómo los agentes se conectan con herramientas externas. En lugar de implementar cada integración como una función custom, MCP define un protocolo estándar para que los agentes descubran y usen herramientas de forma uniforme.

Por qué MCP es relevante para agentes. Sin MCP, cada herramienta es una integración custom: escribes el código de la función, defines el schema de input/output, manejas errores y documentas la herramienta para que el LLM la entienda. Con MCP, conectas un servidor MCP y el agente descubre automáticamente las herramientas disponibles, sus schemas y sus descripciones. Para una explicación detallada de MCP, consulta nuestro artículo qué es MCP en inteligencia artificial.

Arquitectura con MCP:

La ventaja es composabilidad: puedes añadir y quitar herramientas sin cambiar el código del agente. Si mañana quieres que tu agente de investigación también consulte una base de datos de patentes, conectas el MCP server de patentes y el agente lo descubre automáticamente.

Deployment y escalado

Desplegar un agente en producción es diferente a desplegarlo en desarrollo. En desarrollo, el agente corre en tu máquina, con tu API key, y si falla, lo reinicias manualmente. En producción, necesitas fiabilidad, escalado y gestión de costes.

Opciones de deployment:

Gestión de errores en producción:

Testing de agentes

Testear agentes es fundamentalmente diferente a testear software tradicional. El output de un LLM no es determinístico: el mismo input puede producir outputs diferentes. Necesitas una estrategia de testing adaptada.

Unit tests de herramientas. Cada herramienta se testea de forma aislada con inputs conocidos y outputs esperados. Esto es testing tradicional: dado este input, espero este output (o un error específico). Las herramientas son determinísticas y se testean como cualquier función.

Eval datasets. Un conjunto de pares (input, output esperado) que representan casos de uso del agente. El agente procesa cada input y un evaluador (otro LLM o un humano) compara el output con el esperado. La métrica es accuracy: porcentaje de respuestas correctas. El umbral mínimo para producción depende del caso de uso: 90%+ para agentes de soporte, 95%+ para agentes financieros, 80%+ para agentes creativos.

Tests de integración. Verifican que el agente llama a las herramientas correctas en el orden correcto. No evalúan el contenido del output, sino el flujo de ejecución. "Dado este objetivo, el agente debería llamar a web_search, luego a web_scrape, luego a write_report."

Tests adversariales. Inputs diseñados para romper al agente: prompt injection, inputs malformados, peticiones fuera de scope, instrucciones contradictorias. El agente debe manejar estos casos sin ejecutar acciones no autorizadas y sin exponer información sensible.

Monitorización en producción

Un agente en producción sin monitorización es una bomba de relojería. No sabes si funciona correctamente, cuánto cuesta cada ejecución, ni cuándo empieza a degradarse.

Métricas esenciales:

Herramientas de observabilidad:

Alertas recomendadas:

Preguntas frecuentes

¿Cuál es la diferencia entre un agente de IA y un chatbot?

Un chatbot responde preguntas basándose en un prompt y el contexto de la conversación. No toma acciones ni planifica. Un agente de IA decide qué herramientas usar, planifica secuencias de acciones, ejecuta tareas en sistemas externos (APIs, bases de datos, archivos), mantiene memoria entre sesiones y puede operar de forma autónoma o semi-autónoma. Un chatbot es una interfaz conversacional. Un agente es un sistema que actúa en el mundo real.

¿Qué framework debo usar para crear agentes: LangGraph o CrewAI?

LangGraph para producción y flujos complejos: control total sobre el grafo de estados, checkpointing, HITL y gestión granular de errores. CrewAI para prototipar rápido y validar ideas: defines roles y tareas, la orquestación es automática. Si tu agente va a producción con lógica de negocio específica, LangGraph. Si quieres validar un concepto en una tarde, CrewAI.

¿Cuánto cuesta mantener un agente de IA en producción?

Tres componentes: LLM (APIs 5-200 EUR/mes, self-hosted 50-500 EUR/mes en GPU), infraestructura (servidor + DB + colas, 20-100 EUR/mes) y observabilidad (0-50 EUR/mes). Un agente básico cuesta 30-150 EUR/mes. Un sistema multi-agente complejo puede superar los 500 EUR/mes. El factor dominante es el coste de LLM, que depende del volumen de ejecuciones y del modelo elegido.

¿Necesito saber programar para crear un agente de IA?

Para agentes simples, plataformas como n8n, Make o Zapier permiten crear flujos agentic sin código. Para agentes en producción con lógica compleja, necesitas Python intermedio, conceptos de APIs REST, manejo de JSON y nociones básicas de async/await. No necesitas ser experto en ML ni en deep learning: los frameworks abstraen la complejidad del LLM y te dejan centrarte en la lógica de negocio.

Si quieres profundizar en estas técnicas con ejercicios prácticos y soporte, consulta los planes de IAcademy.

Construye tu primer agente de IA

Los 3 primeros módulos de IAcademy son gratis. Incluyen prompting avanzado, automatización de workflows y fundamentos de agentes.

Empieza gratis

Curso completo: 108 módulos de IA aplicada

11 especializaciones por departamento. Dashboard con progreso. Quizzes y skills desbloqueables. Desde 399 EUR.

Ver precios Acceder al portal