En este modulo

  1. Que es un LLM y por que deberia importarte
  2. Que puede y que no puede hacer
  3. Alucinaciones: el peligro silencioso
  4. Elegir entre ChatGPT, Claude, Gemini y DeepSeek
  5. Tu primera peticion profesional (framework CORT)
  6. Modelos grandes, medianos y pequenos
  7. Open-weight vs propietarios
  8. Ejercicio practico
  9. Puntos clave

Que es un LLM y por que deberia importarte

Un LLM (Large Language Model) es un programa que ha leido miles de millones de textos y ha aprendido patrones estadisticos. Cuando le preguntas algo, predice la siguiente palabra mas probable. No piensa, no razona, no busca en una base de datos. Predice.

Si escribes "El cielo es...", el modelo dice "azul" porque en los textos que leyo, "azul" casi siempre viene despues de esa frase. Esto funciona sorprendentemente bien para generar texto, codigo, traducciones y analisis.

Pero tiene 4 consecuencias directas que necesitas entender:

  1. No tiene memoria real. Cada conversacion empieza desde cero (a menos que configures memoria persistente).
  2. No verifica hechos. Puede inventar numeros, URLs, citas de libros que no existen. A esto se le llama "alucinaciones".
  3. La calidad depende de tu peticion. Basura entra, basura sale. Un prompt vago produce una respuesta vaga.
  4. No ejecuta codigo por si solo. Genera texto que parece codigo. Excepciones: Claude Code y ChatGPT con Code Interpreter.

Regla de oro

Trata la IA como un junior muy rapido, no como un senior infalible. Siempre verifica datos criticos, siempre testea el codigo generado.

Que puede y que no puede hacer

Esta tabla sirve como referencia rapida:

Puede hacer bien

No puede hacer (o lo hace mal)

Alucinaciones: el peligro silencioso

Las alucinaciones son el problema mas peligroso de la IA porque son invisibles. El modelo genera texto que suena perfecto, con autoridad, lleno de detalles. Pero es completamente inventado.

Ejemplos reales de alucinaciones:

Como prevenirlas: pide fuentes, verifica datos criticos, y anade a tu prompt: "Si no estas seguro de un dato, dilo explicitamente. No inventes."

Elegir entre ChatGPT, Claude, Gemini y DeepSeek

No uses la misma IA para todo. Cada una tiene un punto fuerte. Aqui va una comparativa real:

ChatGPT (OpenAI)

Mejor para: escritura creativa, brainstorming, contenido de marketing, generacion de imagenes con DALL-E.

Punto debil: pierde contexto en documentos largos, tiende a ser verboso.

Claude (Anthropic)

Mejor para: analisis de documentos largos, seguir instrucciones complejas, codigo profesional.

Punto debil: mas conservador en temas sensibles. No genera imagenes.

Contexto: hasta 1M tokens (~700 paginas). El mas grande del mercado.

Gemini (Google)

Mejor para: busqueda de informacion actualizada (conectado a Google Search), integracion con Google Workspace.

Punto debil: menos preciso con formato, a veces ignora restricciones.

DeepSeek

Mejor para: codigo y razonamiento matematico, ejecucion local (open-weight), soberania de datos.

Punto debil: interfaz menos pulida, escritura inferior a Claude/ChatGPT.

Tabla de decision rapida

Tu primera peticion profesional (framework CORT)

La diferencia entre un resultado mediocre y uno excelente no es que IA uses. Es como preguntas.

Peticion mala

Resume este articulo.

Resultado: un parrafo generico de 200 palabras sin estructura ni utilidad.

Peticion con estructura CORT

Contexto: Soy el director de marketing de una PYME de ciberseguridad
con 50 empleados. Preparo un resumen semanal para el CEO.

Objetivo: Necesito un resumen ejecutivo de este articulo en 3 puntos
para incluir en el informe semanal.

Restricciones: Maximo 100 palabras en total. Sin jerga tecnica. Incluir
las cifras clave del articulo. Sin informacion repetida.

Tono: Profesional, directo, sin relleno ni introducciones.

Mismo articulo, misma IA. El segundo resultado es 10 veces mas util porque le diste Contexto (quien eres), Objetivo (que necesitas exactamente), Restricciones (que NO quieres), y Tono (como debe sonar).

La estructura CORT

No siempre necesitas los 4. Para tareas simples, Objetivo + Restricciones es suficiente. Pero cuando el resultado no es lo que esperabas, anade mas componentes.

Modelos grandes, medianos y pequenos

Dentro de cada proveedor hay varios modelos. No es lo mismo usar el grande que el pequeno:

Modelos grandes (Opus, GPT-4o, Gemini Ultra)

Mas caros, mas lentos, mas precisos. Para tareas complejas: analisis legal, arquitectura, documentos estrategicos. Cuando el coste de un error es alto.

Modelos medianos (Sonnet, GPT-4o-mini)

Equilibrio entre coste y calidad. Para el 80% de tareas diarias: escritura, codigo, clasificacion, resumen.

Modelos pequenos (Haiku, GPT-3.5)

Muy rapidos, muy baratos. Para tareas de alto volumen y baja complejidad: clasificar 1.000 emails, extraer datos, traducciones simples.

La regla 80/20

El 80% de tus tareas las puede manejar un modelo mediano. Usa el grande solo cuando la precision es critica. Usa el pequeno para tareas repetitivas de alto volumen.

Open-weight vs propietarios

Los modelos open-weight (DeepSeek, Qwen, Llama, Phi) se pueden descargar y ejecutar en tu propio servidor. Los modelos propietarios (GPT, Claude, Gemini) solo se pueden usar via API o interfaz web.

Cuando usar open-weight:

Cuando usar propietarios:

Ejercicio practico

Ejercicio B01: Compara 3 IAs con la misma tarea
  1. Elige un articulo de tu sector (o usa uno del blog de IAcademy)
  2. Escribe una peticion usando la estructura CORT
  3. Enviala a Claude, ChatGPT y Gemini
  4. Compara los resultados: Calidad, Formato, Datos inventados, Puntuacion (1-10)
  5. Decide cual usarias para esa tarea y justifica por que

Bonus: Crea una "Guia de decision IA" de 1 pagina para tu equipo: que IAs usais, para que, y que reglas seguir.

Puntos clave

Puntos clave de B01

  1. Un LLM predice palabras, no piensa. Siempre verifica datos criticos.
  2. Las alucinaciones son el mayor peligro porque son invisibles. Pide fuentes y confirma.
  3. Cada IA tiene su punto fuerte: ChatGPT (creativo), Claude (precision), Gemini (actualizado), DeepSeek (local).
  4. La estructura CORT (Contexto, Objetivo, Restricciones, Tono) transforma cualquier peticion.
  5. El 80% de tus tareas las puede manejar un modelo mediano.
  6. Open-weight para soberania y volumen. Propietarios para maxima calidad sin infraestructura.
Guia de estudio — Conceptos clave de B01

Que es un LLM y por que te importa

  • No tiene memoria real.Cada conversacion empieza de cero (a menos que configures memoria persistente).
  • No verifica datos.Puede inventar cifras, URLs, citas de libros que no existen. Se llaman "alucinaciones".
  • La calidad depende de tu peticion.Basura entra, basura sale. Un prompt vago produce una respuesta vaga.
  • No ejecuta codigo por si solo.Genera texto que parece codigo. Excepciones: Claude Code y ChatGPT con Code Interpreter.
  • Regla de oro: Trata la IA como un junior muy rapido , no como un senior infalible. Siempre verifica datos criticos, siempre testea el codigo generado.
Trata la IA como un junior muy rapido , no como un senior infalible. Siempre verifica datos criticos, siempre testea el codigo generado.

Que puede y que no puede hacer

  • Redactar textos, emails, documentos con estructura definida
  • Analizar documentos largos y extraer informacion clave
  • Generar codigo funcional (con revision humana)
  • Traducir entre idiomas con calidad profesional
  • Resumir, clasificar y organizar informacion
  • Brainstorming y generacion de ideas

Alucinaciones: el peligro silencioso

  • URLs que no existen pero tienen formato perfecto
  • Citas de papers academicos con autores, anio y revista. Todo falso
  • Estadisticas con decimales que parecen de un estudio real
  • APIs y funciones de programacion que no existen en la libreria mencionada
  • Como prevenirlas: pide fuentes, verifica datos criticos, y anade en tu prompt: "Si no estas seguro de un dato, dilo explicitamente. No inventes."

Elegir entre ChatGPT, Claude, Gemini y DeepSeek

  • Mejor para: redaccion creativa, brainstorming, contenido de marketing, generacion de imagenes con DALL-E.
  • Punto debil: en documentos largos pierde contexto, tiende a ser verboso.
  • Mejor para: analisis de documentos largos, seguir instrucciones complejas, codigo profesional.
  • Punto debil: mas conservador en temas sensibles. No genera imagenes.
  • Contexto: hasta 1M tokens (~700 paginas). El mayor del mercado.
  • Mejor para: busqueda de informacion actualizada (conectado a Google Search), integracion con Google Workspace.

Tu primera peticion profesional (framework CORT)

  • Contexto: Quien eres, que situacion tienes, para que proyecto trabajas
  • Objetivo: Que quieres que haga. Especifico, medible
  • Restricciones: Que NO debe hacer. Limites de longitud, formato, contenido
  • Tono: Como debe sonar. Formal, casual, tecnico, ejecutivo
Resume este articulo.

Modelos grandes, medianos y pequenos

  • Regla del 80/20: El 80% de tus tareas se resuelve con un modelo mediano. Usa el grande solo cuando la precision es critica. Usa el pequeno para tareas repetitivas de alto volumen.
El 80% de tus tareas se resuelve con un modelo mediano. Usa el grande solo cuando la precision es critica. Usa el pequeno para tareas repetitivas de alto volumen.

Siguiente: B02 - Prompting profesional

Ahora que entiendes como funciona la IA, el siguiente paso es dominar los prompts: 7 componentes, 4 tipos, few-shot learning y debugging.

Ir al modulo B02