B01: Como funciona realmente la IA

En este modulo

Que es un LLM y por que deberia importarte
Que puede y que no puede hacer
Alucinaciones: el peligro silencioso
Elegir entre ChatGPT, Claude, Gemini y DeepSeek
Tu primera peticion profesional (framework CORT)
Modelos grandes, medianos y pequenos
Open-weight vs propietarios
Ejercicio practico
Puntos clave

Que es un LLM y por que deberia importarte

Un LLM (Large Language Model) es un programa que ha leido miles de millones de textos y ha aprendido patrones estadisticos. Cuando le preguntas algo, predice la siguiente palabra mas probable. No piensa, no razona, no busca en una base de datos. Predice.

Si escribes "El cielo es...", el modelo dice "azul" porque en los textos que leyo, "azul" casi siempre viene despues de esa frase. Esto funciona sorprendentemente bien para generar texto, codigo, traducciones y analisis.

Pero tiene 4 consecuencias directas que necesitas entender:

No tiene memoria real. Cada conversacion empieza desde cero (a menos que configures memoria persistente).
No verifica hechos. Puede inventar numeros, URLs, citas de libros que no existen. A esto se le llama "alucinaciones".
La calidad depende de tu peticion. Basura entra, basura sale. Un prompt vago produce una respuesta vaga.
No ejecuta codigo por si solo. Genera texto que parece codigo. Excepciones: Claude Code y ChatGPT con Code Interpreter.

Regla de oro

Trata la IA como un junior muy rapido, no como un senior infalible. Siempre verifica datos criticos, siempre testea el codigo generado.

Que puede y que no puede hacer

Esta tabla sirve como referencia rapida:

Puede hacer bien

Escribir textos, emails, documentos con estructura definida
Analizar documentos largos y extraer informacion clave
Generar codigo funcional (con revision humana)
Traducir entre idiomas con calidad profesional
Resumir, clasificar y organizar informacion
Brainstorming y generacion de ideas
Explicar conceptos complejos en terminos simples

No puede hacer (o lo hace mal)

Verificar si un dato es verdadero o falso
Recordar conversaciones anteriores sin configuracion
Acceder a internet en tiempo real (excepto Gemini y Perplexity)
Garantizar que el codigo funciona sin probarlo
Tomar decisiones eticas o legales por ti
Contar con precision (palabras, caracteres, elementos)
Matematicas complejas sin herramientas

Alucinaciones: el peligro silencioso

Las alucinaciones son el problema mas peligroso de la IA porque son invisibles. El modelo genera texto que suena perfecto, con autoridad, lleno de detalles. Pero es completamente inventado.

Ejemplos reales de alucinaciones:

URLs que no existen pero tienen un formato perfecto
Citas de articulos academicos con autores, ano y revista. Todo falso
Estadisticas con decimales que parecen venir de un estudio real
APIs y funciones de programacion que no existen en la libreria mencionada

Como prevenirlas: pide fuentes, verifica datos criticos, y anade a tu prompt: "Si no estas seguro de un dato, dilo explicitamente. No inventes."

Elegir entre ChatGPT, Claude, Gemini y DeepSeek

No uses la misma IA para todo. Cada una tiene un punto fuerte. Aqui va una comparativa real:

ChatGPT (OpenAI)

Mejor para: escritura creativa, brainstorming, contenido de marketing, generacion de imagenes con DALL-E.

Punto debil: pierde contexto en documentos largos, tiende a ser verboso.

Claude (Anthropic)

Mejor para: analisis de documentos largos, seguir instrucciones complejas, codigo profesional.

Punto debil: mas conservador en temas sensibles. No genera imagenes.

Contexto: hasta 1M tokens (~700 paginas). El mas grande del mercado.

Gemini (Google)

Mejor para: busqueda de informacion actualizada (conectado a Google Search), integracion con Google Workspace.

Punto debil: menos preciso con formato, a veces ignora restricciones.

DeepSeek

Mejor para: codigo y razonamiento matematico, ejecucion local (open-weight), soberania de datos.

Punto debil: interfaz menos pulida, escritura inferior a Claude/ChatGPT.

Tabla de decision rapida

Escribir un email de ventas: ChatGPT
Analizar un contrato de 50 paginas: Claude
Buscar datos de esta semana: Gemini o Perplexity
Codigo y logica: Claude o DeepSeek
Soberania de datos: DeepSeek o Qwen (local)

Tu primera peticion profesional (framework CORT)

La diferencia entre un resultado mediocre y uno excelente no es que IA uses. Es como preguntas.

Peticion mala

Resume este articulo.

Resultado: un parrafo generico de 200 palabras sin estructura ni utilidad.

Peticion con estructura CORT

Contexto: Soy el director de marketing de una PYME de ciberseguridad
con 50 empleados. Preparo un resumen semanal para el CEO.

Objetivo: Necesito un resumen ejecutivo de este articulo en 3 puntos
para incluir en el informe semanal.

Restricciones: Maximo 100 palabras en total. Sin jerga tecnica. Incluir
las cifras clave del articulo. Sin informacion repetida.

Tono: Profesional, directo, sin relleno ni introducciones.

Mismo articulo, misma IA. El segundo resultado es 10 veces mas util porque le diste Contexto (quien eres), Objetivo (que necesitas exactamente), Restricciones (que NO quieres), y Tono (como debe sonar).

La estructura CORT

Contexto: Quien eres, tu situacion, en que proyecto trabajas
Objetivo: Que quieres que haga. Especifico, medible
Restricciones: Que NO debe hacer. Limites de longitud, formato, contenido
Tono: Como debe sonar. Formal, casual, tecnico, ejecutivo

No siempre necesitas los 4. Para tareas simples, Objetivo + Restricciones es suficiente. Pero cuando el resultado no es lo que esperabas, anade mas componentes.

Modelos grandes, medianos y pequenos

Dentro de cada proveedor hay varios modelos. No es lo mismo usar el grande que el pequeno:

Modelos grandes (Opus, GPT-4o, Gemini Ultra)

Mas caros, mas lentos, mas precisos. Para tareas complejas: analisis legal, arquitectura, documentos estrategicos. Cuando el coste de un error es alto.

Modelos medianos (Sonnet, GPT-4o-mini)

Equilibrio entre coste y calidad. Para el 80% de tareas diarias: escritura, codigo, clasificacion, resumen.

Modelos pequenos (Haiku, GPT-3.5)

Muy rapidos, muy baratos. Para tareas de alto volumen y baja complejidad: clasificar 1.000 emails, extraer datos, traducciones simples.

La regla 80/20

El 80% de tus tareas las puede manejar un modelo mediano. Usa el grande solo cuando la precision es critica. Usa el pequeno para tareas repetitivas de alto volumen.

Open-weight vs propietarios

Los modelos open-weight (DeepSeek, Qwen, Llama, Phi) se pueden descargar y ejecutar en tu propio servidor. Los modelos propietarios (GPT, Claude, Gemini) solo se pueden usar via API o interfaz web.

Cuando usar open-weight:

Necesitas soberania de datos (no puedes enviar informacion a terceros)
Tienes alto volumen y quieres reducir costes
Necesitas personalizar el modelo (fine-tuning)

Cuando usar propietarios:

Quieres maxima calidad sin gestionar infraestructura
Necesitas funciones avanzadas (vision, tools, agentes)
El volumen es bajo y el coste de API es asumible

Ejercicio practico

Ejercicio B01: Compara 3 IAs con la misma tarea

Elige un articulo de tu sector (o usa uno del blog de IAcademy)
Escribe una peticion usando la estructura CORT
Enviala a Claude, ChatGPT y Gemini
Compara los resultados: Calidad, Formato, Datos inventados, Puntuacion (1-10)
Decide cual usarias para esa tarea y justifica por que

Bonus: Crea una "Guia de decision IA" de 1 pagina para tu equipo: que IAs usais, para que, y que reglas seguir.

Puntos clave

Puntos clave de B01

Un LLM predice palabras, no piensa. Siempre verifica datos criticos.
Las alucinaciones son el mayor peligro porque son invisibles. Pide fuentes y confirma.
Cada IA tiene su punto fuerte: ChatGPT (creativo), Claude (precision), Gemini (actualizado), DeepSeek (local).
La estructura CORT (Contexto, Objetivo, Restricciones, Tono) transforma cualquier peticion.
El 80% de tus tareas las puede manejar un modelo mediano.
Open-weight para soberania y volumen. Propietarios para maxima calidad sin infraestructura.

Guia de estudio — Conceptos clave de B01

Que es un LLM y por que te importa

No tiene memoria real.Cada conversacion empieza de cero (a menos que configures memoria persistente).
No verifica datos.Puede inventar cifras, URLs, citas de libros que no existen. Se llaman "alucinaciones".
La calidad depende de tu peticion.Basura entra, basura sale. Un prompt vago produce una respuesta vaga.
No ejecuta codigo por si solo.Genera texto que parece codigo. Excepciones: Claude Code y ChatGPT con Code Interpreter.
Regla de oro: Trata la IA como un junior muy rapido , no como un senior infalible. Siempre verifica datos criticos, siempre testea el codigo generado.

Trata la IA como un junior muy rapido , no como un senior infalible. Siempre verifica datos criticos, siempre testea el codigo generado.

Que puede y que no puede hacer

Redactar textos, emails, documentos con estructura definida
Analizar documentos largos y extraer informacion clave
Generar codigo funcional (con revision humana)
Traducir entre idiomas con calidad profesional
Resumir, clasificar y organizar informacion
Brainstorming y generacion de ideas

Alucinaciones: el peligro silencioso

URLs que no existen pero tienen formato perfecto
Citas de papers academicos con autores, anio y revista. Todo falso
Estadisticas con decimales que parecen de un estudio real
APIs y funciones de programacion que no existen en la libreria mencionada
Como prevenirlas: pide fuentes, verifica datos criticos, y anade en tu prompt: "Si no estas seguro de un dato, dilo explicitamente. No inventes."

Elegir entre ChatGPT, Claude, Gemini y DeepSeek

Mejor para: redaccion creativa, brainstorming, contenido de marketing, generacion de imagenes con DALL-E.
Punto debil: en documentos largos pierde contexto, tiende a ser verboso.
Mejor para: analisis de documentos largos, seguir instrucciones complejas, codigo profesional.
Punto debil: mas conservador en temas sensibles. No genera imagenes.
Contexto: hasta 1M tokens (~700 paginas). El mayor del mercado.
Mejor para: busqueda de informacion actualizada (conectado a Google Search), integracion con Google Workspace.

Tu primera peticion profesional (framework CORT)

Contexto: Quien eres, que situacion tienes, para que proyecto trabajas
Objetivo: Que quieres que haga. Especifico, medible
Restricciones: Que NO debe hacer. Limites de longitud, formato, contenido
Tono: Como debe sonar. Formal, casual, tecnico, ejecutivo

Resume este articulo.

Modelos grandes, medianos y pequenos

Regla del 80/20: El 80% de tus tareas se resuelve con un modelo mediano. Usa el grande solo cuando la precision es critica. Usa el pequeno para tareas repetitivas de alto volumen.

El 80% de tus tareas se resuelve con un modelo mediano. Usa el grande solo cuando la precision es critica. Usa el pequeno para tareas repetitivas de alto volumen.

Siguiente: B02 - Prompting profesional

Ahora que entiendes como funciona la IA, el siguiente paso es dominar los prompts: 7 componentes, 4 tipos, few-shot learning y debugging.

Ir al modulo B02

En este modulo

Que es un LLM y por que deberia importarte

Regla de oro

Que puede y que no puede hacer

Puede hacer bien

No puede hacer (o lo hace mal)

Alucinaciones: el peligro silencioso

Elegir entre ChatGPT, Claude, Gemini y DeepSeek

ChatGPT (OpenAI)

Claude (Anthropic)

Gemini (Google)

DeepSeek

Tabla de decision rapida

Tu primera peticion profesional (framework CORT)

Peticion mala

Peticion con estructura CORT

La estructura CORT

Modelos grandes, medianos y pequenos

Modelos grandes (Opus, GPT-4o, Gemini Ultra)

Modelos medianos (Sonnet, GPT-4o-mini)

Modelos pequenos (Haiku, GPT-3.5)

La regla 80/20

Open-weight vs propietarios

Ejercicio practico

Puntos clave

Puntos clave de B01

Que es un LLM y por que te importa

Que puede y que no puede hacer

Alucinaciones: el peligro silencioso

Elegir entre ChatGPT, Claude, Gemini y DeepSeek

Tu primera peticion profesional (framework CORT)

Modelos grandes, medianos y pequenos

Modulos relacionados

Siguiente: B02 - Prompting profesional