En este artículo
- Qué es few-shot learning
- Cuándo usarlo (y cuándo no)
- Número óptimo de ejemplos
- Ejemplo 1: Clasificar emails
- Ejemplo 2: Extraer datos estructurados
- Ejemplo 3: Generar formato JSON
- Ejemplo 4: Tono consistente
- Ejemplo 5: Transformación de texto
- Ejemplo 6: Generación creativa con estilo
- Patrones de formato efectivos
- Few-shot vs fine-tuning
- 7 tips para few-shot efectivo
- Preguntas frecuentes
Resumen rápido
Qué es few-shot learning y cómo usarlo en tus prompts. 6 ejemplos prácticos por dominio (clasificación, extracción, JSON, tono, transformación, generación), número óptimo de shots, patrones de formato y comparativa con fine-tuning.
Qué es few-shot learning
Few-shot learning es darle a la IA 1-3 ejemplos de input/output en el prompt para que aprenda el patrón y lo replique. No es entrenamiento: es una técnica de prompting que funciona con cualquier modelo (ChatGPT, Claude, Gemini).
La idea es simple: en vez de explicar con palabras lo que quieres, se lo muestras con ejemplos. Es como enseñar a alguien nuevo en el equipo: "mira cómo hice los últimos 3, ahora haz tú el siguiente".
Cuándo usarlo (y cuándo no)
Usa few-shot cuando:
- Necesitas un formato específico (JSON, tabla, estructura custom)
- La tarea es ambigua solo con instrucciones
- La precisión es crítica (clasificación, extracción de datos)
- Quieres un tono o estilo consistente
- El modelo interpreta tu instrucción de forma diferente a lo que esperas
- Trabajas con categorías no estándar que el modelo no conoce
No lo necesitas cuando:
- La tarea es simple y clara ("traduce esto al inglés")
- Usas un modelo potente y la instrucción es suficiente
- El contexto es muy largo (los ejemplos consumen tokens)
- La tarea requiere creatividad pura sin restricciones de formato
Número óptimo de ejemplos
La pregunta más frecuente: ¿cuántos ejemplos son suficientes? La respuesta depende de la tarea:
1 ejemplo (one-shot): suficiente para tareas simples donde solo necesitas mostrar el formato de salida. Ejemplo: "Dame la respuesta en formato tabla".
2-3 ejemplos (few-shot clásico): el sweet spot para la mayoría de tareas. Cubre el caso normal y 1-2 edge cases. Es la opción recomendada por defecto.
4-5 ejemplos: necesario cuando tienes múltiples categorías (ej: clasificación en 5 clases) y quieres al menos un ejemplo por clase.
6+ ejemplos (many-shot): rendimiento marginal en la mayoría de tareas. Solo justificado cuando la tarea es muy ambigua o cuando usas modelos con ventana de contexto larga (100K+ tokens) y los ejemplos son cortos.
Regla práctica: empieza con 2 ejemplos. Si la precisión no es suficiente, añade 1 más con un caso edge. Si con 5 ejemplos no funciona bien, el problema no es la cantidad de ejemplos: es la formulación del prompt o la elección del modelo.
Ejemplo 1: Clasificar emails
Sin few-shot, el modelo puede clasificar de forma inconsistente. Con 3 ejemplos, clava el patrón.
Clasifica cada email en: urgente, normal, spam.
Ejemplos:
Email: "URGENTE: servidor de producción caído desde las 3:00"
Clasificación: urgente
Email: "Resumen semanal de métricas del equipo"
Clasificación: normal
Email: "Has ganado un iPhone 15 gratis!!!"
Clasificación: spam
Ahora clasifica:
Email: "La base de datos no responde, clientes afectados"
Clasificación:
Resultado
Con few-shot: urgente (100% de acierto en tests con 50 emails).
Sin few-shot: acierto ~85% (a veces clasifica como "alta prioridad" en vez de "urgente").
Ejemplo 2: Extraer datos estructurados
Extraer información concreta de texto no estructurado. Few-shot le enseña qué campos buscar y en qué formato devolverlos.
Extrae los datos de cada factura.
Ejemplo:
Texto: "Factura F-2026-001 de Acme S.L., fecha 15/03/2026,
importe 1.200 EUR + IVA, concepto: consultoría IT marzo"
Resultado: {"número": "F-2026-001", "empresa": "Acme S.L.",
"fecha": "2026-03-15", "importe": 1200, "concepto": "consultoría IT marzo"}
Ejemplo:
Texto: "Fra. 456 - TechCorp, 28 feb 2026. Total 3.500,00 EUR
por desarrollo web Q1"
Resultado: {"número": "456", "empresa": "TechCorp",
"fecha": "2026-02-28", "importe": 3500, "concepto": "desarrollo web Q1"}
Ahora extrae:
Texto: "Factura INV-789 de DataFlow Inc., emitida el 1 de abril
de 2026 por un total de 850 euros. Servicio: hosting anual"
Por qué funciona: los dos ejemplos muestran formatos de factura diferentes (numeración distinta, formato de fecha distinto, expresión del importe diferente). El modelo aprende a normalizar cualquier formato al schema JSON definido.
Ejemplo 3: Generar formato JSON
Cuándo necesitas un schema JSON específico, few-shot es más fiable que describir el schema con palabras.
Convierte cada descripción de producto a JSON.
Ejemplo:
Input: "Camiseta negra talla L, 29.99€, quedan 45 unidades"
Output: {"name": "Camiseta negra", "size": "L",
"price": 29.99, "stock": 45, "currency": "EUR"}
Ejemplo:
Input: "Zapatillas running blancas 42, 89€, 12 en stock"
Output: {"name": "Zapatillas running blancas", "size": "42",
"price": 89, "stock": 12, "currency": "EUR"}
Ahora convierte:
Input: "Mochila impermeable gris, talla única, 54.50 EUR, 8 disponibles"
Ejemplo 4: Tono consistente
Para mantener un estilo de escritura uniforme (newsletter, social media, documentación). Especialmente útil si generas contenido en serie.
Escribe tweets sobre herramientas de IA. Tono: directo,
sin hype, con dato concreto.
Ejemplo:
Herramienta: Claude Code
Tweet: "Claude Code no es un chatbot. Es un agente en tu
terminal que lee tu repo, ejecuta tests y hace commits.
Si programas, pruébalo 10 minutos."
Ejemplo:
Herramienta: n8n
Tweet: "n8n es automatización visual con nodos de IA. Conectas
Slack + GPT + Postgres en 5 minutos. Open source, self-hosted."
Ahora escribe:
Herramienta: Cursor
Ejemplo 5: Transformación de texto
Transformar texto de un formato o registro a otro. Ideal para reescrituras masivas con estilo consistente.
Transforma descripciones técnicas de producto en copy de venta
emocional para landing page. Máximo 2 frases.
Ejemplo:
Técnico: "Software de gestión de proyectos con tableros Kanban,
diagramas de Gantt, tracking de tiempo y 50 integraciones."
Copy: "Deja de perder horas buscando en qué va cada proyecto.
Un solo lugar donde tu equipo sabe qué hacer, cuándo y cómo."
Ejemplo:
Técnico: "Plataforma de email marketing con segmentación
avanzada, A/B testing, automatizaciones y analytics en tiempo real."
Copy: "Envía el email correcto a la persona correcta en el
momento exacto. Sin adivinar: los datos te dicen qué funciona."
Ejemplo:
Técnico: "Herramienta de backup automático con cifrado AES-256,
restauración en 1 click, y soporte para 15 providers de cloud."
Copy: "Duerme tranquilo sabiendo que tus datos están a salvo.
Si algo falla, un click y todo vuelve a la normalidad."
Ahora transforma:
Técnico: "API de procesamiento de lenguaje natural con análisis
de sentimiento, extracción de entidades y clasificación de texto
en 40 idiomas."
Clave del éxito: los 3 ejemplos muestran la transformación de lenguaje técnico (features) a lenguaje emocional (beneficios). El modelo aprende que no debe listar features, sino comunicar el resultado que obtiene el usuario.
Ejemplo 6: Generación creativa con estilo
Few-shot también funciona para tareas creativas cuando necesitas un estilo específico que es difícil de describir con palabras.
Genera títulos de artículos de blog sobre IA. Estilo: pregunta
intrigante o dato sorprendente. Sin clickbait. Sin signos de
exclamación. Máximo 60 caracteres.
Ejemplo:
Tema: automatización de emails
Título: "¿Tu bandeja de entrada te roba 2 horas al día?"
Ejemplo:
Tema: IA para recursos humanos
Título: "El 40% de CVs nunca los lee un humano"
Ejemplo:
Tema: chatbots para ecommerce
Título: "¿Por qué tu tienda pierde ventas a las 3 AM?"
Ahora genera 3 títulos para:
Tema: IA para análisis financiero
Nota: en tareas creativas, 3 ejemplos son el mínimo para que el modelo capte el "vibe" que buscas. Con menos, tiende a generalizar demasiado.
Patrones de formato efectivos
El formato de tus ejemplos importa tanto como su contenido. Estos son los patrones que mejor funcionan:
Patrón Input/Output (el más versátil):
Input: [dato de entrada]
Output: [resultado esperado]
Patrón Pregunta/Respuesta (para Q&A):
Q: [pregunta del usuario]
A: [respuesta ideal]
Patrón con etiquetas XML (mayor precisión con Claude):
<example>
<input>texto de entrada</input>
<output>resultado esperado</output>
</example>
Patrón con delimitadores (para ejemplos largos):
---
Entrada: [texto largo de entrada]
Salida: [resultado largo]
---
Patrón con reasoning (para tareas de análisis):
Input: "El servidor responde en 15 segundos"
Razonamiento: Tiempo de respuesta > 5s indica problema grave
Output: {"severidad": "alta", "categoria": "performance"}
Consejo para Claude específicamente
Claude responde especialmente bien a ejemplos con etiquetas XML. Si usas Claude (Sonnet, Opus, Haiku), envuelve tus ejemplos en <example> tags. La precisión mejora un 5-10% comparado con delimitadores simples.
Few-shot vs fine-tuning
¿Cuándo es mejor invertir en fine-tuning qué seguir con few-shot? La decisión es económica y técnica:
Mantente con few-shot cuando:
- Procesas menos de 1.000 inputs/día con el mismo patrón
- Tus patrones cambian frecuentemente (iteras rápido)
- No tienes dataset de entrenamiento grande (menos de 100 ejemplos)
- La tarea requiere conocimiento general del mundo
- Necesitas flexibilidad para ajustar el comportamiento al instante
Considera fine-tuning cuando:
- Procesas más de 10.000 inputs/día con el mismo patrón exacto
- El patrón es estable y no cambia en meses
- Tienes 500+ ejemplos de input/output validados
- La latencia es crítica (fine-tuning elimina tokens de contexto)
- El coste por token es determinante (menos tokens = menos coste)
Comparativa de costes (ejemplo: clasificación de 10.000 textos/día):
- Few-shot (3 ejemplos, ~500 tokens extra por llamada): ~15 USD/día con Sonnet
- Fine-tuned (sin ejemplos en prompt): ~5 USD/día con modelo ajustado
- Breakeven: si el volumen es alto y el patrón estable, fine-tuning se amortiza en 2-4 semanas
El camino progresivo: empieza siempre con few-shot. Cuando tengas datos reales de producción (inputs + outputs correctos), tienes el dataset para fine-tuning gratis. Es el path natural: few-shot para validar, fine-tuning para escalar.
7 tips para few-shot efectivo
- Usa 2-3 ejemplos: el punto óptimo. 1 puede ser insuficiente, más de 5 gasta contexto sin mejorar calidad.
- Ejemplos diversos: cubre los casos edge. Si clasificas en 3 categorías, da al menos 1 ejemplo de cada.
- Formato idéntico: mantén el mismo formato en todos los ejemplos. Si el output es JSON, que todos los ejemplos sean JSON.
- Orden: fácil a difícil: pon el ejemplo más simple primero. Ayuda al modelo a establecer el patrón base.
- Separadores claros: usa "Ejemplo:", "Input:", "Output:" para que el modelo distinga los ejemplos del nuevo input.
- Incluye un caso edge: si hay un caso ambiguo frecuente, inclúyelo como ejemplo. El modelo lo usará como referencia cuando encuentre ambigüedad.
- Muestra qué NO hacer: opcionalmente, incluye un ejemplo negativo: "Input: X. Incorrecto: Y. Correcto: Z". Esto aclara la diferencia entre outputs similares.
Few-shot es el componente más poderoso del framework de 7 componentes. Si solo pudieras añadir una cosa a tus prompts, añade ejemplos.
Preguntas frecuentes
¿Qué es few-shot learning en prompting?
Few-shot learning es una técnica de prompting donde le das a la IA 1-3 ejemplos de input/output para que aprenda el patrón y lo replique con nuevos datos. No requiere entrenamiento ni acceso al modelo base: funciona directamente en el prompt con cualquier LLM (ChatGPT, Claude, Gemini, Llama).
¿Cuántos ejemplos necesito?
Entre 2 y 5 ejemplos suele ser óptimo. Con 1 ejemplo (one-shot) ya hay mejora notable sobre zero-shot. Más de 5 consume contexto sin mejorar significativamente la calidad. La clave no es la cantidad, sino que los ejemplos sean diversos, representen los edge cases, y mantengan formato consistente.
¿Few-shot vs zero-shot: cuándo usar cada uno?
Zero-shot (sin ejemplos) funciona para tareas simples con modelos potentes: traducciones, resúmenes, respuestas directas. Few-shot es necesario cuando: necesitas un formato de salida específico, la tarea tiene categorías custom que el modelo no conoce, la precisión es crítica para tu caso de uso, o el modelo malinterpreta tus instrucciones sin ejemplos.
¿Cuándo debería usar fine-tuning en vez de few-shot?
Fine-tuning supera a few-shot cuando procesas más de 10.000 inputs/día con el mismo patrón, cuando los ejemplos son demasiados para caber en el contexto, o cuando necesitas latencia mínima y coste por token reducido. Para menos de 1.000 inputs/día, few-shot suele ser suficiente y mucho más flexible.
¿Funciona igual en todos los modelos?
Sí, few-shot funciona con todos los LLMs modernos. Sin embargo, hay matices: Claude responde mejor a ejemplos con etiquetas XML; GPT-4 funciona bien con cualquier formato; modelos más pequeños (Haiku, GPT-4o mini) necesitan ejemplos más explícitos y claros. Cuanto menor sea el modelo, más se beneficia de few-shot.
Domina el prompting profesional
El Módulo 02 (gratis) cubre few-shot, cadenas de prompts y tu primera prompt library. Con ejercicios prácticos. Para profundizar, consulta nuestra guía sobre Cadena de prompts: como encadenar peticiones.
Acceder al Módulo 02 gratisCurso completo: 108 módulos de IA aplicada
11 especializaciones por departamento. Dashboard con progreso. Quizzes y skills desbloqueables. Desde 399 EUR.