Cuántos ejemplos necesito para few-shot?

Entre 2 y 5 ejemplos suele ser óptimo. Con 1 ejemplo (one-shot) ya hay mejora. Más de 5 consume contexto sin mejorar mucho la calidad. La clave es que los ejemplos sean diversos y representativos.

Few-shot learning funciona con todos los modelos?

Sí. Funciona con ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google) y modelos open-source. Es una técnica de prompting, no depende del modelo.

Few-shot learning: ejemplos prácticos para prompts

Q: Few-shot vs zero-shot: cuándo usar cada uno?

Zero-shot (sin ejemplos) funciona para tareas simples y modelos potentes. Few-shot es necesario cuando necesitas un formato específico, cuando el modelo no entiende la tarea solo con instrucciones, o cuando la precisión es crítica.

Q: Cuándo es mejor usar fine-tuning en vez de few-shot?

Fine-tuning supera a few-shot cuando necesitas procesar miles de inputs con el mismo patrón, cuando los ejemplos son demasiados para caber en el contexto, o cuando necesitas latencia mínima y coste por token reducido. Para menos de 1000 inputs/día, few-shot suele ser suficiente.

En este artículo

Qué es few-shot learning
Cuándo usarlo (y cuándo no)
Número óptimo de ejemplos
Ejemplo 1: Clasificar emails
Ejemplo 2: Extraer datos estructurados
Ejemplo 3: Generar formato JSON
Ejemplo 4: Tono consistente
Ejemplo 5: Transformación de texto
Ejemplo 6: Generación creativa con estilo
Patrones de formato efectivos
Few-shot vs fine-tuning
7 tips para few-shot efectivo
Preguntas frecuentes

Resumen rápido

Qué es few-shot learning y cómo usarlo en tus prompts. 6 ejemplos prácticos por dominio (clasificación, extracción, JSON, tono, transformación, generación), número óptimo de shots, patrones de formato y comparativa con fine-tuning.

Qué es few-shot learning

Few-shot learning es darle a la IA 1-3 ejemplos de input/output en el prompt para que aprenda el patrón y lo replique. No es entrenamiento: es una técnica de prompting que funciona con cualquier modelo (ChatGPT, Claude, Gemini).

💡 Experiencia del equipo: Nuestro equipo ha escrito más de 500 prompts profesionales para diferentes proyectos: desde generar un libro de 250 páginas sobre ciberseguridad hasta crear 10 posts de LinkedIn con datos específicos. La diferencia entre un prompt mediocre y uno excelente no es la longitud, es la especificidad del contexto.

La idea es simple: en vez de explicar con palabras lo que quieres, se lo muestras con ejemplos. Es como enseñar a alguien nuevo en el equipo: "mira cómo hice los últimos 3, ahora haz tú el siguiente".

Zero-shot vs Few-shot: la diferencia está en los ejemplos

Cuándo usarlo (y cuándo no)

Usa few-shot cuando:

💡 Dato real: Usando técnicas de prompting avanzado, generé 47 artículos SEO en una sesión de 4 horas. Sin prompting estructurado, cada artículo me habría costado 2-3 horas. El ROI del buen prompting es brutal.

Necesitas un formato específico (JSON, tabla, estructura custom)
La tarea es ambigua solo con instrucciones
La precisión es crítica (clasificación, extracción de datos)
Quieres un tono o estilo consistente
El modelo interpreta tu instrucción de forma diferente a lo que esperas
Trabajas con categorías no estándar que el modelo no conoce

No lo necesitas cuando:

La tarea es simple y clara ("traduce esto al inglés")
Usas un modelo potente y la instrucción es suficiente
El contexto es muy largo (los ejemplos consumen tokens)
La tarea requiere creatividad pura sin restricciones de formato

Número óptimo de ejemplos

La pregunta más frecuente: ¿cuántos ejemplos son suficientes? La respuesta depende de la tarea:

1 ejemplo (one-shot): suficiente para tareas simples donde solo necesitas mostrar el formato de salida. Ejemplo: "Dame la respuesta en formato tabla".

2-3 ejemplos (few-shot clásico): el sweet spot para la mayoría de tareas. Cubre el caso normal y 1-2 edge cases. Es la opción recomendada por defecto.

4-5 ejemplos: necesario cuando tienes múltiples categorías (ej: clasificación en 5 clases) y quieres al menos un ejemplo por clase.

6+ ejemplos (many-shot): rendimiento marginal en la mayoría de tareas. Solo justificado cuando la tarea es muy ambigua o cuando usas modelos con ventana de contexto larga (100K+ tokens) y los ejemplos son cortos.

Regla práctica: empieza con 2 ejemplos. Si la precisión no es suficiente, añade 1 más con un caso edge. Si con 5 ejemplos no funciona bien, el problema no es la cantidad de ejemplos: es la formulación del prompt o la elección del modelo.

Relación ejemplos vs precisión: el sweet spot es 2-3

Ejemplo 1: Clasificar emails

Sin few-shot, el modelo puede clasificar de forma inconsistente. Con 3 ejemplos, clava el patrón.

Clasifica cada email en: urgente, normal, spam.

Ejemplos:
Email: "URGENTE: servidor de producción caído desde las 3:00"
Clasificación: urgente

Email: "Resumen semanal de métricas del equipo"
Clasificación: normal

Email: "Has ganado un iPhone 15 gratis!!!"
Clasificación: spam

Ahora clasifica:
Email: "La base de datos no responde, clientes afectados"
Clasificación:

Resultado

Con few-shot: urgente (100% de acierto en tests con 50 emails).

Sin few-shot: acierto ~85% (a veces clasifica como "alta prioridad" en vez de "urgente").

Ejemplo 2: Extraer datos estructurados

Extraer información concreta de texto no estructurado. Few-shot le enseña qué campos buscar y en qué formato devolverlos.

Extrae los datos de cada factura.

Ejemplo:
Texto: "Factura F-2026-001 de Acme S.L., fecha 15/03/2026,
importe 1.200 EUR + IVA, concepto: consultoría IT marzo"
Resultado: {"número": "F-2026-001", "empresa": "Acme S.L.",
"fecha": "2026-03-15", "importe": 1200, "concepto": "consultoría IT marzo"}

Ejemplo:
Texto: "Fra. 456 - TechCorp, 28 feb 2026. Total 3.500,00 EUR
por desarrollo web Q1"
Resultado: {"número": "456", "empresa": "TechCorp",
"fecha": "2026-02-28", "importe": 3500, "concepto": "desarrollo web Q1"}

Ahora extrae:
Texto: "Factura INV-789 de DataFlow Inc., emitida el 1 de abril
de 2026 por un total de 850 euros. Servicio: hosting anual"

Por qué funciona: los dos ejemplos muestran formatos de factura diferentes (numeración distinta, formato de fecha distinto, expresión del importe diferente). El modelo aprende a normalizar cualquier formato al schema JSON definido.

Ejemplo 3: Generar formato JSON

Cuándo necesitas un schema JSON específico, few-shot es más fiable que describir el schema con palabras.

Convierte cada descripción de producto a JSON.

Ejemplo:
Input: "Camiseta negra talla L, 29.99€, quedan 45 unidades"
Output: {"name": "Camiseta negra", "size": "L",
"price": 29.99, "stock": 45, "currency": "EUR"}

Ejemplo:
Input: "Zapatillas running blancas 42, 89€, 12 en stock"
Output: {"name": "Zapatillas running blancas", "size": "42",
"price": 89, "stock": 12, "currency": "EUR"}

Ahora convierte:
Input: "Mochila impermeable gris, talla única, 54.50 EUR, 8 disponibles"

Ejemplo 4: Tono consistente

Para mantener un estilo de escritura uniforme (newsletter, social media, documentación). Especialmente útil si generas contenido en serie.

Escribe tweets sobre herramientas de IA. Tono: directo,
sin hype, con dato concreto.

Ejemplo:
Herramienta: Claude Code
Tweet: "Claude Code no es un chatbot. Es un agente en tu
terminal que lee tu repo, ejecuta tests y hace commits.
Si programas, pruébalo 10 minutos."

Ejemplo:
Herramienta: n8n
Tweet: "n8n es automatización visual con nodos de IA. Conectas
Slack + GPT + Postgres en 5 minutos. Open source, self-hosted."

Ahora escribe:
Herramienta: Cursor

Ejemplo 5: Transformación de texto

Transformar texto de un formato o registro a otro. Ideal para reescrituras masivas con estilo consistente.

Transforma descripciones técnicas de producto en copy de venta
emocional para landing page. Máximo 2 frases.

Ejemplo:
Técnico: "Software de gestión de proyectos con tableros Kanban,
diagramas de Gantt, tracking de tiempo y 50 integraciones."
Copy: "Deja de perder horas buscando en qué va cada proyecto.
Un solo lugar donde tu equipo sabe qué hacer, cuándo y cómo."

Ejemplo:
Técnico: "Plataforma de email marketing con segmentación
avanzada, A/B testing, automatizaciones y analytics en tiempo real."
Copy: "Envía el email correcto a la persona correcta en el
momento exacto. Sin adivinar: los datos te dicen qué funciona."

Ejemplo:
Técnico: "Herramienta de backup automático con cifrado AES-256,
restauración en 1 click, y soporte para 15 providers de cloud."
Copy: "Duerme tranquilo sabiendo que tus datos están a salvo.
Si algo falla, un click y todo vuelve a la normalidad."

Ahora transforma:
Técnico: "API de procesamiento de lenguaje natural con análisis
de sentimiento, extracción de entidades y clasificación de texto
en 40 idiomas."

Clave del éxito: los 3 ejemplos muestran la transformación de lenguaje técnico (features) a lenguaje emocional (beneficios). El modelo aprende que no debe listar features, sino comunicar el resultado que obtiene el usuario.

Ejemplo 6: Generación creativa con estilo

Few-shot también funciona para tareas creativas cuando necesitas un estilo específico que es difícil de describir con palabras.

Genera títulos de artículos de blog sobre IA. Estilo: pregunta
intrigante o dato sorprendente. Sin clickbait. Sin signos de
exclamación. Máximo 60 caracteres.

Ejemplo:
Tema: automatización de emails
Título: "¿Tu bandeja de entrada te roba 2 horas al día?"

Ejemplo:
Tema: IA para recursos humanos
Título: "El 40% de CVs nunca los lee un humano"

Ejemplo:
Tema: chatbots para ecommerce
Título: "¿Por qué tu tienda pierde ventas a las 3 AM?"

Ahora genera 3 títulos para:
Tema: IA para análisis financiero

Nota: en tareas creativas, 3 ejemplos son el mínimo para que el modelo capte el "vibe" que buscas. Con menos, tiende a generalizar demasiado.

Patrones de formato efectivos

El formato de tus ejemplos importa tanto como su contenido. Estos son los patrones que mejor funcionan:

Patrón Input/Output (el más versátil):

Input: [dato de entrada]
Output: [resultado esperado]

Patrón Pregunta/Respuesta (para Q&A):

Q: [pregunta del usuario]
A: [respuesta ideal]

Patrón con etiquetas XML (mayor precisión con Claude):

<example>
<input>texto de entrada</input>
<output>resultado esperado</output>
</example>

Patrón con delimitadores (para ejemplos largos):

---
Entrada: [texto largo de entrada]
Salida: [resultado largo]
---

Patrón con reasoning (para tareas de análisis):

Input: "El servidor responde en 15 segundos"
Razonamiento: Tiempo de respuesta > 5s indica problema grave
Output: {"severidad": "alta", "categoria": "performance"}

Consejo para Claude específicamente

Claude responde especialmente bien a ejemplos con etiquetas XML. Si usas Claude (Sonnet, Opus, Haiku), envuelve tus ejemplos en <example> tags. La precisión mejora un 5-10% comparado con delimitadores simples.

Few-shot vs fine-tuning

¿Cuándo es mejor invertir en fine-tuning qué seguir con few-shot? La decisión es económica y técnica:

Mantente con few-shot cuando:

Procesas menos de 1.000 inputs/día con el mismo patrón
Tus patrones cambian frecuentemente (iteras rápido)
No tienes dataset de entrenamiento grande (menos de 100 ejemplos)
La tarea requiere conocimiento general del mundo
Necesitas flexibilidad para ajustar el comportamiento al instante

Considera fine-tuning cuando:

Procesas más de 10.000 inputs/día con el mismo patrón exacto
El patrón es estable y no cambia en meses
Tienes 500+ ejemplos de input/output validados
La latencia es crítica (fine-tuning elimina tokens de contexto)
El coste por token es determinante (menos tokens = menos coste)

Comparativa de costes (ejemplo: clasificación de 10.000 textos/día):

Few-shot (3 ejemplos, ~500 tokens extra por llamada): ~15 USD/día con Sonnet
Fine-tuned (sin ejemplos en prompt): ~5 USD/día con modelo ajustado
Breakeven: si el volumen es alto y el patrón estable, fine-tuning se amortiza en 2-4 semanas

El camino progresivo: empieza siempre con few-shot. Cuando tengas datos reales de producción (inputs + outputs correctos), tienes el dataset para fine-tuning gratis. Es el path natural: few-shot para validar, fine-tuning para escalar.

7 tips para few-shot efectivo

Usa 2-3 ejemplos: el punto óptimo. 1 puede ser insuficiente, más de 5 gasta contexto sin mejorar calidad.
Ejemplos diversos: cubre los casos edge. Si clasificas en 3 categorías, da al menos 1 ejemplo de cada.
Formato idéntico: mantén el mismo formato en todos los ejemplos. Si el output es JSON, que todos los ejemplos sean JSON.
Orden: fácil a difícil: pon el ejemplo más simple primero. Ayuda al modelo a establecer el patrón base.
Separadores claros: usa "Ejemplo:", "Input:", "Output:" para que el modelo distinga los ejemplos del nuevo input.
Incluye un caso edge: si hay un caso ambiguo frecuente, inclúyelo como ejemplo. El modelo lo usará como referencia cuando encuentre ambigüedad.
Muestra qué NO hacer: opcionalmente, incluye un ejemplo negativo: "Input: X. Incorrecto: Y. Correcto: Z". Esto aclara la diferencia entre outputs similares.

Few-shot es el componente más poderoso del framework de 7 componentes. Si solo pudieras añadir una cosa a tus prompts, añade ejemplos.

Preguntas frecuentes

¿Qué es few-shot learning en prompting?

Few-shot learning es una técnica de prompting donde le das a la IA 1-3 ejemplos de input/output para que aprenda el patrón y lo replique con nuevos datos. No requiere entrenamiento ni acceso al modelo base: funciona directamente en el prompt con cualquier LLM (ChatGPT, Claude, Gemini, Llama).

¿Cuántos ejemplos necesito?

Entre 2 y 5 ejemplos suele ser óptimo. Con 1 ejemplo (one-shot) ya hay mejora notable sobre zero-shot. Más de 5 consume contexto sin mejorar significativamente la calidad. La clave no es la cantidad, sino que los ejemplos sean diversos, representen los edge cases, y mantengan formato consistente.

¿Few-shot vs zero-shot: cuándo usar cada uno?

Zero-shot (sin ejemplos) funciona para tareas simples con modelos potentes: traducciones, resúmenes, respuestas directas. Few-shot es necesario cuando: necesitas un formato de salida específico, la tarea tiene categorías custom que el modelo no conoce, la precisión es crítica para tu caso de uso, o el modelo malinterpreta tus instrucciones sin ejemplos.

¿Cuándo debería usar fine-tuning en vez de few-shot?

Fine-tuning supera a few-shot cuando procesas más de 10.000 inputs/día con el mismo patrón, cuando los ejemplos son demasiados para caber en el contexto, o cuando necesitas latencia mínima y coste por token reducido. Para menos de 1.000 inputs/día, few-shot suele ser suficiente y mucho más flexible.

¿Funciona igual en todos los modelos?

Sí, few-shot funciona con todos los LLMs modernos. Sin embargo, hay matices: Claude responde mejor a ejemplos con etiquetas XML; GPT-4 funciona bien con cualquier formato; modelos más pequeños (Haiku, GPT-4o mini) necesitan ejemplos más explícitos y claros. Cuanto menor sea el modelo, más se beneficia de few-shot.

Domina el prompting profesional

El Módulo 02 (gratis) cubre few-shot, cadenas de prompts y tu primera prompt library. Con ejercicios prácticos. Para profundizar, consulta nuestra guía sobre Cadena de prompts: como encadenar peticiones.

Acceder al Módulo 02 gratis

Curso completo: 108 módulos de IA aplicada

11 especializaciones por departamento. Dashboard con progreso. Quizzes y skills desbloqueables. Desde 399 EUR.

Ver precios Acceder al portal

Few-shot learning: ejemplos prácticos para prompts

En este artículo

Resumen rápido

Qué es few-shot learning

Cuándo usarlo (y cuándo no)

Número óptimo de ejemplos

Ejemplo 1: Clasificar emails

Resultado

Ejemplo 2: Extraer datos estructurados

Ejemplo 3: Generar formato JSON

Ejemplo 4: Tono consistente

Ejemplo 5: Transformación de texto

Ejemplo 6: Generación creativa con estilo

Patrones de formato efectivos

Consejo para Claude específicamente

Few-shot vs fine-tuning

7 tips para few-shot efectivo

Preguntas frecuentes

¿Qué es few-shot learning en prompting?

¿Cuántos ejemplos necesito?

¿Few-shot vs zero-shot: cuándo usar cada uno?

¿Cuándo debería usar fine-tuning en vez de few-shot?

¿Funciona igual en todos los modelos?

Artículos relacionados

Domina el prompting profesional

Curso completo: 108 módulos de IA aplicada