Few-shot learning: ejemplos prácticos para prompts

Por Ricardo Gutierrez · · 20 min lectura

En este artículo

  1. Qué es few-shot learning
  2. Cuándo usarlo (y cuándo no)
  3. Número óptimo de ejemplos
  4. Ejemplo 1: Clasificar emails
  5. Ejemplo 2: Extraer datos estructurados
  6. Ejemplo 3: Generar formato JSON
  7. Ejemplo 4: Tono consistente
  8. Ejemplo 5: Transformación de texto
  9. Ejemplo 6: Generación creativa con estilo
  10. Patrones de formato efectivos
  11. Few-shot vs fine-tuning
  12. 7 tips para few-shot efectivo
  13. Preguntas frecuentes

Resumen rápido

Qué es few-shot learning y cómo usarlo en tus prompts. 6 ejemplos prácticos por dominio (clasificación, extracción, JSON, tono, transformación, generación), número óptimo de shots, patrones de formato y comparativa con fine-tuning.

Qué es few-shot learning

Few-shot learning es darle a la IA 1-3 ejemplos de input/output en el prompt para que aprenda el patrón y lo replique. No es entrenamiento: es una técnica de prompting que funciona con cualquier modelo (ChatGPT, Claude, Gemini).

💡 Experiencia del equipo: Nuestro equipo ha escrito más de 500 prompts profesionales para diferentes proyectos: desde generar un libro de 250 páginas sobre ciberseguridad hasta crear 10 posts de LinkedIn con datos específicos. La diferencia entre un prompt mediocre y uno excelente no es la longitud, es la especificidad del contexto.

La idea es simple: en vez de explicar con palabras lo que quieres, se lo muestras con ejemplos. Es como enseñar a alguien nuevo en el equipo: "mira cómo hice los últimos 3, ahora haz tú el siguiente".

ZERO-SHOT (sin ejemplos) "Clasifica este email como urgente, normal o spam" FEW-SHOT (con ejemplos) "Email: 'Servidor caído' → urgente" "Email: 'Newsletter mayo' → normal | Ahora clasifica: ..."
Zero-shot vs Few-shot: la diferencia está en los ejemplos

Cuándo usarlo (y cuándo no)

Usa few-shot cuando:

💡 Dato real: Usando técnicas de prompting avanzado, generé 47 artículos SEO en una sesión de 4 horas. Sin prompting estructurado, cada artículo me habría costado 2-3 horas. El ROI del buen prompting es brutal.

No lo necesitas cuando:

Número óptimo de ejemplos

La pregunta más frecuente: ¿cuántos ejemplos son suficientes? La respuesta depende de la tarea:

1 ejemplo (one-shot): suficiente para tareas simples donde solo necesitas mostrar el formato de salida. Ejemplo: "Dame la respuesta en formato tabla".

2-3 ejemplos (few-shot clásico): el sweet spot para la mayoría de tareas. Cubre el caso normal y 1-2 edge cases. Es la opción recomendada por defecto.

4-5 ejemplos: necesario cuando tienes múltiples categorías (ej: clasificación en 5 clases) y quieres al menos un ejemplo por clase.

6+ ejemplos (many-shot): rendimiento marginal en la mayoría de tareas. Solo justificado cuando la tarea es muy ambigua o cuando usas modelos con ventana de contexto larga (100K+ tokens) y los ejemplos son cortos.

Regla práctica: empieza con 2 ejemplos. Si la precisión no es suficiente, añade 1 más con un caso edge. Si con 5 ejemplos no funciona bien, el problema no es la cantidad de ejemplos: es la formulación del prompt o la elección del modelo.

1 ejemplo One-shot ~85% ok 2-3 ejemplos Few-shot ~95% ok 5+ ejemplos Many-shot ~96% ok Rendimiento marginal decrece después de 3-5
Relación ejemplos vs precisión: el sweet spot es 2-3

Ejemplo 1: Clasificar emails

Sin few-shot, el modelo puede clasificar de forma inconsistente. Con 3 ejemplos, clava el patrón.

Clasifica cada email en: urgente, normal, spam.

Ejemplos:
Email: "URGENTE: servidor de producción caído desde las 3:00"
Clasificación: urgente

Email: "Resumen semanal de métricas del equipo"
Clasificación: normal

Email: "Has ganado un iPhone 15 gratis!!!"
Clasificación: spam

Ahora clasifica:
Email: "La base de datos no responde, clientes afectados"
Clasificación:

Resultado

Con few-shot: urgente (100% de acierto en tests con 50 emails).

Sin few-shot: acierto ~85% (a veces clasifica como "alta prioridad" en vez de "urgente").

Ejemplo 2: Extraer datos estructurados

Extraer información concreta de texto no estructurado. Few-shot le enseña qué campos buscar y en qué formato devolverlos.

Extrae los datos de cada factura.

Ejemplo:
Texto: "Factura F-2026-001 de Acme S.L., fecha 15/03/2026,
importe 1.200 EUR + IVA, concepto: consultoría IT marzo"
Resultado: {"número": "F-2026-001", "empresa": "Acme S.L.",
"fecha": "2026-03-15", "importe": 1200, "concepto": "consultoría IT marzo"}

Ejemplo:
Texto: "Fra. 456 - TechCorp, 28 feb 2026. Total 3.500,00 EUR
por desarrollo web Q1"
Resultado: {"número": "456", "empresa": "TechCorp",
"fecha": "2026-02-28", "importe": 3500, "concepto": "desarrollo web Q1"}

Ahora extrae:
Texto: "Factura INV-789 de DataFlow Inc., emitida el 1 de abril
de 2026 por un total de 850 euros. Servicio: hosting anual"

Por qué funciona: los dos ejemplos muestran formatos de factura diferentes (numeración distinta, formato de fecha distinto, expresión del importe diferente). El modelo aprende a normalizar cualquier formato al schema JSON definido.

Ejemplo 3: Generar formato JSON

Cuándo necesitas un schema JSON específico, few-shot es más fiable que describir el schema con palabras.

Convierte cada descripción de producto a JSON.

Ejemplo:
Input: "Camiseta negra talla L, 29.99€, quedan 45 unidades"
Output: {"name": "Camiseta negra", "size": "L",
"price": 29.99, "stock": 45, "currency": "EUR"}

Ejemplo:
Input: "Zapatillas running blancas 42, 89€, 12 en stock"
Output: {"name": "Zapatillas running blancas", "size": "42",
"price": 89, "stock": 12, "currency": "EUR"}

Ahora convierte:
Input: "Mochila impermeable gris, talla única, 54.50 EUR, 8 disponibles"

Ejemplo 4: Tono consistente

Para mantener un estilo de escritura uniforme (newsletter, social media, documentación). Especialmente útil si generas contenido en serie.

Escribe tweets sobre herramientas de IA. Tono: directo,
sin hype, con dato concreto.

Ejemplo:
Herramienta: Claude Code
Tweet: "Claude Code no es un chatbot. Es un agente en tu
terminal que lee tu repo, ejecuta tests y hace commits.
Si programas, pruébalo 10 minutos."

Ejemplo:
Herramienta: n8n
Tweet: "n8n es automatización visual con nodos de IA. Conectas
Slack + GPT + Postgres en 5 minutos. Open source, self-hosted."

Ahora escribe:
Herramienta: Cursor

Ejemplo 5: Transformación de texto

Transformar texto de un formato o registro a otro. Ideal para reescrituras masivas con estilo consistente.

Transforma descripciones técnicas de producto en copy de venta
emocional para landing page. Máximo 2 frases.

Ejemplo:
Técnico: "Software de gestión de proyectos con tableros Kanban,
diagramas de Gantt, tracking de tiempo y 50 integraciones."
Copy: "Deja de perder horas buscando en qué va cada proyecto.
Un solo lugar donde tu equipo sabe qué hacer, cuándo y cómo."

Ejemplo:
Técnico: "Plataforma de email marketing con segmentación
avanzada, A/B testing, automatizaciones y analytics en tiempo real."
Copy: "Envía el email correcto a la persona correcta en el
momento exacto. Sin adivinar: los datos te dicen qué funciona."

Ejemplo:
Técnico: "Herramienta de backup automático con cifrado AES-256,
restauración en 1 click, y soporte para 15 providers de cloud."
Copy: "Duerme tranquilo sabiendo que tus datos están a salvo.
Si algo falla, un click y todo vuelve a la normalidad."

Ahora transforma:
Técnico: "API de procesamiento de lenguaje natural con análisis
de sentimiento, extracción de entidades y clasificación de texto
en 40 idiomas."

Clave del éxito: los 3 ejemplos muestran la transformación de lenguaje técnico (features) a lenguaje emocional (beneficios). El modelo aprende que no debe listar features, sino comunicar el resultado que obtiene el usuario.

Ejemplo 6: Generación creativa con estilo

Few-shot también funciona para tareas creativas cuando necesitas un estilo específico que es difícil de describir con palabras.

Genera títulos de artículos de blog sobre IA. Estilo: pregunta
intrigante o dato sorprendente. Sin clickbait. Sin signos de
exclamación. Máximo 60 caracteres.

Ejemplo:
Tema: automatización de emails
Título: "¿Tu bandeja de entrada te roba 2 horas al día?"

Ejemplo:
Tema: IA para recursos humanos
Título: "El 40% de CVs nunca los lee un humano"

Ejemplo:
Tema: chatbots para ecommerce
Título: "¿Por qué tu tienda pierde ventas a las 3 AM?"

Ahora genera 3 títulos para:
Tema: IA para análisis financiero

Nota: en tareas creativas, 3 ejemplos son el mínimo para que el modelo capte el "vibe" que buscas. Con menos, tiende a generalizar demasiado.

Patrones de formato efectivos

El formato de tus ejemplos importa tanto como su contenido. Estos son los patrones que mejor funcionan:

Patrón Input/Output (el más versátil):

Input: [dato de entrada]
Output: [resultado esperado]

Patrón Pregunta/Respuesta (para Q&A):

Q: [pregunta del usuario]
A: [respuesta ideal]

Patrón con etiquetas XML (mayor precisión con Claude):

<example>
<input>texto de entrada</input>
<output>resultado esperado</output>
</example>

Patrón con delimitadores (para ejemplos largos):

---
Entrada: [texto largo de entrada]
Salida: [resultado largo]
---

Patrón con reasoning (para tareas de análisis):

Input: "El servidor responde en 15 segundos"
Razonamiento: Tiempo de respuesta > 5s indica problema grave
Output: {"severidad": "alta", "categoria": "performance"}

Consejo para Claude específicamente

Claude responde especialmente bien a ejemplos con etiquetas XML. Si usas Claude (Sonnet, Opus, Haiku), envuelve tus ejemplos en <example> tags. La precisión mejora un 5-10% comparado con delimitadores simples.

Few-shot vs fine-tuning

¿Cuándo es mejor invertir en fine-tuning qué seguir con few-shot? La decisión es económica y técnica:

Mantente con few-shot cuando:

Considera fine-tuning cuando:

Comparativa de costes (ejemplo: clasificación de 10.000 textos/día):

El camino progresivo: empieza siempre con few-shot. Cuando tengas datos reales de producción (inputs + outputs correctos), tienes el dataset para fine-tuning gratis. Es el path natural: few-shot para validar, fine-tuning para escalar.

7 tips para few-shot efectivo

  1. Usa 2-3 ejemplos: el punto óptimo. 1 puede ser insuficiente, más de 5 gasta contexto sin mejorar calidad.
  2. Ejemplos diversos: cubre los casos edge. Si clasificas en 3 categorías, da al menos 1 ejemplo de cada.
  3. Formato idéntico: mantén el mismo formato en todos los ejemplos. Si el output es JSON, que todos los ejemplos sean JSON.
  4. Orden: fácil a difícil: pon el ejemplo más simple primero. Ayuda al modelo a establecer el patrón base.
  5. Separadores claros: usa "Ejemplo:", "Input:", "Output:" para que el modelo distinga los ejemplos del nuevo input.
  6. Incluye un caso edge: si hay un caso ambiguo frecuente, inclúyelo como ejemplo. El modelo lo usará como referencia cuando encuentre ambigüedad.
  7. Muestra qué NO hacer: opcionalmente, incluye un ejemplo negativo: "Input: X. Incorrecto: Y. Correcto: Z". Esto aclara la diferencia entre outputs similares.

Few-shot es el componente más poderoso del framework de 7 componentes. Si solo pudieras añadir una cosa a tus prompts, añade ejemplos.

Preguntas frecuentes

¿Qué es few-shot learning en prompting?

Few-shot learning es una técnica de prompting donde le das a la IA 1-3 ejemplos de input/output para que aprenda el patrón y lo replique con nuevos datos. No requiere entrenamiento ni acceso al modelo base: funciona directamente en el prompt con cualquier LLM (ChatGPT, Claude, Gemini, Llama).

¿Cuántos ejemplos necesito?

Entre 2 y 5 ejemplos suele ser óptimo. Con 1 ejemplo (one-shot) ya hay mejora notable sobre zero-shot. Más de 5 consume contexto sin mejorar significativamente la calidad. La clave no es la cantidad, sino que los ejemplos sean diversos, representen los edge cases, y mantengan formato consistente.

¿Few-shot vs zero-shot: cuándo usar cada uno?

Zero-shot (sin ejemplos) funciona para tareas simples con modelos potentes: traducciones, resúmenes, respuestas directas. Few-shot es necesario cuando: necesitas un formato de salida específico, la tarea tiene categorías custom que el modelo no conoce, la precisión es crítica para tu caso de uso, o el modelo malinterpreta tus instrucciones sin ejemplos.

¿Cuándo debería usar fine-tuning en vez de few-shot?

Fine-tuning supera a few-shot cuando procesas más de 10.000 inputs/día con el mismo patrón, cuando los ejemplos son demasiados para caber en el contexto, o cuando necesitas latencia mínima y coste por token reducido. Para menos de 1.000 inputs/día, few-shot suele ser suficiente y mucho más flexible.

¿Funciona igual en todos los modelos?

Sí, few-shot funciona con todos los LLMs modernos. Sin embargo, hay matices: Claude responde mejor a ejemplos con etiquetas XML; GPT-4 funciona bien con cualquier formato; modelos más pequeños (Haiku, GPT-4o mini) necesitan ejemplos más explícitos y claros. Cuanto menor sea el modelo, más se beneficia de few-shot.

Domina el prompting profesional

El Módulo 02 (gratis) cubre few-shot, cadenas de prompts y tu primera prompt library. Con ejercicios prácticos. Para profundizar, consulta nuestra guía sobre Cadena de prompts: como encadenar peticiones.

Acceder al Módulo 02 gratis

Curso completo: 108 módulos de IA aplicada

11 especializaciones por departamento. Dashboard con progreso. Quizzes y skills desbloqueables. Desde 399 EUR.

Ver precios Acceder al portal