¿Qué es el fine-tuning?

El fine-tuning es un entrenamiento adicional que adapta un modelo existente utilizando ejemplos seleccionados para modificar su comportamiento en una tarea concreta.

En lugar de entrenar un modelo desde cero, se parte de uno que ya conoce patrones generales y se ajustan parte de sus parámetros con nuevos ejemplos de entrada y salida.

El objetivo no suele ser enseñarle todos los datos de una empresa, sino conseguir un comportamiento más consistente: clasificar según categorías propias, respetar un formato, utilizar un estilo o resolver mejor una tarea repetida.

Qué problemas puede resolver bien

Puede mejorar tareas donde existen muchos ejemplos de calidad y un criterio estable: clasificación, extracción especializada, formato estricto o generación con convenciones difíciles de explicar en cada prompt.

También puede reducir la longitud de las instrucciones y permitir que un modelo más pequeño alcance la calidad necesaria en una tarea muy concreta.

Fine-tuning y RAG resuelven cosas distintas

El fine-tuning modifica cómo se comporta el modelo. RAG aporta información en el momento de la petición. Si cambian precios, políticas, catálogos o documentos internos, normalmente conviene recuperarlos como contexto en lugar de incorporarlos al entrenamiento.

Los dos métodos pueden combinarse: un modelo ajustado para seguir un formato puede responder utilizando documentación recuperada y actualizada.

Qué hace falta antes de entrenarlo

Primero se necesita una referencia de calidad: un conjunto de pruebas que permita comparar el modelo base con el ajustado. Sin evaluación, es fácil confundir una mejora en unos ejemplos con una pérdida general de capacidad.

Los datos de entrenamiento deben representar la tarea real, mantener un formato coherente y contener respuestas que realmente queramos reproducir. Un modelo aprende también los defectos de los ejemplos.

Cuándo no es la primera solución

Si el problema viene de instrucciones ambiguas, contexto incorrecto, herramientas mal diseñadas o un flujo roto, ajustar el modelo puede ocultar el fallo sin resolverlo. Primero conviene probar una mejor ingeniería de prompts y una arquitectura más clara.

Tampoco es ideal cuando apenas existen ejemplos buenos o el comportamiento esperado cambia constantemente. El entrenamiento añade una versión más que mantener, evaluar y actualizar.

Cómo se comprueba el resultado

El modelo ajustado debe evaluarse con casos que no participaron en el entrenamiento. Hay que medir la tarea concreta y revisar si aparecen regresiones en seguridad, formatos o situaciones menos frecuentes.

La mejora útil es la que se mantiene con datos nuevos y compensa el coste de preparar ejemplos, entrenar, desplegar y volver a evaluar.

¿Qué es un LLM?

Entrenamiento de la IA

Ingeniería de prompts

RAG o recuperación aumentada

Cómo probar agentes de IA

Si quieres aplicar IA en tu negocio,

Te explico qué hago y cómo trabajo: Aquí

Una idea práctica sobre IA, cada día

Recibe cada día un email con un consejo para aplicar inteligencia artificial en tu negocio sin perder tiempo ni dinero.