¿Qué es la ventana de contexto?
La ventana de contexto es toda la información que el modelo puede tener presente mientras responde: instrucciones, conversación, documentos, resultados de herramientas y también la propia salida que está generando.
Se parece a una memoria de trabajo, no a la memoria total del sistema. El modelo puede haber sido entrenado con enormes cantidades de datos, pero en cada petición solo opera con lo que cabe dentro de esa ventana en ese momento.
Eso explica por qué muchas implementaciones fallan aunque tengan mucha información. El problema no es solo cuánto contexto meten, sino qué meten, en qué orden y con qué prioridad. Más texto no implica automáticamente mejor resultado.
Qué entra dentro de esa ventana
No solo cuenta la pregunta del usuario. También cuentan las instrucciones del sistema, ejemplos, historial de conversación, fragmentos recuperados con RAG, definiciones de herramientas y la respuesta que el modelo está construyendo.
Por eso una aplicación aparentemente sencilla puede consumir mucho contexto sin que se note a simple vista.
Por qué más contexto no siempre es mejor
Si mezclas demasiadas cosas, el modelo puede dispersarse, olvidar detalles importantes o apoyar su respuesta en información secundaria. El reto no es llenar la ventana, sino curarla bien.
En la práctica suele funcionar mejor una selección precisa de contexto que un volcado masivo de documentos completos.
Qué síntomas indican un problema de contexto
Respuestas que antes eran correctas y después empiezan a mezclar instrucciones, pérdida de detalles en conversaciones largas, citas de fragmentos irrelevantes o alucinaciones cuando el dato correcto sí existía pero quedó enterrado.
En esos casos conviene revisar la arquitectura de contexto, no solo reescribir el prompt.
¿Qué es un token?
¿Qué es un prompt?
RAG o recuperación aumentada
Memoria en la IA
Si quieres aplicar IA en tu negocio,
Te explico qué hago y cómo trabajo: Aquí