¿Cómo se prueba un agente de voz?
Probar un agente de voz exige validar por separado el comportamiento conversacional, los límites con herramientas y el recorrido completo bajo condiciones reales de audio.
Realizar unas cuantas llamadas manuales sólo demuestra que el happy path puede funcionar.
Una estrategia útil utiliza una pirámide: muchas pruebas pequeñas, pruebas de integración en los límites y un conjunto menor de conversaciones completas.
Pruebas del siguiente turno
Dado un historial y una intervención, se comprueba si el agente responde, pregunta o llama a la herramienta correcta con los argumentos adecuados.
Estas pruebas detectan regresiones del prompt de forma rápida y pueden ejecutarse ante cada cambio.
Pruebas de contratos y handoffs
Se validan schemas, permisos, timeouts, reintentos, idempotencia y estados de error. También se comprueba que una transferencia conserva los datos necesarios y tiene fallback.
Los backends simulados deben devolver resultados deterministas para reproducir un fallo sin depender de servicios externos.
Conversaciones de principio a fin
Cada workflow necesita escenarios normales, variantes, casos límite y entradas adversariales. El criterio incluye resultado, herramientas, confirmaciones y salida final.
Las conversaciones completas descubren interacciones entre componentes, pero son más lentas y no siempre explican dónde se originó el fallo.
Condiciones reales de audio
Se prueban ruido, coche, altavoz, mala cobertura, acentos, velocidad, pausas, interrupciones, nombres, números y cambios de idioma.
También se mide el final de turno y la latencia. El audio limpio del laboratorio suele ocultar los problemas que dominan las llamadas reales.
Pruebas de carga y telefonía
La concurrencia puede cambiar latencia, errores y calidad. Se prueban picos, límites de proveedor, colas, SIP, transferencias, cortes y recuperación.
Una prueba de carga debe observar percentiles y no sólo promedios. El sistema necesita degradar con seguridad cuando alcanza capacidad.
Criterios para un piloto
Antes de exponer clientes se fijan umbrales de resolución, error, satisfacción, transferencia y estabilidad. El piloto debe producir una decisión de avanzar, corregir o detener.
Los fallos del piloto se incorporan a la suite para que no reaparezcan después de una modificación.
Cómo probar agentes de IA
Diseño conversacional para voz
Contratos de herramientas
Cómo lanzar un agente de voz
Operar agentes en producción
Si quieres aplicar IA en tu negocio,
Te explico qué hago y cómo trabajo: Aquí