¿Qué métricas importan en un agente de voz?
Las métricas de un agente de voz deben demostrar si la llamada produjo el resultado esperado, si lo hizo con calidad y si el sistema puede sostenerlo en producción.
Medir sólo duración, minutos automatizados o llamadas atendidas crea una visión pobre. Un agente puede hablar mucho, consumir poco y aun así dejar trabajo sin resolver.
La medición útil combina negocio, conversación, tecnología y operación.
Resolución real
La métrica principal debe mirar fuera de la transcripción. Una cita existe en la agenda, una incidencia queda registrada, un dato se actualiza, una transferencia llega con resumen o una consulta se resuelve sin repetición posterior.
La resolución declarada por el agente no basta. Hay que contrastarla con la fuente de verdad del proceso.
Transferencia útil
No toda transferencia es fracaso. Puede ser la acción correcta si el agente detecta riesgo, ambigüedad, emoción alta o falta de permisos.
Lo importante es medir si la transferencia llegó al destino correcto, con datos recogidos, motivo claro y sin obligar a la persona a empezar de cero.
Abandono y repetición
El abandono señala frustración, espera, mala recuperación de errores o falta de confianza. La repetición posterior muestra falsos éxitos: llamadas que parecían resueltas pero vuelven al sistema.
Ambas métricas deben segmentarse por intención, horario, idioma, herramienta usada y versión del agente.
Calidad conversacional
La conversación se evalúa por turnos claros, interrupciones manejadas, confirmación de datos críticos, ausencia de bucles, tono adecuado y capacidad de explicar límites.
Parte puede automatizarse con análisis de transcripciones, pero las muestras humanas siguen siendo necesarias para detectar incomodidades que el panel no captura.
Estabilidad técnica y coste por resultado
La latencia, los errores de herramientas, los timeouts, las caídas de proveedor y los problemas de telefonía deben medirse por separado. Un fallo de API no es lo mismo que una mala respuesta del modelo.
El coste por resultado pesa más que el coste por minuto. Una llamada barata que no resuelve puede salir más cara que una conversación algo más larga que evita trabajo posterior.
Segmentar antes de comparar
Las medias globales ocultan casi todo. Una misma métrica puede comportarse distinto por intención, idioma, horario, ruta telefónica, versión del prompt o herramienta utilizada.
Sin segmentación, el equipo puede corregir el agente equivocado: cambiar la conversación cuando el problema era una API lenta, o tocar una integración cuando el fallo estaba en el diseño del turno.
Coste por resultado en IA
Línea base en IA
Abandono de llamada
Analítica conversacional de voz
Latencia en agentes de voz
Operar agentes de voz en producción
ROI de la IA
Si quieres aplicar IA en tu negocio,
Te explico qué hago y cómo trabajo: Aquí