¿Cómo se diseña una conversación para un agente de voz?

El diseño conversacional de voz define cómo escucha, responde, confirma y avanza un agente durante una llamada donde la información desaparece en cuanto se pronuncia.

Una conversación escrita puede releerse. Por teléfono, una frase larga compite con la memoria, el ruido y la necesidad de responder en tiempo real.

Copiar el texto de un chatbot suele producir agentes que hablan demasiado, acumulan preguntas e interrumpen al usuario.

Una idea por turno

Cada intervención debería realizar una función principal: reconocer lo dicho, ofrecer un dato, pedir una información o confirmar una acción.

Las opciones importantes se colocan al principio y se expresan de forma breve. Si hay varios pasos, se presentan uno a uno y se comprueba que el usuario ha terminado antes de continuar.

Reconocer, actuar y avanzar

Una estructura útil consiste en reconocer la aportación, realizar el trabajo y mover la conversación. «De acuerdo, reviso ese contrato. ¿Me confirmas el código postal?» demuestra continuidad sin repetir todo.

El reconocimiento debe ser proporcional. Añadir empatía prefabricada a cada turno vuelve la conversación lenta y artificial.

Confirmación progresiva

Los datos críticos se confirman cuando se recogen y se repiten justo antes de ejecutar la acción. Esperar al final para leer una lista larga obliga a corregir varios elementos a la vez.

Fechas, horas, direcciones, importes y referencias requieren políticas distintas. La confirmación puede apoyarse en un SMS cuando el dato resulta difícil de comunicar únicamente por voz.

Interrupciones y silencios

El agente debe detenerse cuando la persona vuelve a hablar, pero distinguir una interrupción significativa de ruido o una breve afirmación. La configuración de turnos forma parte del producto y no se resuelve sólo con el prompt.

Cuando una herramienta tarda, el silencio puede gestionarse con una indicación breve y verdadera. No conviene llenar toda espera con frases que impiden al usuario intervenir.

Reparar malentendidos

Ante un dato dudoso se pregunta por el elemento concreto, no se reinicia todo el flujo. Después de dos o tres intentos fallidos conviene cambiar de estrategia: deletreo, teclado, SMS o transferencia.

El agente necesita distinguir «no te he oído» de «no puedo realizar esa operación». La primera situación requiere reparar audio; la segunda, explicar el límite.

Leerlo en voz alta y probarlo

Los flujos se revisan escuchándolos, no sólo leyendo el prompt. Una frase que parece clara en pantalla puede resultar larga o ambigua al pronunciarse.

Las grabaciones reales muestran dónde interrumpen las personas, qué preguntas se repiten y en qué turnos abandonan. Esos puntos deben guiar las mejoras.

Personalidad y voz de un agente

Prompts para agentes de voz

Llamadas entrantes y salientes

Casos límite y escalado

Cómo probar un agente de voz

Si quieres aplicar IA en tu negocio,

Te explico qué hago y cómo trabajo: Aquí

Una idea práctica sobre IA, cada día

Recibe cada día un email con un consejo para aplicar inteligencia artificial en tu negocio sin perder tiempo ni dinero.