¿Qué significa integrar un agente de voz en tu centralita?
Integrar un agente de voz en una centralita significa conectar la telefonía de la empresa con el sistema de IA sin perder numeración, enrutamiento, transferencias ni continuidad operativa.
La voz puede llegar desde la red telefónica pública, un proveedor cloud o una centralita IP. El agente recibe y envía audio, mientras la capa de telefonía conserva el control de la llamada.
El proyecto no termina cuando el agente contesta. Debe identificar el origen, transferir correctamente, conservar contexto y comportarse de forma segura si falla cualquier componente.
SIP, números y red telefónica
SIP es el protocolo habitual para establecer y enrutar llamadas entre una centralita, un operador y una plataforma de voz. Proveedores como Twilio permiten conectar infraestructura SIP con la red telefónica pública; Vapi permite dirigir llamadas SIP hacia un asistente.
La empresa puede utilizar un número nuevo, portar o desviar uno existente, conservar su operador mediante BYOC o conectar directamente su PBX. La elección depende de la infraestructura actual, los países, la regulación y la necesidad de mantener funcionalidades existentes.
Cómo entra una llamada al agente
La centralita aplica primero reglas como horario, número marcado, cola o disponibilidad. Después envía la llamada o el audio al agente junto con metadatos que pueden incluir el número de origen, el destino o identificadores internos.
Esos datos pueden utilizarse para consultar el CRM o personalizar el saludo, pero no deben considerarse una autenticación suficiente para operaciones sensibles.
Transferencias frías y asistidas
En una transferencia fría, la llamada pasa directamente al destino. En una transferencia asistida, el sistema contacta primero con la persona o cola, comunica el contexto y después une al usuario.
El agente debe enviar un resumen y los datos recogidos para evitar que la persona repita toda la conversación. También necesita una ruta alternativa si nadie responde, el destino está cerrado o la transferencia falla.
Vapi dispone de herramientas de transferencia condicionada; Twilio soporta enrutamiento a destinos SIP y mecanismos de transferencia dentro de infraestructuras compatibles.
Audio en tiempo real y códecs
La telefonía tradicional utiliza audio con ancho de banda limitado. La plataforma debe manejar códecs, streaming, pérdida de paquetes y regiones de despliegue. Cada conversión adicional puede degradar calidad o añadir latencia.
Twilio Media Streams permite enviar y recibir audio de una llamada mediante WebSocket. En una integración SIP, el audio puede fluir directamente entre extremos compatibles. La arquitectura elegida condiciona control, complejidad y tiempo de respuesta.
Qué ocurre cuando algo falla
Hay que definir qué sucede si la IA, el proveedor de voz, una herramienta o la conexión SIP dejan de responder. Las opciones incluyen desviar a una cola humana, reproducir un mensaje breve, tomar un recado o utilizar un proveedor secundario.
El sistema no debe anunciar una transferencia antes de saber que puede completarla. Los fallos de telefonía producen silencio o desconexiones especialmente frustrantes y necesitan monitorización separada del comportamiento del modelo.
Cómo se despliega sin arriesgar la operación
Conviene empezar con un número o una ruta de bajo riesgo, registrar eventos y comparar llamadas reales antes de ampliar horarios y casos. Las pruebas deben incluir transferencias, llamadas simultáneas, cortes, ruido, DTMF y destinos no disponibles.
La puesta en producción también requiere decidir grabación, avisos, conservación de audio, acceso a transcripciones y responsabilidades entre el operador, la plataforma y la empresa.
Voicebot o robot de voz
Asistente telefónico con IA
Contratos de herramientas en voz
Casos límite y escalado
Cómo lanzar un agente de voz
Si quieres aplicar IA en tu negocio,
Te explico qué hago y cómo trabajo: Aquí