Los 5 niveles de las conversaciones IA

Por: Darío Iván Rosas Miranda,  Praxis, Inteligencia Artificial México

Resumen

La tecnología ha ido avanzando de manera acelerada en los últimos años, creando un nuevo problema con la necesidad de adaptarse a estos cambios y a las continuas actualizaciones de los sistemas informáticos. Este cambio propicia una brecha que impide que las personas se acerquen a las nuevas tecnologías y sistemas informáticos. Por otro lado, si pudiéramos usar la tecnología de la misma manera en la que interactuamos con otros humanos, se podría construir un software que sirva enormemente a muchas más personas.

En este trabajo se presenta el acercamiento para disminuir esta brecha en las conversaciones con inteligencia artificial (IA), desde el punto de vista del usuario final hasta el de desarrollo.   

 

Introducción

Hacer que cualquier persona se acerque al uso de conversaciones de inteligencia artificial (IA) es complicado, y aún no se ha alcanzado un nivel suficiente que permita un uso general de éstas. También es importante impulsar que diversos tipos de personas creen este tipo de aplicaciones. Existen millones de usos importantes para esta tecnología que las grandes compañías nunca se atreverán a desarrollar, y la única manera de que éstas sucedan es a través de un “momentum” de desarrollo masivo.

Entre algunas aplicaciones que se han desarrollado en conversaciones de inteligencia artificial, podemos encontrar a “Alex, the Alpaca chatbot”.

Alex es un agente de estado real virtual que permite a los usuarios encontrar departamento basado en sus preferencias. El chatbot filtra cientos de listas de departamentos y ayuda al usuario a solicitar citas de visita, tanto remotas como presenciales.  Actualmente, Alpaca puede ayudar a encontrar hogar en las ciudades de Nueva York, Boston y San Francisco.

En la época de COVID, la falta de conocimiento ante un nuevo virus genera muchas oleadas de desinformación. Y una forma de combatir esta desinformación es a través de chatbots como el creado por TransPerfect DataForce, el cual se dio a la tarea de recopilar datos para así poder construir un chatbot capaz de contestar preguntas acerca del COVID en diferentes idiomas.

Otra aplicación de conversaciones de inteligencia artificial es el presentado por el banco N26 en Europa conocido como “Neon”. El banco se encontraba en la necesidad de escalar su servicio al cliente, para ello crearon un chatbot capaz de atender el 30% de los clientes en un horario 24/7. Actualmente el chatbot puede atender en 5 idiomas diferentes y se encuentra disponible tanto en formato móvil como en aplicación web, siendo capaz de resolver tareas complejas como generar reportes de tarjetas pérdidas o robadas.

En la siguiente sección se describe la clasificación de acercamientos para las conversaciones IA, tanto de la vista del usuario final como del desarrollador. Buscando crear una homologación de aplicaciones conversacionales que permitan la creación de herramientas y abstracciones para facilitar el desarrollo de éstas.

 

Desarrollo

Para que los asistentes virtuales inteligentes trabajen para todos, es necesario mejorar drásticamente la experiencia, tanto del desarrollador como del usuario final.

 

La Perspectiva del Usuario Final

A medida que se avance por los cinco niveles, los asistentes virtuales se comportarán más a la forma en que los humanos piensan y sentirse menos que son como una API.

En cada nivel, se reduce la carga del usuario final para traducir lo que se requiere del idioma del negocio.

Tomemos, por ejemplo, el caso de una persona que requiere conocer una cotización de una hipoteca. En cada nivel, se reduce la responsabilidad del usuario final para dar a entender lo que busca (en este caso un nuevo lugar para vivir) en el lenguaje del banco (una cotización para una hipoteca de tasa fija a 30 años).

Los asistentes de nivel 1 ponen todo el trabajo de lado del usuario final. Las páginas web estáticas son un ejemplo de esto. Los sistemas informáticos que calculan automáticamente las hipotecas es otro ejemplo, donde los usuarios deben colocar sus datos de manera exacta en cada uno de los campos. Aunque no es la mejor manera de resolver el problema, es mejor que hacer cálculos de manera manual.

Los asistentes de nivel 2, son chatbots básicos. Si el usuario dice algo similar a “Estoy interesado en las tasas de hipotecas”, el chatbot realizará una serie de preguntas, reuniendo la misma información que se le daría a un sistema de nivel 1. La parte complicada de los chatbots de este nivel surge cuando le usuario se sale del “happy path”.

Los asistentes contextuales son el nivel 3. El usuario puede preguntar por aclaraciones: “¿Cómo se compara ese pago mensual con el alquiler?”, “¿Cuánto tiempo les toma a las personas pagar todo eso?” Pueden hacerse correcciones así mismos o cambiar de opinión sin necesidad de reiniciar la conversación. El usuario sigue teniendo claro cuál es su meta (“Quiero una cotización de hipoteca”) pero no tiene que preocuparse más de saber cómo usar el asistente con miedo de “romper” la conversación.

Los asistentes de consultoría son el nivel 4. El usuario puede expresar su situación en sus propios términos: “Mis niños se han ido de la casa y ahora busco algo más pequeño”. Una oferta de hipoteca puede ser el resultado final de la conversación, pero el usuario no lo sabe. Como desarrollador, uno puede pensar que es una entrada ambigua pero lo que ha dicho el usuario es claro, y, por lo tanto, es trabajo del asistente determinar cómo puede ayudar.

Los asistentes adaptativos son el nivel 5. Los asistentes de este nivel pueden extraer a nivel de detalle lo que el usuario está buscando en ese momento. Tal vez sólo se está buscando conocer la tasa de interés que dijo en ese momento, o tal vez calcular a detalle una oferta, o quizá se tenga una duda en específico. Los asistentes de nivel 5 pueden recoger pistas y ajustar su comportamiento.

En cada nivel, se quita la responsabilidad al usuario final y se traslada al asistente virtual. Aquí es donde exactamente se encuentra el valor de la conversación IA. Pero para hacerlo realidad es necesario que los desarrolladores tengan las herramientas necesarias para empujar los límites de lo posible.

 

La Perspectiva del Desarrollador

Existen dos puntos principales que afectan la experiencia del desarrollador. La primera es que los usuarios finales son los que nos dicen qué es lo que realmente necesitan.

En otros tipos de software, se realiza un seguimiento de que es lo que hace las personas, donde hacen clic y se trata de adivinar qué es lo que el usuario necesita. Pero la información para crear conversaciones IA de nivel 5, ya se encuentran ahí donde los usuarios nos dicen exactamente qué es lo que necesitan. Sólo se requieren las herramientas necesarias para aprender de conversaciones reales y dar con la solución.

Lo segundo es que no es solo el desarrollador quien impulsa al asistente a evolucionar. Dado que el usuario final puede decir lo que sea, los usuarios pueden cambiar el comportamiento de los asistentes virtuales al cambiar su propio comportamiento. Por lo tanto, para obtener un asistente de nivel 5, de la perspectiva del desarrollador, no es un camino recto, más bien es un rol evolutivo.

Crear conversaciones IA que se asemejen a las conversaciones humanas no es tarea fácil. Pasar de asistentes de nivel 2 a 3, se cambia la carga del usuario final al asistente. Por lo tanto, no se puede forzar al usuario final a pensar cómo se desarrolló la solución final; lo que aumenta la complejidad de cómo se construyen los asistentes de nivel 3 o mayor.

En el nivel 1, es fácil para el desarrollador generar nuevas funciones. Se puede lanzar nuevas versiones desde la línea de comandos agregando la documentación adecuada.  Se ha divido el problema en componentes separados, y se han definido reglas de su comportamiento en su conjunto.

En el nivel 2, se vuelve más complicado agregar una nueva funcionalidad mientras el asistente sigue evolucionando. Los asistentes de nivel 2 son construidos con un número de intenciones fijas y un número fijo de frases que describen como debe responder el asistente en diferentes contextos. Cuando se agregan nuevas funciones al asistente, se tiene que pensar cómo estos nuevos datos puedan afectar a lo ya desarrollado.

En el nivel 3, se empieza a observar que los usuarios se comportan de diferente manera a la esperada. Por lo tanto, se usa la información de las conversaciones obtenidas para enseñarle al asistente cómo hablar. En otras palabras, se pone en práctica el “desarrollo impulsado por la conversación” CDD (Conversation-Driven Development).

En el nivel 4, se automatiza los procesos CDD. Encontrar automáticamente las conversaciones que fueron satisfactorias, y cuales fallaron. Cuando los asistentes ganan la habilidad de juzgar si una conversación fue exitosa o no, se puede automatizar la extracción de nuevos datos y mostrar al desarrollador en dónde se deben hacer mejoras.

En el nivel 5, los procesos CDD están completamente automatizados. Para agregar nuevas funciones al asistente, se provee la lógica de negocios para completar el trabajo, y con pocas conversaciones de práctica el asistente debe ser capaz de aprender la nueva tarea.

En Praxis se crean y desarrollan chatbots nivel 3, y se acompaña al cliente a lo largo del camino CDD hasta alcanzar el nivel 5 de asistentes virtuales dado que se cuentan con las herramientas  necesarias para alcanzar este nivel.

 

Conclusión

Podemos observar que el rol de desarrollador evoluciona en cuanto se pasa del nivel 2 a los niveles 3, 4 y 5. En lugar de pelearse con casos extremos agregando más lógica en  el  nivel micro, se tiene que construir   un sistema que maneje las decisiones a pequeña escala por sí sólo.

 

Referencias

 

Autor

Daniel Demanos Romero, Gerente de Inteligencia Artificial
Tel. 55 5080 0048
d.demanos@praxisglobe.com
LinkedIn: Daniel Damanos

 

Descargar whitepaper

Actividades Asociados

Eventos AMITI

10 Dic
De 8:00 am
a 12:00 pm

Superando los desafíos – Evento de fin de año AMITI