Explorando la experiencia de usuario para agentes de IA: interfaces de chat


Ted Hisokawa
27 de julio de 2024 04:20

El blog LangChain profundiza en los desafíos de UX de los agentes de IA, centrándose en las interfaces de chat en una serie de varias partes.



Explorando la experiencia de usuario para agentes de IA: interfaces de chat

En la conferencia AI Ascent de Sequoia en marzo, el blog LangChain destacó tres limitaciones importantes para los agentes de IA: programación, experiencia del usuario y memoria. El blog ahora se ha embarcado en una exploración detallada de estos temas, comenzando con la experiencia del usuario (UX) para los agentes, con un enfoque particular en las interfaces de chat. Esta discusión en profundidad se divide en tres partes, la primera parte dedicada al chat, gracias a las reflexiones de Nuno Campos, ingeniero fundador de LangChain.

Chat en vivo

La experiencia del usuario del “chat en streaming” se ha convertido en el modelo de interacción más dominante para los agentes de IA. Este formato, ilustrado por ChatGPTtransmite los pensamientos y acciones de un agente en tiempo real. A pesar de su aparente sencillez, el chat en streaming ofrece varias ventajas.

En primer lugar, facilita la interacción directa con el modelo de lenguaje (LLM) a través del lenguaje natural, eliminando así barreras entre el usuario y el LLM. Esta interacción es similar a las primeras terminales de computadora, que proporcionaban acceso directo y de bajo nivel al sistema subyacente. Con el tiempo, pueden desarrollarse paradigmas de UX más sofisticados, pero el acceso de bajo nivel que proporciona el chat en tiempo real es beneficioso, especialmente en las primeras etapas.

El chat en streaming también permite a los usuarios observar acciones intermedias y procesos de pensamiento del LLM, mejorando la transparencia y la comprensión. Además, proporciona una interfaz natural para corregir y guiar el LLM, aprovechando la familiaridad de los usuarios con las conversaciones iterativas.

Sin embargo, el chat en tiempo real tiene desventajas. Las plataformas de chat existentes como iMessage y Slack no admiten la transmisión de chat de forma nativa, lo que dificulta la integración. Esto también puede resultar molesto para tareas de larga duración, ya que es posible que los usuarios no quieran esperar y ver trabajar al agente. Además, el chat en streaming suele requerir iniciación humana, lo que mantiene al usuario informado.

Discusión sin streaming

El chat sin streaming, aunque aparentemente obsoleto, comparte muchas características con el chat en streaming. Permite la interacción directa con el LLM y facilita las correcciones naturales. La principal diferencia es que las respuestas se reciben en lotes completos, lo que permite que los usuarios no sean notificados de los procesos en curso.

Esta opacidad requiere confianza pero permite delegar tareas sin microgestión, como señala Linus Lee. También es más adecuado para tareas de larga duración, ya que los usuarios no esperan respuestas inmediatas, de acuerdo con los estándares de comunicación establecidos.

Sin embargo, el chat sin transmisión puede generar problemas como “mensajes de texto dobles”, donde los usuarios envían mensajes nuevos antes de que el agente haya completado su tarea. A pesar de esto, se adapta de manera más natural a los flujos de trabajo existentes porque las personas están acostumbradas a enviar mensajes de texto y pueden adaptarse fácilmente a ellos mediante la IA.

¿Hay algo más que un simple gato?

Esta publicación de blog es la primera de una serie de tres partes, que indica que existen otros paradigmas de UX para explorar más allá del chat. Si bien el chat sigue siendo una experiencia de usuario muy eficaz debido a su interacción directa y su facilidad para hacer preguntas o corregir errores, pueden surgir otros paradigmas a medida que el campo evolucione.

En conclusión, tanto las conversaciones en streaming como las que no lo son presentan beneficios y desafíos únicos. La conversación transmitida proporciona transparencia e inmediatez, mientras que la conversación no transmitida se alinea con los patrones de comunicación naturales y admite tareas más largas. A medida que los agentes de IA continúen desarrollándose, los paradigmas de UX para interactuar con ellos probablemente se expandirán y diversificarán.

Para obtener información más detallada, visite la publicación original en Blog de Langchain.

Fuente de la imagen: Shutterstock