Ir al contenido
_
_
_
_

ChatGPT integra del Modo de voz en el chat: hablar con la IA será más sencillo

Una actualización tanto de la versión web como en la aplicación del conocido chatbot de OpenAI fusiona las conversaciones avanzadas con los chats tradicionales. Y es una muy buena noticia.

Logotipo de ChatGPT con fondo gris

La interacción con las inteligencias artificiales vive una metamorfosis constante. Si hace apenas un año sorprendía la capacidad de generación de texto, hoy otras de las batallas se libran en el terreno de la fluidez y la naturalidad. OpenAI acaba de dar un paso decisivo para eliminar las barreras entre el usuario y la máquina: la aplicación móvil de ChatGPT y su versión web están recibiendo una actualización sumamente práctica que integra su Modo de Voz directamente dentro del chat convencional.

Esto supone un gran cambio en la usabilidad de la herramienta. Significa que, como usuarios, ya no se tendrá que acceder a la pantalla separada dominada por el famoso orbe azul. Ahora, el acceso al Modo de Voz se realiza dentro del propio hilo de conversación, unificando por fin la experiencia textual y auditiva en un solo flujo de trabajo.

La convergencia es un gran avance para ChatGPT

Hasta hace poco, utilizar la voz con ChatGPT implicaba un cambio de contexto en el uso. Al pulsar el icono de los auriculares, la aplicación nos transportaba a una interfaz dedicada exclusivamente al audio. Si bien era inmersiva, esta separación generaba una fricción si queríamos consultar algo visual o revisar lo que se había dicho anteriormente.

Esto cambia para ofrecer una experiencia de usuario mucho más cohesiva. Al utilizar esta versión actualizada del servicio, el Modo de Voz de ChatGPT mostrará una transcripción en vivo mientras conversas con la IA. De esta forma, se puede ver cómo tus palabras y las respuestas de la máquina se ejecutan en tiempo real en la pantalla, sin perder de vista el historial del chat.

Esta integración tiene una ventaja enorme: la capacidad multimodal. La inteligencia artificial, además de transcribir la conversación, será capaz de mostrar información visual relacionada sin obligar a abandonar la ventana de chat -o salir del modo de voz-. Es decir, que se podrán visualizar mapas, consultar el estado del tiempo y acceder a otros datos gráficos en tiempo real mientras la conversación está visible y activa. Esta es la gran promesa de esta actualización.

Conversaciones más libres y naturales

El objetivo final de estas mejoras es reducir los tiempos de uso y, especialmente, los de espera -permitiendo para ello a los usuarios participar en conversaciones de manos libres con la IA que se sientan genuinamente humanas-. En este sentido, la actualización de ChatGPT busca emular y competir directamente con Gemini Live de Google, que también ha puesto el foco en la interacción verbal fluida.

Es importante destacar que existen dos versiones del Modo de Voz de ChatGPT, y la experiencia puede variar ligeramente dependiendo de cuál estés utilizando. Por un lado, está la versión estándar, disponible para todos los usuarios, que utiliza modelos de reconocimiento de voz y síntesis más tradicionales. Por otro lado, se encuentra el Modo de Voz Avanzado, reservado para los usuarios de pago (esta aprovecha las capacidades nativas de audio del modelo GPT-4o).

Personalización para el usuario y disponibilidad

A pesar de que la tendencia es hacia la unificación de interfaces, OpenAI es consciente de que los cambios de diseño no siempre son del agrado de todos los usuarios de inmediato. Así, para aquellos puristas que prefieren la inmersión total de la pantalla de audio y no quieren ver la transcripción o el chat mientras hablan, existe una solución: si prefieres utilizar el Modo de Voz sobre la integración de chat que ChatGPT ofrece ahora, puedes habilitar el Modo separado (Separate mode) dentro de los ajustes de la aplicación. Específicamente, debes dirigirte a Configuración y buscar la sección de Modo de Voz.

En lo que tiene que ver con la disponibilidad, hay que decir que esta actualización está desplegándose de manera progresiva, como suele ser habitual en las mejoras de software de este calibre. Lo que comenzamos viendo en análisis de código (los conocidos como APK teardowns) se está materializando ahora en los dispositivos de los usuarios.

Rellena tu nombre y apellido para comentarcompletar datos

Más información

Archivado En

_
_