La inteligencia artificial sigue avanzando y muestra de ello es que ChaGPT, una herramienta que revolucionó desde sus inicios, recibirá una nueva actualización que incluye la posibilidad de ver, oír y escuchar
¡Así como lo lees! De acuerdo con OpenAI, la empresa responsable de este chatbot elaborado con inteligencia artificial degenerativa, la potente herramienta será capaz de interactuar directamente con los usuarios.
De esta forma, además de escribir y leer preguntas tendrás la oportunidad de mantener una conversación oral con este instrumento de la tecnología. Es decir, podrás hacer sugerencias, dar órdenes y subir imágenes para que la solución proporcione información a partir de ellas.
Es importante destacar que la actualización fue anunciada por OpenAI poco después de que se conociera que DALL-E 3 se integrará a la herramienta. Recordemos que DALL-E 3 pertenece a los responsables de ChatGPT y estará presente en ChatGPT Plus y Enterprise a partir del próximo mes.
“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, explicó la compañía en un comunicado según reseñó EFE.

En primera instancia, este asistente de voz -que es similar a Alexa, de Amazon, y a Siri, de Apple,- estará disponible para iOS y Android, pero no en PC.
Indicaron que se podrán elegir entre cinco voces distintas, aunque la voz que viene por defecto y la que salía en los ejemplos de hoy es una voz que imita a la de una mujer joven y aparentemente blanca, como suele ser habitual en este tipo de herramientas.
Mediante Whisper -herramienta de OpenAI que usa la IA para trascribir audio- se convierte la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.
“Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, sostuvieron.
Por ahora, es probable que en dos semanas más los usuarios de la versión paga de ChatGPT exploren las nuevas características, en tanto que las personas que usan la versión gratuita deberán esperar un poco más puesto que todavía no cuenta con fecha de llegada.