
NUEVA YORK.- La empresa OpenAI, responsable del desarrollo del chatbot con inteligencia artificial generativa conocido como ChatGPT, anunció hoy una última versión de su popular herramienta que ahora cuenta con la capacidad de “ver, oír y hablar” en voz alta con los usuarios.
Hasta ahora, la interacción con las distintas ediciones de ChatGPT se limitaba a la comunicación escrita, sin embargo, los usuarios que tengan una suscripción paga podrán, en “dos semanas”, mantener conversaciones habladas con la máquina, además de recibir respuestas orales. También tendrán la posibilidad de enviar imágenes, fotografías, capturas de pantalla y documentos al chat para obtener respuestas específicas.
En cuanto a los usuarios que utilicen la versión gratuita de esta herramienta, podrán disfrutar de estos nuevas actualizaciones “poco después”según lo informado por OpenAI.
La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. “Cuando estés en casa, toma fotografías de tu refrigerador y despensa para ver qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, señala la compañía en un comunicado.
Te puede interesar: ChatGPT te da recomendaciones para mantener tu computadora
Si bien para ejemplificar cómo se puede utilizar la herramienta de voz, la empresa dice que se puede utilizar para “contar una historia o resolver un debate“.
Por ahora, este asistente de voz -similar a Alexa de Amazon y Siri de Apple- estará disponible para iOS y Androidpero no en la PC.
Tecnología de voz
Puedes elegir entre cinco voces diferentesaunque la voz que viene por defecto y la que apareció en los ejemplos de hoy es una voz que imita la de un mujer joven y aparentemente blancacomo es habitual en este tipo de herramientas.
A través de Whisper, una herramienta OpenAI que utiliza IA para transcribir audio, convertir la voz del usuario a textoLuego, la empresa utiliza su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.
Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y proporciona herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, advierte la empresa.
OpenAI también anunció hoy que la plataforma de música Spotify está utilizando el “poder de esta tecnología para traducir algunos de tus podcasts a “idiomas adicionales, pero manteniendo las voces propias de los presentadores e invitados”.
EL IMPARCIAL, ahora en su versión en web online, es el periódico líder al Noroeste de México y en Sonora, con una cobertura informativa oportuna y veraz en materia de noticias de actualidad y relevantes.
