
Microsoft está apostando fuerte por la inteligencia artificial de ChatGPT; sin embargo, es capaz de imitar tu voz tras escucharte unos segundos.
ESTADOS UNIDOS.- Hace unos años el mundo era uno de los CRIPTOMONEDAS; el año 2022 fues fichas no fungibles; y hoy, sin duda, se perfila como el año de la inteligencias artificiales y la realización del metaverso.
Teniendo esto en cuenta, Microsoft apuesta fuerte por la inteligencia artificial de GPT-3, que está diseñado por IA abierta para varias de sus aplicaciones y servicios, que van desde bing o World. Sin embargo, también aseguraron que están desarrollando sus propios modelos.
El plan de Microsoft para implementar ChatGPT dentro de sus soluciones continúa; y, durante el primer semestre de este 2023 llegará a Bing, además de haber información sobre las implementaciones que tendrá dentro de la suite de Office; Además de una nueva inteligencia artificial.
Conoce Vall-E: La inteligencia artificial que imita voces.
Vall-E, yEn concreto, es un modelo de lenguaje para la síntesis de texto a voz (TTS) Se basa en EnCodec, un códec de audio de Meta similar a otras inteligencias artificiales que te permite generar audio a través de una breve descripción de texto.
Si bien es cierto que la propia Microsoft tiene uno similar: el Texto a voz, que te permite convertir texto en voz sintetizada, la diferencia es que Vall-E es capaz de analizar la voz de una persona para luego interpretar cómo sonaría esa voz con diferentes frases.
Una peculiaridad: conserva la entonación y la emoción del orador, afirma la compañía, y puede lograr excelentes resultados con solo tres segundos de voz.
Específicamente, entrenamos un modelo de lenguaje de códec neuronal (llamado Vall-E) utilizando códigos discretos derivados de un modelo de códec de audio neuronal estándar, y consideramos TTS como una tarea de modelado de lenguaje condicional en lugar de una regresión de señal continua como en trabajos anteriores “, dice el comunicado. .
En otras palabras, ChatGPT en sí mismo podría entregar resultados de voz una vez; y una vez integrado este modelo. A “Imita la voz del niño en el camino”, Sería posible, siempre que se haya realizado la formación previa.
El objetivo de este, tal y como se explica en un artículo de Hipertextual, es poder crear discursos de voz a través de una introducción de texto; sin embargo, esto trae consigo diferentes inconvenientes ya que, en el caso de que Vall-E esté disponible al público, muchos podrían utilizarlo para suplantar la identidad de las personas.
TE PUEDE INTERESAR: Así se verían los países del mundo si fueran villanos según inteligencia artificial
HoyCripto, es sitio un web dedicado a compartir lo último en noticias e información relacionada con criptomonedas, NFTs y Metaverso en general.
