lun. Abr 27th, 2026

Microsoft está apostando fuerte por la inteligencia artificial de ChatGPT; sin embargo, es capaz de imitar tu voz tras escucharte unos segundos.

ESTADOS UNIDOS.- Hace unos años el mundo era uno de los CRIPTOMONEDAS; el año 2022 fues fichas no fungibles; y hoy, sin duda, se perfila como el año de la inteligencias artificiales y la realización del metaverso.

Teniendo esto en cuenta, Microsoft apuesta fuerte por la inteligencia artificial de GPT-3, que está diseñado por IA abierta para varias de sus aplicaciones y servicios, que van desde bing o World. Sin embargo, también aseguraron que están desarrollando sus propios modelos.

El plan de Microsoft para implementar ChatGPT dentro de sus soluciones continúa; y, durante el primer semestre de este 2023 llegará a Bing, además de haber información sobre las implementaciones que tendrá dentro de la suite de Office; Además de una nueva inteligencia artificial.

Conoce Vall-E: La inteligencia artificial que imita voces.

Vall-E, yEn concreto, es un modelo de lenguaje para la síntesis de texto a voz (TTS) Se basa en EnCodec, un códec de audio de Meta similar a otras inteligencias artificiales que te permite generar audio a través de una breve descripción de texto.

Si bien es cierto que la propia Microsoft tiene uno similar: el Texto a voz, que te permite convertir texto en voz sintetizada, la diferencia es que Vall-E es capaz de analizar la voz de una persona para luego interpretar cómo sonaría esa voz con diferentes frases.

Una peculiaridad: conserva la entonación y la emoción del orador, afirma la compañía, y puede lograr excelentes resultados con solo tres segundos de voz.

Específicamente, entrenamos un modelo de lenguaje de códec neuronal (llamado Vall-E) utilizando códigos discretos derivados de un modelo de códec de audio neuronal estándar, y consideramos TTS como una tarea de modelado de lenguaje condicional en lugar de una regresión de señal continua como en trabajos anteriores “, dice el comunicado. .

En otras palabras, ChatGPT en sí mismo podría entregar resultados de voz una vez; y una vez integrado este modelo. A “Imita la voz del niño en el camino”, Sería posible, siempre que se haya realizado la formación previa.

El objetivo de este, tal y como se explica en un artículo de Hipertextual, es poder crear discursos de voz a través de una introducción de texto; sin embargo, esto trae consigo diferentes inconvenientes ya que, en el caso de que Vall-E esté disponible al público, muchos podrían utilizarlo para suplantar la identidad de las personas.

TE PUEDE INTERESAR: Así se verían los países del mundo si fueran villanos según inteligencia artificial

Leer la nota Completa

Hoy Cripto

By Hoy Cripto

HoyCripto, es sitio un web dedicado a compartir lo último en noticias e información relacionada con criptomonedas, NFTs y Metaverso en general.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *