Inteligencia artificial parlante de Microsoft es capaz de imitar una voz al escucharla solo 3 segundos
VALL-E puede conservar el tono emocional del hablante original e incluso simular su entorno acústico.
VALL-E puede conservar el tono emocional del hablante original e incluso simular su entorno acústico.