Gracias por registrarte !
Accede a tus temas favoritos en un feed personalizado mientras estás en movimiento. descarga la aplicación
Microsoft, que tiene planes de invertir $10 mil millones en ChatGPT, está trabajando en una inteligencia artificial llamada VALL-E que puede clonar la voz de alguien a partir de un clip de audio de tres segundos.
VALL-E, entrenado con 60,000 horas de habla en inglés, es capaz de imitar una voz en « escenarios de tiro cero », lo que significa que la herramienta de IA puede hacer que una voz diga palabras que nunca antes había escuchado decir, según un artículo publicado. por la Universidad de Cornell en el que los desarrolladores presentaron la herramienta.
VALL-E utiliza tecnología de texto a voz para convertir palabras escritas en palabras habladas en discursos « personalizados de alta calidad », según el documento de 16 páginas.
Usó grabaciones de más de 7000 oradores reales de LibriLight, un conjunto de datos de audiolibros compuesto por textos de dominio público leídos por voluntarios, para realizar su muestreo. El gigante tecnológico lanzó muestras de cómo funcionaría VALL-E, mostrando cómo se clona la voz de un hablante.
La herramienta de IA no está actualmente disponible para uso público y Microsoft no ha dejado en claro cuál es su propósito previsto.
Los investigadores dijeron que los resultados hasta ahora mostraron que VALL-E « supera significativamente » a los sistemas más avanzados de su tipo, « en términos de naturalidad del habla y similitud del hablante ».
Pero señalaron la falta de diversidad de acentos entre los hablantes y que algunas palabras en el discurso sintetizado eran « poco claras, perdidas o duplicadas ».
También incluyeron una advertencia ética sobre VALL-E y sus riesgos, diciendo que la herramienta podría usarse indebidamente, por ejemplo, para « falsificar la identificación de voz o hacerse pasar por un hablante específico ».
« Para mitigar tales riesgos, es posible construir un modelo de detección para discriminar si un clip de audio fue sintetizado por VALL-E », escribieron los desarrolladores en el documento. No dieron detalles de cómo se podría hacer esto.
Agregaron que « si el modelo se generaliza a hablantes invisibles en el mundo real, debe incluir un protocolo para garantizar que el hablante apruebe el uso de su voz ».
Mientras tanto, Microsoft anunció el lunes que pondrá ChatGPT de OpenAI a disposición de sus propios servicios después de anunciar su interés en invertir $ 10 mil millones en la herramienta de escritura de IA.
Si bien ChatGPT ha inspirado la creatividad, como la de un hombre que escribió un libro para niños en un fin de semana, ha generado inquietudes sobre si la herramienta puede ser confiable.