Gracias por registrarte !

Accede a tus temas favoritos en un feed personalizado mientras estás en movimiento. descarga la aplicación

En la carrera de la inteligencia artificial, Google anunció que desarrolló un bot que crea música basada en indicaciones de texto, pero no espere poder usarlo en el corto plazo.

En un artículo de investigación publicado el jueves, los investigadores de Google describieron a MusicLM como « un modelo que genera música de alta fidelidad a partir de descripciones de texto como ‘una relajante melodía de violín respaldada por un riff de guitarra distorsionado' ».

« Demostramos que MusicLM se puede condicionar tanto en texto como en melodía, ya que puede transformar melodías silbadas y tarareadas de acuerdo con el estilo descrito en una leyenda de texto », se lee en el documento.

Según el estudio, los usuarios pueden ingresar descripciones como « canción de jazz encantadora con un solo de saxofón memorable y un cantante solista » o « techno de los 90 de Berlín con un bajo bajo y una patada fuerte », y recibir los resultados correspondientes. Ejemplos similares, compartidos en la página Github de Google, muestran el audio correspondiente a dichas indicaciones.

El debut de MusicLM se produce durante el ascenso meteórico del bullicioso chatbot ChatGPT de OpenAI, que llevó a Google a emitir un « código rojo », lo que The New York Times describió en diciembre como « similar a activar la alarma de incendios » para el gigante tecnológico.

Aún así, Google dijo que no tiene la intención de lanzar MusicLM al público, citando una variedad de riesgos que incluyen sesgos de programación que pueden conducir a la falta de representación y apropiación cultural, fallas tecnológicas y, en particular, « la posible apropiación indebida de contenido creativo ».

Según el estudio, se encontraron canciones existentes identificables en aproximadamente el 1% de los ejemplos, lo que apunta a una posible infracción de derechos de autor.

« Hacemos hincapié en la necesidad de más trabajo futuro para abordar estos riesgos asociados con la generación de música; no tenemos planes de lanzar modelos en este momento », afirma el estudio.

El estudio también señala las limitaciones existentes de la tecnología, incluido el uso de negaciones y el ordenamiento temporal en las indicaciones de texto, así como la calidad vocal. De cara al futuro, los investigadores dijeron que tienen la intención de trabajar hacia el « modelado de la estructura de canciones de alto nivel como la introducción, el verso y el coro ».