Meta lanza una nueva IA gratuita para convertir textos y melodías en canciones
La compañía ha liberado su trabajo mediante código abierto
En el vertiginoso mundo de los modelos de Inteligencia Artificial, MusicGen ha llegado para revolucionar la forma en que creamos y generamos música. Al igual que los modelos de lenguaje predicen los próximos caracteres en una frase, este desarrollo -con la ayuda de Meta- predice la siguiente sección en una pieza musical, abriendo así un sinfín de posibilidades creativas.
El equipo de investigadores detrás de MusicGen ha utilizado la tecnología de codificación de audio EnCodec de Meta para descomponer los datos de audio en componentes más pequeños. Hecho esto, y gracias a su arquitectura de un solo paso que procesa tokens en paralelo, la herramienta ofrece resultados que destacan por su rapidez y eficacia.
Un entrenamiento que es sinónimo de éxito
No se han escatimado esfuerzos por parte de Meta en el entrenamiento de este innovador desarrollo, ya que se utilizaron más de 20.000 horas de música con licencia para generar una base de datos adecuada. El conjunto de datos interno contaba con 10.000 pistas musicales de alta calidad, mientras que también se han incluido datos musicales de renombradas plataformas como Shutterstock y Pond5. Este enfoque diverso y exhaustivo en la selección de datos ha permitido a MusicGen alcanzar un nivel de sofisticación excelente.
Una de las características más destacables de la plataforma es su capacidad para manejar tanto texto como melodías cortas. Mediante el uso de un texto como guía, se logra fusionar el estilo propuesto con ambas informaciones para obtener un archivo de audio, dando lugar a composiciones únicas y personalizadas. Esta capacidad para adaptarse y fusionar es prácticamente única.
Puedes probar el uso de la IA de Meta
En pruebas se han evaluado tres versiones del modelo MusicGen con diferentes tamaños de parámetros: 300 millones (300M), 1,5 mil millones (1,5B) y 3.3 mil millones (3,3B). Los resultados del trabajo de Meta mostraron que los modelos más grandes producían una calidad de audio superior, pero curiosamente el modelo intermedio en elementos utilizados fue considerado el mejor por los evaluadores humanos.
Meta ha lanzado el código como software de código abierto en Github, permitiendo así su acceso y uso por parte de la comunidad de desarrolladores. Esta decisión demuestra su compromiso con la colaboración y la innovación abierta en el ámbito de la Inteligencia Artificial. Además, Meta ha permitido el uso comercial de su tecnología, lo que brinda oportunidades para que las empresas e individuos aprovechen las capacidades de MusicGen en sus proyectos (un ejemplo es esta web) y productos. Esta apertura hacia el uso comercial demuestra la visión de la compañía propietaria de Facebook de impulsar el crecimiento y la adopción de su tecnología en el mercado.