Skip to main content

MusicGen: la herramienta de Meta para hacer música con IA

Meta no se quiere quedar abajo de la IA y de la generación automática de música y canciones a partir de texto, por eso, acaba de estrenar MusicGen.

Una demostración se puede encontrar aquí, puede convertir una descripción de texto (por ejemplo, «Una canción pop de conducción de los 80 con baterías pesadas y pads de sintetizador en el fondo») en aproximadamente 12 segundos de audio, más o menos. MusicGen puede ser opcionalmente «dirigido» con audio de referencia, como una canción existente, en cuyo caso intentará seguir tanto la descripción como la melodía.

Recommended Videos

We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community: https://t.co/OkYjL4xDN7 pic.twitter.com/h1l4LGzYgf

— Felix Kreuk (@FelixKreuk) June 9, 2023

MusicGen fue entrenado en 20,000 horas de música, incluidas 10,000 pistas de música con licencia de «alta calidad» y 390,000 pistas solo para instrumentos de ShutterStock y Pond5, una gran biblioteca de medios de stock. La compañía no ha proporcionado el código que utilizó para entrenar el modelo, pero ha puesto a disposición modelos previamente entrenados que cualquier persona con el hardware adecuado, principalmente una GPU con alrededor de 16 GB de memoria, puede ejecutar.

Meta, que no está imponiendo restricciones sobre cómo se puede usar MusicGen, dice que toda la música en la que MusicGen fue entrenada estaba «cubierta por acuerdos legales con los titulares de derechos», incluido un acuerdo con Shutterstock.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Meta admite errores groseros en la moderación de contenido
Facebook celular

El máximo ejecutivo de Meta, Nick Clegg, reconoció que hay un problema mayúsculo con Meta, y es que la moderación de contenido está fallando.
El presidente de asuntos globales de Meta, dijo a los periodistas el lunes que las "tasas de error de moderación de la compañía siguen siendo demasiado altas" y se comprometió a "mejorar la precisión y exactitud con la que actuamos según nuestras reglas".
"Sabemos que al hacer cumplir nuestras políticas, nuestras tasas de error siguen siendo demasiado altas, lo que se interpone en el camino de la libertad de expresión que nos propusimos permitir", dijo Clegg durante una llamada de prensa a la que asistí. "Con demasiada frecuencia, el contenido inofensivo se elimina o se restringe, y demasiadas personas son penalizadas injustamente".
Clegg además reconoció que uno de los periodos más difíciles de moderación de contenido, fue para la pandemia de COVID-19.

"Teníamos reglas muy estrictas para eliminar grandes volúmenes de contenido durante la pandemia", dijo Clegg. "Nadie durante la pandemia sabía cómo se iba a desarrollar la pandemia, así que esto es realmente sabiduría en retrospectiva. Pero en retrospectiva, sentimos que nos excedimos un poco. Somos muy conscientes porque los usuarios alzaron la voz, con razón, y se quejaron de que a veces aplicamos demasiado y cometemos errores y eliminamos o restringimos contenido inocuo o inocente".

Leer más
Panasonic trae de la muerte a su fundador con la ayuda de la IA
panasonic revive ia fundador konosuke matsushita

Una situación inusual y muy curiosa está haciendo Panasonic, ya que la compañía de la ciudad de Kioto acaba de revivir a su fundador Konosuke Matsushita, por intermedio de la IA, para que obre como una especie de consultor experimentado.

Konosuke Matsushita, fundó Matsushita Electric Industrial Co., Ltd, que luego se convirtió en Panasonic. Dejó un gran legado en la empresa nipona y falleció el 27 de abril de 1989.

Leer más
Ellos quieren derrotar a NotebookLM en creación de podcasts con IA
Los mejores podcasts en español que puedes escuchar ahora mismo

Una de las principales novedades y que causó mucha sorpresa entre los usuarios, fue la aparición de NotebookLM, una herramienta de Google que además de hacer resúmenes de largos textos con IA, podía transformar texto o enlaces en podcasts hablados entre dos personas con extraordinaria fluidez.

Ahora, la compañía ElevenLabs está subiendo la apuesta, ya que con su función GenFM quiere hacer eso y más, ya que tiene soporte para 32 idiomas: incluidos inglés, hindi, portugués, chino, español, francés, alemán, japonés y otros.
Para usar GenFM, primero debes subir un video, texto o documento de YouTube. Luego, la aplicación selecciona dos voces automáticamente para crear un podcast. Hay más de una docena de voces disponibles, señala la compañía.
Una de las pantallas interesantes que puedes ver cuando la aplicación prepara un podcast generado por IA es "Rociar algunos umms" y "Agregar algunas pausas reflexivas", para sacar todos los errores.
"Debatimos sobre cuánto introducir 'ums', 'ahs', 'mhmms' / risa / respiración de rellenos o superposiciones de diálogos humanos similares: nuestro objetivo es lograr el equilibrio adecuado entre la conversación natural y humana y proporcionar utilidad al contenido", le dijo Jack McDermott, quien se encarga del crecimiento móvil en ElevenLabs, a TechCrunch.

Leer más