Skip to main content

AudioCraft: el modelo de IA de Meta para crear música

Meta lanzó un nuevo código de IA de código abierto llamado AudioCraft, que permite a los usuarios crear música y sonidos completamente a través de IA generativa.

Consta de tres modelos de IA, todos abordando diferentes áreas de generación de sonido. MusicGen toma entradas de texto para generar música. Este modelo fue entrenado en «20,000 horas de música propiedad de Meta o licenciada específicamente para este propósito». AudioGen crea audio a partir de indicaciones escritas, simulando ladridos de perros o pasos, y fue entrenado en efectos de sonido públicos. Una versión mejorada del decodificador EnCodec de Meta permite a los usuarios crear sonidos con menos artefactos, que es lo que sucede cuando manipulas demasiado el audio.

«Imagina a un músico profesional capaz de explorar nuevas composiciones sin tener que tocar una sola nota en un instrumento. O un desarrollador de juegos independientes que puebla mundos virtuales con efectos de sonido realistas y ruido ambiental con un presupuesto reducido. O el propietario de una pequeña empresa que agrega una banda sonora a su última publicación de Instagram con facilidad. Esa es la promesa de AudioCraft, nuestro marco simple que genera audio y música realistas y de alta calidad a partir de entradas de usuario basadas en texto después de entrenar en señales de audio sin procesar en lugar de MIDI o rollos de piano», señala Meta.

Imagen utilizada con permiso del titular de los derechos de autor

La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo, y se puede interactuar fácilmente con ella a través de una interfaz natural. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio en comparación con el trabajo anterior en el campo, brindando a las personas la receta completa para jugar con los modelos existentes que Meta ha estado desarrollando en los últimos años, al tiempo que les permitimos superar los límites y desarrollar sus propios modelos.

AudioCraft funciona para la generación y compresión de música y sonido, todo en el mismo lugar. Debido a que es fácil de construir y reutilizar, las personas que desean construir mejores generadores de sonido, algoritmos de compresión o generadores de música pueden hacerlo todo en la misma base de código y construir sobre lo que otros han hecho.

«Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, al igual que los sintetizadores cuando aparecieron por primera vez», dijo la compañía en un blog.

La compañía dice que AudioCraft necesita código abierto para diversificar los datos utilizados para entrenarlo.

«Reconocemos que los conjuntos de datos utilizados para entrenar nuestros modelos carecen de diversidad. En particular, el conjunto de datos de música utilizado contiene una porción más grande de música de estilo occidental y solo contiene pares de audio-texto con texto y metadatos escritos en inglés», dijo Meta. «Al compartir el código de AudioCraft, esperamos que otros investigadores puedan probar más fácilmente nuevos enfoques para limitar o eliminar el posible sesgo y el mal uso de los modelos generativos».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Meta Movie Gen: Zuckerberg hace realidad convincentes videos de IA
meta movie gen video ia

https://media.wired.com/clips/66ff6ba6967e31bbf220c2f7/master/pass/Comp%201%20copy%202.mp4

Este viernes 4 de octubre, Meta acaba de estrenar su nuevo sistema de IA generativa para realizar videos, llamado Meta Movie Gen, que se puede utilizar para generar clips de vídeo y audio realistas.
La compañía compartió varios clips de 10 segundos generados con Movie Gen, incluido un hipopótamo bebé al estilo de Moo Deng nadando, para demostrar sus capacidades.
"Nuestras últimas investigaciones demuestran cómo puedes utilizar entradas de texto sencillas para producir vídeos y sonidos personalizados, editar vídeos existentes y transformar tu imagen personal en un vídeo único. Movie Gen supera a modelos similares en la industria en estas tareas cuando es evaluado por humanos", dice la gente de Meta.

Leer más
Un modelo de IA simula el clásico Doom solo con sus fotogramas
La imagen muestra una escena del popular juego Doom de 1993.

Los generadores de imágenes de IA están llegando a niveles bastante altos, y para muestra un botón nuevamente: ya que Google está desarrollando un modelo de IA que es capaz de simular el clásico shooter de PC de 1993, Doom, pero sin usar el código informático del propio juego.

En cambio, el modelo de los investigadores funciona subiendo imágenes fijas para el juego como lo hace un generador de imágenes de IA, excepto que puede hacerlo en tiempo real a más de 20 cuadros por segundo para una experiencia jugable.

Leer más
Cómo es la base de datos de riesgos de IA creada por el MIT
Robot IA maligno encerrado en jaula

El MIT acaba de estrenar un documento esencial para instituciones laborales, gubernamentales, públicas y estudiantiles sobre los riesgos que conlleva el uso de IA y una categorización de potenciales peligros.

El Repositorio de Riesgos de IA, es una base de datos completa de cientos de riesgos documentados que plantean los sistemas de IA. El repositorio tiene como objetivo ayudar a los responsables de la toma de decisiones en el gobierno, la investigación y la industria a evaluar los riesgos cambiantes de la IA.

Leer más