Skip to main content

AudioCraft: el modelo de IA de Meta para crear música

Meta lanzó un nuevo código de IA de código abierto llamado AudioCraft, que permite a los usuarios crear música y sonidos completamente a través de IA generativa.

Consta de tres modelos de IA, todos abordando diferentes áreas de generación de sonido. MusicGen toma entradas de texto para generar música. Este modelo fue entrenado en «20,000 horas de música propiedad de Meta o licenciada específicamente para este propósito». AudioGen crea audio a partir de indicaciones escritas, simulando ladridos de perros o pasos, y fue entrenado en efectos de sonido públicos. Una versión mejorada del decodificador EnCodec de Meta permite a los usuarios crear sonidos con menos artefactos, que es lo que sucede cuando manipulas demasiado el audio.

«Imagina a un músico profesional capaz de explorar nuevas composiciones sin tener que tocar una sola nota en un instrumento. O un desarrollador de juegos independientes que puebla mundos virtuales con efectos de sonido realistas y ruido ambiental con un presupuesto reducido. O el propietario de una pequeña empresa que agrega una banda sonora a su última publicación de Instagram con facilidad. Esa es la promesa de AudioCraft, nuestro marco simple que genera audio y música realistas y de alta calidad a partir de entradas de usuario basadas en texto después de entrenar en señales de audio sin procesar en lugar de MIDI o rollos de piano», señala Meta.

Imagen utilizada con permiso del titular de los derechos de autor

La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo, y se puede interactuar fácilmente con ella a través de una interfaz natural. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio en comparación con el trabajo anterior en el campo, brindando a las personas la receta completa para jugar con los modelos existentes que Meta ha estado desarrollando en los últimos años, al tiempo que les permitimos superar los límites y desarrollar sus propios modelos.

AudioCraft funciona para la generación y compresión de música y sonido, todo en el mismo lugar. Debido a que es fácil de construir y reutilizar, las personas que desean construir mejores generadores de sonido, algoritmos de compresión o generadores de música pueden hacerlo todo en la misma base de código y construir sobre lo que otros han hecho.

«Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, al igual que los sintetizadores cuando aparecieron por primera vez», dijo la compañía en un blog.

La compañía dice que AudioCraft necesita código abierto para diversificar los datos utilizados para entrenarlo.

«Reconocemos que los conjuntos de datos utilizados para entrenar nuestros modelos carecen de diversidad. En particular, el conjunto de datos de música utilizado contiene una porción más grande de música de estilo occidental y solo contiene pares de audio-texto con texto y metadatos escritos en inglés», dijo Meta. «Al compartir el código de AudioCraft, esperamos que otros investigadores puedan probar más fácilmente nuevos enfoques para limitar o eliminar el posible sesgo y el mal uso de los modelos generativos».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Los avatares de IA de Meta fueron despedidos de sus funciones
avatares ia meta despedidos

Fue un proyecto efímero, porque duró menos de un año y fue un rotundo fracaso. Se trata de los famosos avatares de IA de Meta que terminaron rápidamente su ciclo.

Según The Information, Meta ha desactivado los personajes de IA modelados a partir de las semejanzas de Kendall Jenner, Snoop Dogg y Tom Brady.

Leer más
Llama 3.1: Meta estrena la IA más poderosa hasta el momento
llama 3 1 ia codigo abierto imagine meta ai

Un momento único en la industria de la IA está generando este 23 de julio la gente de Meta, ya que acaba de presentar su nueva variación de IA de código abierto: Llama 3.1, que en algunos aspectos supera a OpenAI con su ChatGPT.

Según la compañía supera a GPT-4o y Claude 3.5 Sonnet de Anthropic en varios puntos de referencia. También está haciendo que el asistente de IA de Meta basado en Llama esté disponible en más países e idiomas, al tiempo que agrega una función que puede generar imágenes basadas en la semejanza específica de alguien. El CEO Mark Zuckerberg ahora predice que Meta AI será el asistente más utilizado para fines de este año, superando a ChatGPT.

Leer más
El futuro de los auriculares Meta Quest acaba de filtrarse
Meta Quest- Zuckerberg

Los populares auriculares Quest 3 salieron el año pasado, pero según una nueva filtración, el Quest 4 y el Quest Pro de segunda generación también están en la hoja de ruta de Meta.

La hoja de ruta recientemente filtrada proviene de un informe publicado por The Information, que detalla la línea de tiempo que Meta pretende alcanzar con Quest 4 y Quest Pro 2. Fuentes anónimas dentro de Meta afirman que habrá dos variantes del Quest 4, presumiblemente un modelo estándar y premium, con nombre en código Pismo Low y Pismo High. Dado que tenemos datos sólidos sobre el rumoreado Quest 3S, el modelo de menor costo podría terminar siendo el Quest 4S. En cualquier caso, se espera que ambas variantes del Quest 4 se lancen en 2026.

Leer más