Skip to main content

AudioCraft: el modelo de IA de Meta para crear música

Meta lanzó un nuevo código de IA de código abierto llamado AudioCraft, que permite a los usuarios crear música y sonidos completamente a través de IA generativa.

Consta de tres modelos de IA, todos abordando diferentes áreas de generación de sonido. MusicGen toma entradas de texto para generar música. Este modelo fue entrenado en «20,000 horas de música propiedad de Meta o licenciada específicamente para este propósito». AudioGen crea audio a partir de indicaciones escritas, simulando ladridos de perros o pasos, y fue entrenado en efectos de sonido públicos. Una versión mejorada del decodificador EnCodec de Meta permite a los usuarios crear sonidos con menos artefactos, que es lo que sucede cuando manipulas demasiado el audio.

«Imagina a un músico profesional capaz de explorar nuevas composiciones sin tener que tocar una sola nota en un instrumento. O un desarrollador de juegos independientes que puebla mundos virtuales con efectos de sonido realistas y ruido ambiental con un presupuesto reducido. O el propietario de una pequeña empresa que agrega una banda sonora a su última publicación de Instagram con facilidad. Esa es la promesa de AudioCraft, nuestro marco simple que genera audio y música realistas y de alta calidad a partir de entradas de usuario basadas en texto después de entrenar en señales de audio sin procesar en lugar de MIDI o rollos de piano», señala Meta.

Imagen utilizada con permiso del titular de los derechos de autor

La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo, y se puede interactuar fácilmente con ella a través de una interfaz natural. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio en comparación con el trabajo anterior en el campo, brindando a las personas la receta completa para jugar con los modelos existentes que Meta ha estado desarrollando en los últimos años, al tiempo que les permitimos superar los límites y desarrollar sus propios modelos.

AudioCraft funciona para la generación y compresión de música y sonido, todo en el mismo lugar. Debido a que es fácil de construir y reutilizar, las personas que desean construir mejores generadores de sonido, algoritmos de compresión o generadores de música pueden hacerlo todo en la misma base de código y construir sobre lo que otros han hecho.

«Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, al igual que los sintetizadores cuando aparecieron por primera vez», dijo la compañía en un blog.

La compañía dice que AudioCraft necesita código abierto para diversificar los datos utilizados para entrenarlo.

«Reconocemos que los conjuntos de datos utilizados para entrenar nuestros modelos carecen de diversidad. En particular, el conjunto de datos de música utilizado contiene una porción más grande de música de estilo occidental y solo contiene pares de audio-texto con texto y metadatos escritos en inglés», dijo Meta. «Al compartir el código de AudioCraft, esperamos que otros investigadores puedan probar más fácilmente nuevos enfoques para limitar o eliminar el posible sesgo y el mal uso de los modelos generativos».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Meta anuncia su propia aplicación independiente de IA para competir con ChatGPT
Meta AI

Hasta ahora los esfuerzos de IA de Meta estaban desplegados a la integración de su chatbot Meta AI con sus diferentes servicios como Facebook, Instagram o WhatsApp, sin embargo, en un evento este martes 29 de abril llamado LlamaCon, la compañía de Mark Zuckerberg informó que sacarán una aplicación independiente para competir directamente con ChatGPT.

La aplicación de IA de Meta puede diferenciarse de los asistentes de IA existentes porque puede "[basarse] en la información que ya ha elegido compartir en los productos de Meta", dijo la compañía, como su perfil y el contenido con el que interactúa.

Leer más
Meta está entrenando su IA con tus datos de Instagram, Facebook y WhatsApp y no puedes escapar
Meta AI

Imagina que un gigante tecnológico te dice que quiere que tus publicaciones de Instagram y Facebook entrenen sus modelos de IA. Y eso también, sin ningún incentivo. Sin embargo, podría optar por no participar, según la empresa. Pero a medida que avanza con las herramientas oficiales para retroceder y evitar que la IA engulla su contenido social, simplemente no funcionan.

Eso es lo que ahora informan los usuarios de Facebook e Instagram. Nate Hake, editor y jefe fundador de Travel Lemming, compartió que recibió un correo electrónico de Meta sobre el uso de su contenido de redes sociales para el entrenamiento de IA. Sin embargo, el enlace al formulario de exclusión proporcionado por Meta no funciona.

Leer más
Se anuncia el nuevo modelo de generación de imágenes de Midjourney para enfrentarse a GPT-4o de OpenAI
MidJourney

A pesar de que MidJourney se propuso ser uno de los modelos de generación de imágenes más prometedores en los primeros días de la IA, parece haberse quedado atrás de herramientas más accesibles, fáciles de usar y gratuitas como Gemini, ChatGPT y Bing. A sus problemas se suma la última actualización del modelo GPT-4o de OpenAI, que permite una generación de imágenes excepcionalmente buena con la capacidad de recrear fotos reales y producir texto inmaculado. Entonces, para mantenerse relevante, o tal vez atrapar el tren del hype que está siendo desviado por la ola de arte de IA inspirado en Studio Ghibli que inunda Internet, MidJourney está lanzando un modelo actualizado con varias mejoras.

El CEO David Holz anunció los detalles del nuevo modelo V7 en el servidor oficial de Discord de MidJourney y a través de una publicación de blog. Dijeron que el nuevo modelo es "más inteligente con las indicaciones de texto" y produce imágenes con una calidad "notablemente superior" y "texturas hermosas".

Leer más