Skip to main content

AudioCraft: el modelo de IA de Meta para crear música

Meta lanzó un nuevo código de IA de código abierto llamado AudioCraft, que permite a los usuarios crear música y sonidos completamente a través de IA generativa.

Consta de tres modelos de IA, todos abordando diferentes áreas de generación de sonido. MusicGen toma entradas de texto para generar música. Este modelo fue entrenado en «20,000 horas de música propiedad de Meta o licenciada específicamente para este propósito». AudioGen crea audio a partir de indicaciones escritas, simulando ladridos de perros o pasos, y fue entrenado en efectos de sonido públicos. Una versión mejorada del decodificador EnCodec de Meta permite a los usuarios crear sonidos con menos artefactos, que es lo que sucede cuando manipulas demasiado el audio.

«Imagina a un músico profesional capaz de explorar nuevas composiciones sin tener que tocar una sola nota en un instrumento. O un desarrollador de juegos independientes que puebla mundos virtuales con efectos de sonido realistas y ruido ambiental con un presupuesto reducido. O el propietario de una pequeña empresa que agrega una banda sonora a su última publicación de Instagram con facilidad. Esa es la promesa de AudioCraft, nuestro marco simple que genera audio y música realistas y de alta calidad a partir de entradas de usuario basadas en texto después de entrenar en señales de audio sin procesar en lugar de MIDI o rollos de piano», señala Meta.

Imagen utilizada con permiso del titular de los derechos de autor

La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo, y se puede interactuar fácilmente con ella a través de una interfaz natural. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio en comparación con el trabajo anterior en el campo, brindando a las personas la receta completa para jugar con los modelos existentes que Meta ha estado desarrollando en los últimos años, al tiempo que les permitimos superar los límites y desarrollar sus propios modelos.

AudioCraft funciona para la generación y compresión de música y sonido, todo en el mismo lugar. Debido a que es fácil de construir y reutilizar, las personas que desean construir mejores generadores de sonido, algoritmos de compresión o generadores de música pueden hacerlo todo en la misma base de código y construir sobre lo que otros han hecho.

«Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, al igual que los sintetizadores cuando aparecieron por primera vez», dijo la compañía en un blog.

La compañía dice que AudioCraft necesita código abierto para diversificar los datos utilizados para entrenarlo.

«Reconocemos que los conjuntos de datos utilizados para entrenar nuestros modelos carecen de diversidad. En particular, el conjunto de datos de música utilizado contiene una porción más grande de música de estilo occidental y solo contiene pares de audio-texto con texto y metadatos escritos en inglés», dijo Meta. «Al compartir el código de AudioCraft, esperamos que otros investigadores puedan probar más fácilmente nuevos enfoques para limitar o eliminar el posible sesgo y el mal uso de los modelos generativos».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Es el final del camino para estos dos modelos de iPhone
iPhone 6s

Ver tu dispositivo de juegos portátil favorito en una tienda retro tiene una forma única de hacerte sentir viejo, pero Apple podría haberlo superado. Según la compañía, el iPhone XS Max y el iPhone 6s Plus ahora son "vintage". Se unen a las filas del iPhone 4 e incluso del modelo iPad Pro de 12,9 pulgadas.

No es del todo inesperado. Apple declara que un dispositivo es antiguo después de cinco años, y eso significa que se vuelve más difícil reparar ese dispositivo o encontrar piezas de repuesto para él. Obsoleto se aplica a productos que tienen más de siete años, pero a veces ciertas variantes obtienen esa etiqueta antes de tiempo.

Leer más
Linus Torvalds cree que el 90% de la IA es puro marketing
Linus Torvarlds, el creador de Linux

El creador de Linux, Linus Torvalds, no es alguien que se guarde sus opiniones y esta vez le tiró un par de dardos a la IA y su desarrollo durante los últimos 2 años.
El ingeniero de software finlandés se unió recientemente a un evento centrado en el código abierto, donde tuvo un par de cosas que decir sobre la tecnología de IA y los algoritmos "inteligentes".
Torvalds dijo que el estado actual de la tecnología de IA es 90 por ciento marketing y 10 por ciento realidad factual. El desarrollador, ganador del Premio Tecnológico del Milenio de Finlandia por la creación del kernel de Linux, fue entrevistado durante la Cumbre de Código Abierto celebrada en Viena.

El padre de Linux eso sí cree que "los servicios modernos de IA generativa son un desarrollo interesante en la tecnología de aprendizaje automático y que eventualmente cambiarán el mundo". Al mismo tiempo, expresó su insatisfacción con el "ciclo de exageración" que está alimentando demasiadas iniciativas relacionadas con la IA y contribuyendo a las evaluaciones de mercado increíblemente altas de Nvidia.

Leer más
Meta utilizará el reconocimiento facial para ayudar a las celebridades
Meta

Meta ha dicho que va a utilizar la tecnología de reconocimiento facial en un intento por acabar con los anuncios fraudulentos de celebridades que plagan sus plataformas de Facebook e Instagram.

La medida se produce tres años después de que Meta eliminara la inteligencia de reconocimiento facial de Facebook tras una reacción violenta contra la tecnología. Meta espera que esta implementación del sistema, y la razón para introducirlo, sea mejor recibida por sus comunidades en línea esta vez.

Leer más