Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

AudioCraft: el modelo de IA de Meta para crear música

Add as a preferred source on Google

Meta lanzó un nuevo código de IA de código abierto llamado AudioCraft, que permite a los usuarios crear música y sonidos completamente a través de IA generativa.

Consta de tres modelos de IA, todos abordando diferentes áreas de generación de sonido. MusicGen toma entradas de texto para generar música. Este modelo fue entrenado en «20,000 horas de música propiedad de Meta o licenciada específicamente para este propósito». AudioGen crea audio a partir de indicaciones escritas, simulando ladridos de perros o pasos, y fue entrenado en efectos de sonido públicos. Una versión mejorada del decodificador EnCodec de Meta permite a los usuarios crear sonidos con menos artefactos, que es lo que sucede cuando manipulas demasiado el audio.

«Imagina a un músico profesional capaz de explorar nuevas composiciones sin tener que tocar una sola nota en un instrumento. O un desarrollador de juegos independientes que puebla mundos virtuales con efectos de sonido realistas y ruido ambiental con un presupuesto reducido. O el propietario de una pequeña empresa que agrega una banda sonora a su última publicación de Instagram con facilidad. Esa es la promesa de AudioCraft, nuestro marco simple que genera audio y música realistas y de alta calidad a partir de entradas de usuario basadas en texto después de entrenar en señales de audio sin procesar en lugar de MIDI o rollos de piano», señala Meta.

Imagen utilizada con permiso del titular de los derechos de autor

La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo, y se puede interactuar fácilmente con ella a través de una interfaz natural. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio en comparación con el trabajo anterior en el campo, brindando a las personas la receta completa para jugar con los modelos existentes que Meta ha estado desarrollando en los últimos años, al tiempo que les permitimos superar los límites y desarrollar sus propios modelos.

AudioCraft funciona para la generación y compresión de música y sonido, todo en el mismo lugar. Debido a que es fácil de construir y reutilizar, las personas que desean construir mejores generadores de sonido, algoritmos de compresión o generadores de música pueden hacerlo todo en la misma base de código y construir sobre lo que otros han hecho.

«Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, al igual que los sintetizadores cuando aparecieron por primera vez», dijo la compañía en un blog.

La compañía dice que AudioCraft necesita código abierto para diversificar los datos utilizados para entrenarlo.

«Reconocemos que los conjuntos de datos utilizados para entrenar nuestros modelos carecen de diversidad. En particular, el conjunto de datos de música utilizado contiene una porción más grande de música de estilo occidental y solo contiene pares de audio-texto con texto y metadatos escritos en inglés», dijo Meta. «Al compartir el código de AudioCraft, esperamos que otros investigadores puedan probar más fácilmente nuevos enfoques para limitar o eliminar el posible sesgo y el mal uso de los modelos generativos».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Nvidia actualiza su aplicación con DLSS 4.5 con nuevas funciones mejoradas
NVIDIA

Nvidia ha lanzado una actualización sustancial de su aplicación móvil, introduciendo la versión 4.5 de su tecnología DLSS (Deep Learning Super Sampling) junto con diversas mejoras en el panel de control de funciones gráficas.

La nueva versión de DLSS 4.5 representa un avance significativo en la optimización de rendimiento para usuarios de dispositivos móviles compatibles. Esta actualización permite que los usuarios experimenten mejor escalabilidad gráfica, reduciendo la demanda de procesamiento mientras mantienen una calidad visual superior. La tecnología de aprendizaje profundo de Nvidia continúa evolucionando para entregar resultados más refinados y naturales.

Read more
Por fin puedes desinstalar Microsoft Copilot en Windows 11, pero…
Art, Tape, Landmark

Microsoft finalmente permite que algunos usuarios eliminen Copilot de Windows, pero la letra pequeña deja claro que no es el corte limpio que muchos esperaban. Tras llevar Copilot a fondo en Windows 11, Microsoft ha introducido una nueva opción en una reciente versión de Windows 11 Insider Preview que permite desinstalar completamente Copilot.

La cuestión es que solo funciona en situaciones muy concretas, y la mayoría de los usuarios habituales no cumplen los requisitos. Hasta ahora, Copilot podía desactivarse o ocultarse, pero no podía eliminarse por completo. Eso cambia con una nueva configuración de Directiva de Grupo llamada RemoveMicrosoftCopilotApp, que aparece en las últimas versiones de Insider sobre los canales Developer y Beta.

Read more
La máquina pensante: así es el libro sobre el CEO de Nvidia
Libro la máquina pensante

En junio de 2024, impulsada por el auge de la inteligencia artificial tras el lanzamiento de ChatGPT, Nvidia se convirtió en la corporación más valiosa del mundo. Tres décadas después de su fundación en un restaurante Denny’s, la compañía pasó de fabricar componentes para videojuegos a liderar el mercado global del hardware para IA. Esta transformación histórica es el eje central de La máquina pensante, el nuevo libro del periodista Stephen Witt.

En esta obra, Witt narra cómo Jensen Huang, cofundador y director general de Nvidia, apostó hace más de una década por una tecnología que entonces parecía marginal: la inteligencia artificial. Una decisión arriesgada que terminó redefiniendo la arquitectura del ordenador moderno y situando a la compañía en el centro de la revolución tecnológica actual.

Read more