Meta anunció que está abriendo su modelo de lenguaje grande LLaMA 2, haciéndolo gratuito para uso comercial y de investigación y enfrentándose cara a cara con el GPT-4 gratuito de OpenAI.
Meta anunció la medida como parte del evento Inspire de Microsoft, señalando su apoyo a Azure y Windows y una asociación «creciente» entre las dos compañías.
«A partir de hoy, Llama 2 estará disponible en el catálogo de modelos de Azure AI, lo que permitirá a los desarrolladores que usan Microsoft Azure compilar con él y aprovechar sus herramientas nativas de la nube para el filtrado de contenido y las características de seguridad. También está optimizado para ejecutarse localmente en Windows, lo que brinda a los desarrolladores un flujo de trabajo sin problemas, ya que brindan experiencias generativas de IA a los clientes en diferentes plataformas. Llama 2 estará disponible a través de Amazon Web Services (AWS), Hugging Face y otros proveedores también», sostiene Meta.
El comunicado de prensa de Meta explica la decisión de abrir LLaMA como una forma de dar a las empresas, nuevas empresas e investigadores acceso a más herramientas de IA, lo que permite la experimentación como comunidad. Según Meta, LLaMa 2 fue entrenado con un 40 por ciento más de datos en comparación con LLaMa 1, que incluye información de «fuentes de datos en línea disponibles públicamente». También dice que «supera» a otros LLM como Falcon y MPT cuando se trata de pruebas de razonamiento, codificación, competencia y conocimiento.
Al abrir LLaMA, Meta dijo que quiere mejorar la seguridad y la transparencia. La compañía dijo que el modelo LLaMA 2 ha sido «en equipo rojo» o probado para la seguridad al «generar indicaciones adversarias para facilitar el ajuste fino del modelo», tanto interna como externamente.
«Creemos que un enfoque abierto es el correcto para el desarrollo de los modelos de IA actuales, especialmente aquellos en el espacio generativo donde la tecnología avanza rápidamente», dijo Meta en un comunicado. «Abrir el acceso a los modelos actuales de IA significa que una generación de desarrolladores e investigadores puede hacerles pruebas de estrés, identificando y resolviendo problemas rápidamente, como comunidad».