Skip to main content

Por qué Llama 3 lo está cambiando todo en el mundo de la IA

Imagen utilizada con permiso del titular de los derechos de autor

En el mundo de la IA, sin duda has oído hablar de lo que OpenAI y Google han estado haciendo. Y ahora, el LLM (modelo de lenguaje grande) Llama de Meta se está convirtiendo en un jugador cada vez más importante en el juego, especialmente con su naturaleza de código abierto. Meta recientemente causó un gran revuelo con el lanzamiento de su modelo de IA Llama 3, y ha sacudido el campo dramáticamente.

Las razones son múltiples y variadas. Es de uso gratuito, tiene una amplia base de usuarios y, sí, es de código abierto, por nombrar solo algunos. He aquí por qué Llama 3 está arrasando en la industria de la IA y puede dar forma a su futuro durante algún tiempo.

Llama 3 es realmente bueno

Podemos debatir hasta que las vacas vuelvan a casa sobre lo útiles que son las IA como ChatGPT y Llama 3 en el mundo real, no son malas para enseñarte las reglas de los juegos de mesa, pero los pocos puntos de referencia que tenemos sobre la capacidad de estas IA le dan a Llama 3 una clara ventaja.

Algunos de los desarrolladores de Llama 3 han estado compartiendo pruebas comparando los últimos modelos con algunas de las principales alternativas y, en muchos casos, Llama 3 sale ganando. Estos puntos de referencia abarcan las matemáticas, el procesamiento del lenguaje natural, las habilidades de codificación y el conocimiento y la comprensión generales.

It’s here! Meet Llama 3, our latest generation of models that is setting a new standard for state-of-the art performance and efficiency for openly available LLMs.

Key highlights

• 8B and 70B parameter openly available pre-trained and fine-tuned models.
• Trained on more… pic.twitter.com/iaOBYaOli5

— Ahmad Al-Dahle (@Ahmad_Al_Dahle) April 18, 2024

Sin embargo, no te fíes solo de su palabra. Puedes probar Llama 3 contra sí mismo y contra una variedad de otros modelos de IA en la Arena de IA.

Una base de usuarios masiva existente

Cuando OpenAI lanzó ChatGPT, tuvo algunas partes interesadas iniciales, pero tuvo que hacer crecer su audiencia de forma orgánica. Lo hizo increíblemente rápido, registrando decenas de millones de usuarios tras el éxito de sus modelos GPT 3 y GPT 4. Pero Llama 3 de Meta ya está integrado en su IA de Meta, que se puede usar en Facebook, Instagram, WhatsApp y Messenger, así como en las versiones de la aplicación web de todos estos servicios.

No se trata de millones de usuarios existentes. Son miles de millones. Todo lo que Meta tiene que hacer para obtener más datos sobre cómo se usa Llama 3, o cómo mejorarlo para los usuarios cotidianos, es empujar a estos miles de millones de usuarios a probarlo. Se trata de un público cautivo con el que pocas empresas tecnológicas pueden siquiera acercarse a competir.

Es totalmente gratis

Si la fallida iniciativa Horizons VR del CEO de Meta, Mark Zuckerberg, nos mostró algo, es que Meta no tiene ningún problema en invertir decenas de miles de millones de dólares en proyectos que realmente no van a ninguna parte. Pero esa falta de monetización necesaria es una fortaleza increíble de una empresa que invierte en un campo tan vanguardista, porque mientras que otros desarrolladores de IA pueden necesitar obtener un retorno de su inversión relativamente rápido, Meta realmente no lo necesita.

Con su gigantesca infraestructura de centro de datos y su firme flujo de ingresos fundamental de sus diversos servicios, Meta puede fijar el precio de Llama 3 exactamente a $ 0 para todos. Puede permitirse el lujo de gastar miles de millones de dólares en potencia informática en la búsqueda de un mayor desarrollo de Llama 3 y futuros LLM. Eso hace que Llama 3 sea más accesible para sus miles de millones de usuarios que cualquier otra IA de primer nivel.

Es de código abierto

Mientras que el precio es importante para los usuarios, la transparencia del código es importante para los desarrolladores. A diferencia de las IA de plataformas propietarias, como ChatGPT y sus diversos modelos de lenguaje, Llama 3 es de código abierto. Eso significa que los desarrolladores pueden ver cómo se ejecuta y realizar cambios en él. Pueden iterar sobre él y llevar el proyecto en sus propias direcciones intrigantes. Eso fomenta una mayor adopción, ya que más desarrolladores podrán integrar el modelo Llama 3 en sus propios proyectos, y fomenta un mejor código, ya que más personas pueden influir en su desarrollo.

Eso tiene el potencial de hacer de Llama 3 una especie de estándar, afianzando para el futuro previsible.

Puede ejecutarse localmente

Uno de los mayores inconvenientes de las IA de grandes modelos de lenguaje como Gemini de Google, ChatGPT o iteraciones anteriores de Llama de Meta es que requieren una cantidad desmesurada de potencia informática, no solo en el entrenamiento, sino en el funcionamiento real. Es por eso que hay que pagar por el privilegio de usar algunas IA más exigentes, y por eso la respuesta a veces es lenta cuando el servicio está ocupado.

Pero Llama 3 puede ejecutarse localmente en hardware de computadora portátil de consumo. Requiere un poco de salto a través de aros, y necesitará mucha memoria para que funcione de manera efectiva (la computadora portátil utilizada en el siguiente ejemplo es la MacBook Pro M1 Max con 64 GB de memoria RAM), pero eso no es una gran barrera de entrada.

Run Llama 3 Locally with Open-WebUI

This video is NOT sped up. The model downloaded from @ollama (llama3:instruct), running with @OpenWebUI, on a Macbook Pro M1 Max 64G.

You can run it right now on your own machine (Windows, Linux, Mac) with 1 click. https://t.co/sDpI4TEiwa pic.twitter.com/qe5PIv3hQm

— cocktail peanut (@cocktailpeanut) April 18, 2024

Ahora bien, ese ejemplo no es el mejor modelo de Llama 3: se entrenó con 70 mil millones de tokens (palabras o puntos de datos que conforman su comprensión), en lugar de los 15 billones del modelo superior. Llama 3 también está lejos de ser el primer LLM que se ejecuta localmente, pero es el más capaz hasta ahora, y sugiere que podríamos ver este tipo de IA ejecutada en teléfonos inteligentes, gafas inteligentes, auriculares de realidad virtual y otros dispositivos en un futuro cercano.

Y esto es solo el principio

Llama 3 es increíble, pero hay muchas cosas que aún no puede hacer. Actualmente está completamente basado en texto, lo que significa que no es la IA multimodal que hemos visto con ChatGPT y servicios similares. No puede procesar vídeo, ni audio, ni imágenes. No puede responder a órdenes vocales ni responderte. Actualmente solo funciona con el idioma inglés.

Pero pronto será capaz de hacer todas esas cosas, y probablemente más. Llama 3 es un disparo de advertencia para muchos desarrolladores de IA que señalan que el tiempo de las nuevas empresas más pequeñas que se roban el protagonismo en el desarrollo de IA puede haber terminado. Sin el tipo de respaldo financiero, tecnológico y de infraestructura de una empresa como Meta, competir directamente podría ser muy difícil.

Recomendaciones del editor

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Meta está trabajando en una IA que dice es más potente que GPT-4
Mark Zuckerberg Meta

El propietario de Facebook, Meta, está trabajando en un sistema de inteligencia artificial (IA) que espera sea más poderoso que GPT-4, el modelo de lenguaje grande desarrollado por OpenAI que impulsa ChatGPT Plus. Si tiene éxito, eso podría agregar mucha más competencia al mundo de los chatbots generativos de IA, y potencialmente traer consigo una serie de problemas graves.

Según The Wall Street Journal, Meta apunta a lanzar su nuevo modelo de IA en 2024. Según los informes, la compañía quiere que el nuevo modelo sea "varias veces más poderoso" que Llama 2, la herramienta de inteligencia artificial que lanzó en julio de 2023.
Brett Johnson / Unsplash
Meta planea que el próximo sistema de IA "ayude a otras compañías a crear servicios que produzcan texto, análisis y otros resultados sofisticados", afirma The Wall Street Journal. El entrenamiento para la IA comenzará a principios de 2024, y se espera un lanzamiento oficial en algún momento después de que Google lance su propio modelo de lenguaje grande, denominado Gemini.

Leer más
Meta debuta con Code Llama: su herramienta de escritura de código IA
Crea presentaciones usando la IA con estas 3 herramientas.

Siguiendo con su incursión en IA, Meta presentó su Code Llama, su nueva herramienta de escritura de código. Utilizará la misma licencia comunitaria que Llama 2 y es gratuito para investigación y uso comercial.
Code Llama, dijo Meta, puede crear cadenas de código a partir de mensajes o completar y depurar código cuando se apunta a una cadena de código específica. Además del modelo base de Code Llama, Meta lanzó una versión especializada en Python llamada Code Llama-Python y otra versión llamada Code Llama-Instrct, que puede entender instrucciones en lenguaje natural. Según Meta, cada versión específica de Code Llama no es intercambiable, y la compañía no recomienda el Code Llama base o Code Llama-Python para instrucciones en lenguaje natural.

"Los programadores ya están utilizando LLM para ayudar en una variedad de tareas, que van desde escribir nuevo software hasta depurar el código existente", dijo Meta en una publicación de blog. "El objetivo es hacer que los flujos de trabajo de los desarrolladores sean más eficientes para que puedan centrarse en los aspectos más centrados en el ser humano de sus trabajos".
La compañía dijo que Code Llama obtuvo un 53,7 por ciento en el punto de referencia de código HumanEval y pudo escribir con precisión código basado en una descripción de texto.
Meta lanzará tres tamaños de Code Llama y dijo que su tamaño más pequeño cabe en una sola GPU para proyectos de baja latencia.

Leer más
Meta quiere regalar su chatbot de IA LLaMA 2
5 herramientas de IA que te ayudan a resumir contenido.

Meta anunció que está abriendo su modelo de lenguaje grande LLaMA 2, haciéndolo gratuito para uso comercial y de investigación y enfrentándose cara a cara con el GPT-4 gratuito de OpenAI.

Meta anunció la medida como parte del evento Inspire de Microsoft, señalando su apoyo a Azure y Windows y una asociación "creciente" entre las dos compañías.

Leer más