Skip to main content

¿Se está volviendo más tonto el GPT-4?

Imagen utilizada con permiso del titular de los derechos de autor

Tan impresionante como GPT-4 fue en el lanzamiento, algunos espectadores han observado que ha perdido parte de su precisión y potencia. Estas observaciones se han publicado en línea durante meses, incluso en los foros de OpenAI.

Estos sentimientos han estado ahí por un tiempo, pero ahora podemos finalmente tener pruebas. Un estudio realizado en colaboración con la Universidad de Stanford y UC Berkeley sugiere que GPT-4 no ha mejorado su capacidad de respuesta, sino que de hecho ha empeorado con nuevas actualizaciones del modelo de lenguaje.

GPT-4 is getting worse over time, not better.

Many people have reported noticing a significant degradation in the quality of the model responses, but so far, it was all anecdotal.

But now we know.

At least one study shows how the June version of GPT-4 is objectively worse than… pic.twitter.com/whhELYY6M4

— Santiago (@svpino) July 19, 2023

El estudio, llamado ¿Cómo está cambiando el comportamiento de ChatGPT con el tiempo?, probó la capacidad entre GPT-4 y la versión de idioma anterior GPT-3.5 entre marzo y junio. Al probar las dos versiones del modelo con un conjunto de datos de 500 problemas, los investigadores observaron que GPT-4 tenía una tasa de precisión del 97,6% en marzo con 488 respuestas correctas y una tasa de precisión del 2,4% en junio después de que GPT-4 había pasado por algunas actualizaciones. El modelo produjo solo 12 respuestas correctas meses después.

Otra prueba utilizada por los investigadores fue una técnica de cadena de pensamiento, en la que preguntaron a GPT-4 ¿Es 17,077 un número primo? Una cuestión de razonamiento. GPT-4 no solo respondió incorrectamente que no, sino que no dio ninguna explicación de cómo llegó a esta conclusión, según los investigadores.

ChatGPT se le pregunta sobre un número primo.

En particular, GPT-4 está actualmente disponible para desarrolladores o miembros pagos a través de ChatGPT Plus. Hacer la misma pregunta a GPT-3.5 a través de la vista previa de investigación gratuita de ChatGPT como lo hice yo, le brinda no solo la respuesta correcta sino también una explicación detallada del proceso matemático.

Además, la generación de código ha sufrido con los desarrolladores de LeetCode que han visto caer el rendimiento de GPT-4 en su conjunto de datos de 50 problemas fáciles de 52% de precisión a 10% de precisión entre marzo y junio.

Cuando GPT-4 se anunció por primera vez, OpenAI detalló su uso de supercomputadoras Microsoft Azure AI para entrenar el modelo de lenguaje durante seis meses, afirmando que el resultado era una probabilidad 40% mayor de generar la «información deseada a partir de las indicaciones del usuario».

Sin embargo, el comentarista de Twitter, @svpino señaló que hay rumores de que OpenAI podría estar utilizando «modelos GPT-4 más pequeños y especializados que actúan de manera similar a un modelo grande pero son menos costosos de ejecutar».

Esta opción más barata y rápida podría estar llevando a una caída en la calidad de las respuestas GPT-4 en un momento crucial cuando la empresa matriz tiene muchas otras grandes organizaciones que dependen de su tecnología para la colaboración.

ChatGPT, basado en el GPT-3.5 LLM, ya era conocido por tener sus desafíos de información, como tener un conocimiento limitado de los eventos mundiales después de 2021, lo que podría llevarlo a llenar vacíos con datos incorrectos. Sin embargo, la regresión de la información parece ser un problema completamente nuevo nunca antes visto con el servicio. Los usuarios esperaban actualizaciones para abordar los problemas aceptados.

El CEO de OpenAI, Sam Altman, expresó recientemente su decepción en un tweet a raíz de que la Comisión Federal de Comercio iniciara una investigación sobre si ChatGPT ha violado las leyes de protección al consumidor.

«Somos transparentes sobre las limitaciones de nuestra tecnología, especialmente cuando nos quedamos cortos. Y nuestra estructura de ganancias limitadas significa que no estamos incentivados a obtener rendimientos ilimitados», tuiteó.

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
OpenAI lanza su versión GPT-4o mini para expandir su poder
Chat GPT IA Phone

Este jueves, OpenAI acaba de anunciar una nueva variante de su último modelo de IA, que llevará por nombre GPT-4o mini,  el último esfuerzo de la startup de inteligencia artificial para expandir el uso de su popular chatbot.

La compañía calificó la nueva versión como "el modelo pequeño más capaz y rentable disponible en la actualidad", y planea integrar imagen, video y audio en él más adelante.

Leer más
ChatGPT tiene más suscriptores que este popular servicio de streaming
chatgpt mas suscriptores popular servicio streaming sam altman

Andrew Martonik / DT
La arrolladora de OpenAI sobre sus rivales continuó a buen ritmo esta semana, y un nuevo estudio estima cuánto éxito ha tenido en ganar suscriptores pagos a través de ChatGPT Plus.

Según un informe publicado por Futuresearch esta semana, los productos de OpenAI son, con diferencia, los más populares -y rentables- en el espacio de la IA. Según el estudio, OpenAI tiene unos ingresos recurrentes anuales estimados de 3.400 millones de dólares.
Búsqueda de futuro
Alrededor del 55% de eso, o 1.900 millones de dólares, proviene de sus 7,7 millones de suscriptores de ChatGPT Plus que pagan 20 dólares al mes por el servicio. Otro 21%, o 714 millones de dólares, proviene de los 1,2 millones de suscriptores de ChatGPT Enterprise de 50 dólares al mes de la compañía. Solo el 15%, o 510 millones de dólares, se genera a partir de la API de la IA, mientras que el 8% restante, o 290 millones de dólares, proviene de sus 980.000 suscriptores de ChatGPT Teams que pagan 25 dólares al mes. En total, se estima que OpenAI tiene unos 9,88 millones de suscriptores mensuales.

Leer más
5 funciones que me gustaría ver en una laptop con Inteligencia Artificial
monopolio macbook acaba de ser derrocado pc copilot  computadoras

Laboralmente hablando, quizá el término que más he mencionado en los últimos meses ha sido inteligencia artificial. Leo y escucho de ella por aquí y por allá, y aunque he pedido algunas cosas a ChatGPT —casi siempre más con fines experimentales que con interés laboral— y hasta aprendí a usar Discord para pedir imágenes a MidJourney. Y aunque ahora mismo siento que la inteligencia artificial es más útil en mi celular mejorando las malas fotos que suelo tomar, espero que pronto plataformas como Office o los mismos fabricantes de computadoras empiecen a implementar funciones que estoy seguro son posibles. Pensé en estas 5 cosas que me gustaría ver en una laptop con Inteligencia Artificial.
Un Excel que me haga un buen plan de pagos

No está ligado a una laptop, pero definitivamente soy el tipo que usa Excel en su computadora y muy rara vez en su celular. Estoy lejos de ser un experto, pero tengo hojas con mi presupuesto mensual y por supuesto, una donde proyecto cuánto puedo gastar para salir de mis deudas lo más pronto posible. Obviamente la cuenta está mal hecha, porque todos los meses sigo a seis meses de liquidar (como el meme de Adam Driver).

Leer más