Skip to main content
  1. Home
  2. Computación
  3. Features

¿Se está volviendo más tonto el GPT-4?

Add as a preferred source on Google
Imagen utilizada con permiso del titular de los derechos de autor

Tan impresionante como GPT-4 fue en el lanzamiento, algunos espectadores han observado que ha perdido parte de su precisión y potencia. Estas observaciones se han publicado en línea durante meses, incluso en los foros de OpenAI.

Estos sentimientos han estado ahí por un tiempo, pero ahora podemos finalmente tener pruebas. Un estudio realizado en colaboración con la Universidad de Stanford y UC Berkeley sugiere que GPT-4 no ha mejorado su capacidad de respuesta, sino que de hecho ha empeorado con nuevas actualizaciones del modelo de lenguaje.

Recommended Videos

GPT-4 is getting worse over time, not better.

Many people have reported noticing a significant degradation in the quality of the model responses, but so far, it was all anecdotal.

But now we know.

At least one study shows how the June version of GPT-4 is objectively worse than… pic.twitter.com/whhELYY6M4

— Santiago (@svpino) July 19, 2023

El estudio, llamado ¿Cómo está cambiando el comportamiento de ChatGPT con el tiempo?, probó la capacidad entre GPT-4 y la versión de idioma anterior GPT-3.5 entre marzo y junio. Al probar las dos versiones del modelo con un conjunto de datos de 500 problemas, los investigadores observaron que GPT-4 tenía una tasa de precisión del 97,6% en marzo con 488 respuestas correctas y una tasa de precisión del 2,4% en junio después de que GPT-4 había pasado por algunas actualizaciones. El modelo produjo solo 12 respuestas correctas meses después.

Otra prueba utilizada por los investigadores fue una técnica de cadena de pensamiento, en la que preguntaron a GPT-4 ¿Es 17,077 un número primo? Una cuestión de razonamiento. GPT-4 no solo respondió incorrectamente que no, sino que no dio ninguna explicación de cómo llegó a esta conclusión, según los investigadores.

ChatGPT se le pregunta sobre un número primo.

En particular, GPT-4 está actualmente disponible para desarrolladores o miembros pagos a través de ChatGPT Plus. Hacer la misma pregunta a GPT-3.5 a través de la vista previa de investigación gratuita de ChatGPT como lo hice yo, le brinda no solo la respuesta correcta sino también una explicación detallada del proceso matemático.

Además, la generación de código ha sufrido con los desarrolladores de LeetCode que han visto caer el rendimiento de GPT-4 en su conjunto de datos de 50 problemas fáciles de 52% de precisión a 10% de precisión entre marzo y junio.

Cuando GPT-4 se anunció por primera vez, OpenAI detalló su uso de supercomputadoras Microsoft Azure AI para entrenar el modelo de lenguaje durante seis meses, afirmando que el resultado era una probabilidad 40% mayor de generar la «información deseada a partir de las indicaciones del usuario».

Sin embargo, el comentarista de Twitter, @svpino señaló que hay rumores de que OpenAI podría estar utilizando «modelos GPT-4 más pequeños y especializados que actúan de manera similar a un modelo grande pero son menos costosos de ejecutar».

Esta opción más barata y rápida podría estar llevando a una caída en la calidad de las respuestas GPT-4 en un momento crucial cuando la empresa matriz tiene muchas otras grandes organizaciones que dependen de su tecnología para la colaboración.

ChatGPT, basado en el GPT-3.5 LLM, ya era conocido por tener sus desafíos de información, como tener un conocimiento limitado de los eventos mundiales después de 2021, lo que podría llevarlo a llenar vacíos con datos incorrectos. Sin embargo, la regresión de la información parece ser un problema completamente nuevo nunca antes visto con el servicio. Los usuarios esperaban actualizaciones para abordar los problemas aceptados.

El CEO de OpenAI, Sam Altman, expresó recientemente su decepción en un tweet a raíz de que la Comisión Federal de Comercio iniciara una investigación sobre si ChatGPT ha violado las leyes de protección al consumidor.

«Somos transparentes sobre las limitaciones de nuestra tecnología, especialmente cuando nos quedamos cortos. Y nuestra estructura de ganancias limitadas significa que no estamos incentivados a obtener rendimientos ilimitados», tuiteó.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
Microsoft Excel tiene novedades que facilitan la gestión
Electrical Device, Switch, Credit Card

Si a menudo trabajas con datos que empiezan como archivos de texto o CSV, Microsoft Excel ahora cuenta con nuevas herramientas integradas que simplifican cómo esa información se integra en una hoja de cálculo.

La actualización introduce dos nuevas funciones, IMPORTTEXT e IMPORTCSV, diseñadas para llevar datos externos directamente a las celdas de Excel usando fórmulas. En lugar de pasar por el asistente de importación tradicional cada vez, los usuarios ahora pueden cargar archivos directamente en una hoja de cálculo y mantener esos datos conectados a su fuente.

Read more
AMD tiene chips nuevos, pero el precio de la RAM es la verdadera batalla
Green, Logo, Text

Si pensabas que 2026 iba a ser el año en que la construcción de PC volviera a ser fácil, AMD tiene malas noticias. La empresa se dirige al nuevo año enfrentándose a una tormenta perfecta de dolores de cabeza en la cadena de suministro y precios disparados. En una charla sincera con Gizmodo durante el CES, David McAfee, líder de Ryzen de AMD, explicó la situación y, sinceramente, parece que están intentando guiar un barco a través de un huracán sin perder carga.

El hardware que mostraron en el CES cuenta la historia mejor que cualquier nota de prensa. Presentaron el nuevo Ryzen 7 9850X3D y algunas APUs Strix Halo mejoradas, concretamente el Ryzen AI Max+ 388 y 382. Sobre el papel, parecen sólidos para futuros portátiles o portátiles. Pero si miras más de cerca, hay una pega: estos nuevos chips siguen funcionando con la antigua arquitectura gráfica RDNA 3.5. Todavía no están recibiendo la nueva tecnología gráfica brillante. Incluso McAfee admitió que el salto en rendimiento del anterior 9800X3D a este nuevo 9850X3D va a ser bastante menor, especialmente notable si estás jugando títulos de esports o juegos antiguos. Se siente menos como una revolución y más como si simplemente mantuvieran las luces encendidas mientras esperan a que pase la tormenta.

Read more
Puede que ahora te afecte el final de la RTX 5070 Ti
Computer Hardware, Electronics, Hardware

La RTX 5070 Ti de NVIDIA cada vez es más difícil de comprar, y la presión aparece en la compra. Sin embargo, el debate sobre el final de la vida útil de la RTX 5070 Ti está siendo impulsado por los socios de la placa, sin que NVIDIA anuncie públicamente de forma clara.

ASUS ha puesto sus propios modelos RTX 5070 Ti en estado de fin de vida útil y afirma que no tiene planes de producir más unidades porque la oferta es demasiado escasa. Eso deja a los compradores peleando por el inventario que ya hay disponible.

Read more