Un nuevo escalón evolutivo acaba de subir OpenAI en su carrera por encontrar el modelo perfecto de IA, ya que este 12 de septiembre presentó o1, un sistema que se integrará a ChatGPT y está pensado para dar respuestas más complejas a preguntas más difíciles, específicamente ideado para campos laborales, de estudio y empresas.
O1 fue entrenado para «pasar más tiempo pensando en los problemas antes de que respondan, al igual que lo haría una persona», dijo OpenAI en su sitio web. «A través del entrenamiento, [los modelos] aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores». OpenAI prevé que el nuevo modelo sea utilizado por los investigadores sanitarios para anotar datos de secuenciación celular, por los físicos para generar fórmulas matemáticas y por los desarrolladores de software.
Un ejemplo de su poder según OpenAI: «En un examen de calificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13% de los problemas, mientras que el modelo de razonamiento obtuvo un 83%. Sus habilidades de codificación fueron evaluadas en concursos y alcanzaron el percentil 89 en las competencias de Codeforces».
Con o1, la compañía afirma que está «reiniciando el contador a 1» con un nuevo tipo de modelo de IA diseñado para participar realmente en la resolución de problemas complejos y el pensamiento lógico. En una publicación de blog que detalla el nuevo modelo, OpenAI dijo que se desempeña de manera similar a los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología, y sobresale en matemáticas y codificación.
Los usuarios de ChatGPT Plus y Team podrán acceder a los modelos o1 en ChatGPT a partir de hoy. Tanto o1-preview como o1-mini se pueden seleccionar manualmente en el selector de modelos, y en el lanzamiento, los límites de velocidad semanales serán de 30 mensajes para o1-preview y 50 para o1-mini.
La compañía además comentó que quieren dar el acceso o1-mini a todos los usuarios de ChatGPT Free.
El nuevo modelo, sin embargo, no incluye capacidades como la navegación web o la capacidad de cargar archivos e imágenes. Y, según The Verge, es significativamente más lento en el procesamiento de indicaciones en comparación con GPT-4o. A pesar de tener más tiempo para considerar sus resultados, o1 no ha resuelto el problema de las «alucinaciones», un término para los modelos de IA que componen información. «No podemos decir que resolvimos las alucinaciones», dijo el director de investigación de la compañía, Bob McGrew, a The Verge.