Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. Features

OpenAI presenta GPT-4o: su nuevo modelo que conversa contigo

Digital Trends Español

OpenAI está lanzando un nuevo modelo insignia de IA generativa llamado GPT-4o, que se implementará «iterativamente» en todos los productos de la compañía en las próximas semanas.

El CTO de OpenAI, Muri Murati, dijo que GPT-4o proporciona inteligencia de «nivel GPT-4», pero mejora las capacidades de GPT-4 en texto y visión, así como en audio.

Recommended Videos

«GPT-4o razona a través de la voz, el texto y la visión», dijo Murati en una presentación en las oficinas de OpenAI.

En una demostración en vivo, dos ingenieros de OpenAI pudieron hablar y razonar incluso con un ejercicio matemático con un ChatGPT que les respondía de manera consistente y rápida.

GPT-4o
Digital Trends Español

GPT-4o mejora en gran medida la experiencia de ChatGPT: ChatGPT es el chatbot viral impulsado por IA de OpenAI. ChatGPT ha ofrecido durante mucho tiempo un modo de voz que transcribe texto de ChatGPT utilizando un modelo de texto a voz. GPT-4o potencia esto, permitiendo a los usuarios interactuar con ChatGPT como un asistente.

Una de las demostraciones más poderosas además fue la traducción en directo de una conversación del italiano al inglés.

Acá hay una muestra cortesía de Techcrunch:

OpenAI's new generative AI model GPT-4o | TechCrunch

La definición de OpenAI

«GPT-4o («o» de «omni») es un paso hacia una interacción humano-computadora mucho más natural: acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen. Puede responder a las entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar a Tiempo de respuesta humana en una conversación. Iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en el texto en idiomas distintos del inglés, a la vez que es mucho más rápido y un 50% más barato en la API. GPT-4o es especialmente mejor en la visión y la comprensión del audio en comparación con los modelos existentes».

«Antes de GPT-4o, podías usar el modo de voz para hablar con ChatGPT con latencias de 2,8 segundos (GPT-3,5) y 5,4 segundos (GPT-4) de media. Para lograr esto, el modo de voz es una canalización de tres modelos separados: un modelo simple transcribe audio a texto, GPT-3.5 o GPT-4 toma texto y emite texto, y un tercer modelo simple convierte ese texto nuevamente en audio. Este proceso significa que la principal fuente de inteligencia, GPT-4, pierde mucha información: no puede observar directamente el tono, los múltiples altavoces o los ruidos de fondo, y no puede emitir risas, cantos o expresar emociones.

Con GPT-4o, entrenamos un único modelo nuevo de extremo a extremo a través de texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal. Debido a que GPT-4o es nuestro primer modelo que combina todas estas modalidades, todavía estamos arañando la superficie de la exploración de lo que el modelo puede hacer y sus limitaciones».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Mozilla sacará un Interruptor de Apagón Real de IA
Computer, Computer Hardware, Computer Keyboard

Mozilla promete un interruptor de apagón para Firefox con IA, pero pronto no lo conseguirás. En respuesta a una carta abierta de Reddit dirigida al nuevo CEO de Mozilla, una figura de Mozilla que publica como usuario anthony-firefox dijo que un verdadero interruptor de apagado para desactivar funciones de IA llegará en el primer trimestre de 2026.

Esa respuesta intenta tranquilizar a los usuarios ansiosos en dos frentes: Firefox tiene que servir a "casi todo el mundo" (desarrolladores, usuarios de Linux, estudiantes, padres y personas que nunca cambian un valor por defecto), y se mantendrá construido en torno al control del usuario. La carta, escrita por un desarrollador autodenominado y usuario corriente, sostiene que el problema es menos ambición y más cumplir con el seguimiento, especialmente cuando el feedback no recibe respuesta.

Read more
Se filtran los laptops gamers de Lenovo que quieren revolucionar todo
Computer, Electronics, Laptop

Los laptops filtrados Copilot+ Legion de Lenovo suenan menos a un intento bruto de agarrar poder y más a un intento de hacer que los portátiles gaming sean más fáciles de manejar. Según un informe de Windows Latest Informe, Lenovo está preparando nuevos modelos Legion 7a y Legion 5a para una presentación del CES 2026, construida en torno a procesadores AMD Ryzen AI serie 400 no anunciados y GPUs NVIDIA GeForce RTX serie 50 para portátiles.

La idea es que Lenovo AI Engine+ trabaje con Legion Space para ajustar la potencia, la velocidad del ventilador y la eficiencia en tiempo real. La idea, tal y como se describe en la filtración, es que pasarías menos tiempo ajustando perfiles cuando cambias entre juegos, streaming y trabajo de creador.

Read more
El próximo teclado autocargable de Lenovo cubrirá tus necesidades
Computer, Computer Hardware, Computer Keyboard

Aunque no ha habido un avance significativo en dispositivos de entrada como los teclados, Lenovo podría cambiar eso en el CES 2026. Según un informe de Windows Latest, la empresa está trabajando en una combinación de teclado y ratón autocargables, otra combinación translúcida y un teclado inteligente adaptativo.

El producto más singular de las filtraciones es algo llamado "Lenovo Self-Charging Kit Concept". Según se informa, obtiene energía de la poca iluminación interior (tan baja como 50 lux) y se carga sola cuando la usas en interiores. Aunque esta tecnología es similar a los teclados solares de Logitech, también funciona sin luz solar directa.

Read more