Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. Features

OpenAI presenta GPT-4o: su nuevo modelo que conversa contigo

Add as a preferred source on Google
Digital Trends Español

OpenAI está lanzando un nuevo modelo insignia de IA generativa llamado GPT-4o, que se implementará «iterativamente» en todos los productos de la compañía en las próximas semanas.

El CTO de OpenAI, Muri Murati, dijo que GPT-4o proporciona inteligencia de «nivel GPT-4», pero mejora las capacidades de GPT-4 en texto y visión, así como en audio.

Recommended Videos

«GPT-4o razona a través de la voz, el texto y la visión», dijo Murati en una presentación en las oficinas de OpenAI.

En una demostración en vivo, dos ingenieros de OpenAI pudieron hablar y razonar incluso con un ejercicio matemático con un ChatGPT que les respondía de manera consistente y rápida.

GPT-4o
Digital Trends Español

GPT-4o mejora en gran medida la experiencia de ChatGPT: ChatGPT es el chatbot viral impulsado por IA de OpenAI. ChatGPT ha ofrecido durante mucho tiempo un modo de voz que transcribe texto de ChatGPT utilizando un modelo de texto a voz. GPT-4o potencia esto, permitiendo a los usuarios interactuar con ChatGPT como un asistente.

Una de las demostraciones más poderosas además fue la traducción en directo de una conversación del italiano al inglés.

Acá hay una muestra cortesía de Techcrunch:

OpenAI's new generative AI model GPT-4o | TechCrunch

La definición de OpenAI

«GPT-4o («o» de «omni») es un paso hacia una interacción humano-computadora mucho más natural: acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen. Puede responder a las entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar a Tiempo de respuesta humana en una conversación. Iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en el texto en idiomas distintos del inglés, a la vez que es mucho más rápido y un 50% más barato en la API. GPT-4o es especialmente mejor en la visión y la comprensión del audio en comparación con los modelos existentes».

«Antes de GPT-4o, podías usar el modo de voz para hablar con ChatGPT con latencias de 2,8 segundos (GPT-3,5) y 5,4 segundos (GPT-4) de media. Para lograr esto, el modo de voz es una canalización de tres modelos separados: un modelo simple transcribe audio a texto, GPT-3.5 o GPT-4 toma texto y emite texto, y un tercer modelo simple convierte ese texto nuevamente en audio. Este proceso significa que la principal fuente de inteligencia, GPT-4, pierde mucha información: no puede observar directamente el tono, los múltiples altavoces o los ruidos de fondo, y no puede emitir risas, cantos o expresar emociones.

Con GPT-4o, entrenamos un único modelo nuevo de extremo a extremo a través de texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal. Debido a que GPT-4o es nuestro primer modelo que combina todas estas modalidades, todavía estamos arañando la superficie de la exploración de lo que el modelo puede hacer y sus limitaciones».

Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
China recupera la cima del ranking de supercomputadoras con LineShine
Electronics, Hardware, Computer

China volvió a colocarse en lo más alto de la clasificación mundial de supercomputadoras tras tres años de ausencia en los primeros puestos. El sistema LineShine, instalado en el Centro Nacional de Supercomputación de Shenzhen, fue coronado como el más veloz del planeta en la edición de junio de 2026 del listado TOP500, la referencia semestral más importante del sector, elaborada por investigadores de universidades de Estados Unidos y Alemania.

Lo que distingue a LineShine más allá de su velocidad es su composición tecnológica: el sistema utiliza chips de diseño completamente nacional, lo que convierte este logro no solo en un hito de rendimiento, sino también en una señal política de la autosuficiencia tecnológica que Beijing ha buscado proyectar ante las restricciones de exportación impuestas por Washington en los últimos años.

Read more
Windows 11 lleva años destruyendo silenciosamente tu SSD con la función hibernar
La característica que creías inocente esconde un mecanismo que castiga tu disco sólido con decenas de terabytes de escritura al año — y la mayoría de los usuarios ni lo sabe.
Computer, Electronics, Laptop

Hay procesos que ocurren dentro de tu computador que nunca ves, pero que están teniendo consecuencias muy reales sobre el hardware que compraste. Uno de ellos sucede cada vez que presionas "hibernar" en Windows 11. Parece un gesto pequeño, casi trivial. Pero detrás de esa acción, el sistema operativo ejecuta una operación que, repetida día tras día, puede estar consumiendo silenciosamente la vida útil de tu SSD a un ritmo alarmante.

El problema que nadie te advirtió

Read more
Nvidia asegura haber eliminado el consumo de agua en sus centros de datos 
nvidia-chip

En plena London Climate Week, Nvidia presentó una solución que, según la compañía, resuelve uno de los problemas ambientales más acuciantes de la industria de la inteligencia artificial: el enorme consumo de agua que requieren los centros de datos para mantener sus procesadores a temperatura. La empresa afirma haber logrado una reducción del 100% en el uso de agua gracias a un innovador diseño de enfriamiento líquido de circuito cerrado.

El sistema funciona haciendo circular una mezcla de agua y propilenglicol, similar al líquido anticongelante que se usa en los automóviles, a través de circuitos sellados que operan a 45 grados Celsius. Al tratarse de un circuito completamente cerrado, el agua no se evapora, lo que elimina la necesidad de refrigeración por evaporación, el método que históricamente ha requerido millones de litros de agua por año en instalaciones de gran escala.

Read more