Skip to main content

ChatGPT ya habla, ahora también podrá verte

ChatGPT conoce a un perro
IA abierta

El modo de voz avanzado de ChatGPT, que permite a los usuarios conversar con el chatbot en tiempo real, pronto podría obtener el don de la vista, según el código descubierto en la última versión beta de la plataforma. Si bien OpenAI aún no ha confirmado el lanzamiento específico de la nueva función, el código de la versión beta de ChatGPT v1.2024.317 detectado por Android Authority sugiere que la llamada «cámara en vivo» podría estar inminente.

OpenAI había mostrado por primera vez las capacidades de visión del modo de voz avanzado para ChatGPT en mayo, cuando la función se lanzó por primera vez en alfa. Durante una demostración publicada en ese momento, el sistema pudo identificar que estaba mirando a un perro a través de la alimentación de la cámara del teléfono, identificar al perro en función de interacciones pasadas, reconocer la pelota del perro y asociar la relación del perro con la pelota (es decir, jugar a buscar).

Dog meets GPT-4o

La función también fue un éxito inmediato entre los probadores alfa. El usuario de X, Manuel Sainsily, lo empleó con gran efecto para responder preguntas verbales sobre su nuevo gatito basándose en la transmisión de video de la cámara.

Recommended Videos

Trying #ChatGPT’s new Advanced Voice Mode that just got released in Alpha. It feels like face-timing a super knowledgeable friend, which in this case was super helpful — reassuring us with our new kitten. It can answer questions in real-time and use the camera as input too! pic.twitter.com/Xx0HCAc4To

— Manuel Sainsily (@ManuVision) July 30, 2024

El modo de voz avanzado se lanzó posteriormente en versión beta para los suscriptores Plus y Enterprise en septiembre, aunque sin sus capacidades visuales adicionales. Por supuesto, eso no impidió que los usuarios se volvieran locos al probar los límites vocales de la función. Advanced Voice, «ofrece conversaciones más naturales y en tiempo real, te permite interrumpir en cualquier momento y siente y responde a tus emociones», según la compañía.

La adición de ojos digitales sin duda diferenciaría al Modo de Voz Avanzado de los principales competidores de OpenAI, Google y Meta, quienes en los últimos meses han introducido sus propias funciones conversacionales.

Gemini Live puede hablar más de 40 idiomas, pero no puede ver el mundo que le rodea (al menos hasta que Project Astra despegue), ni las Interacciones de Voz Natural de Meta, que debutaron en el evento Connect 2024 en septiembre, pueden usar entradas de cámara.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El ChatGPT francés de código abierto se pone los pantalones
La imagen muestra una representación de un chatbot.

Andrés Tarantola / Mistral
La startup francesa de IA Mistral anunció el lunes que está incorporando media docena de nuevas características y capacidades en su asistente de trabajo gratuito de IA generativa, apodado le Chat (francés para "el gato"), que pondrán al chatbot de código abierto a la par con los principales modelos fronterizos de OpenAI y Anthropic.

Le Chat ahora puede buscar en la web y proporcionar fuentes citadas, de manera similar a lo que ofrecen Perplexity y SearchGPT. El chatbot de Mistral ahora también ofrece una función de lienzo similar a Claude's Artifacts, donde los usuarios pueden modificar y editar contenido y código. Además, le Chat ahora puede generar imágenes gracias a una integración con Flux Pro de Black Forest Labs, el mismo generador de imágenes que impulsa las capacidades de Grok-2.

Leer más
Esta actualización masiva de ChatGPT llegará en enero, y no es GPT-5
ChatGPT

OpenAI lanzará un nuevo agente de IA en enero, con el nombre en clave Operator, que permitirá a ChatGPT actuar en nombre del usuario. Es posible que nunca más tenga que reservar sus propios vuelos.

El liderazgo de la compañía hizo el anuncio durante una reunión de personal el miércoles, informa Bloomberg. La compañía planea implementar la nueva función como una vista previa de la investigación a través de la API para desarrolladores de la compañía.

Leer más
¿La IA ya se está estancando? GPT-5 podría estar en problemas
gpt 5 en problemas solen feyissa hwsnt pp4x4 unsplash

El modelo Orion de próxima generación de ChatGPT de OpenAI, que se rumorea y se niega que llegue a finales de año, puede que no sea todo lo que se ha promocionado una vez que llegue, según un nuevo informe de The Information.

Citando a empleados anónimos de OpenAI, el informe afirma que el modelo Orion ha mostrado una mejora "mucho menor" con respecto a su predecesor GPT-4 que la que GPT-4 mostró con respecto a GPT-3. Esas fuentes también señalan que Orion "no es confiablemente mejor que su predecesor [GPT-4] en el manejo de ciertas tareas", específicamente en aplicaciones de codificación, aunque el nuevo modelo es notablemente más fuerte en las capacidades generales del lenguaje, como resumir documentos o generar correos electrónicos.

Leer más