Skip to main content

ChatGPT ya habla, ahora también podrá verte

ChatGPT conoce a un perro
IA abierta

El modo de voz avanzado de ChatGPT, que permite a los usuarios conversar con el chatbot en tiempo real, pronto podría obtener el don de la vista, según el código descubierto en la última versión beta de la plataforma. Si bien OpenAI aún no ha confirmado el lanzamiento específico de la nueva función, el código de la versión beta de ChatGPT v1.2024.317 detectado por Android Authority sugiere que la llamada «cámara en vivo» podría estar inminente.

OpenAI había mostrado por primera vez las capacidades de visión del modo de voz avanzado para ChatGPT en mayo, cuando la función se lanzó por primera vez en alfa. Durante una demostración publicada en ese momento, el sistema pudo identificar que estaba mirando a un perro a través de la alimentación de la cámara del teléfono, identificar al perro en función de interacciones pasadas, reconocer la pelota del perro y asociar la relación del perro con la pelota (es decir, jugar a buscar).

Dog meets GPT-4o

La función también fue un éxito inmediato entre los probadores alfa. El usuario de X, Manuel Sainsily, lo empleó con gran efecto para responder preguntas verbales sobre su nuevo gatito basándose en la transmisión de video de la cámara.

Recommended Videos

Trying #ChatGPT’s new Advanced Voice Mode that just got released in Alpha. It feels like face-timing a super knowledgeable friend, which in this case was super helpful — reassuring us with our new kitten. It can answer questions in real-time and use the camera as input too! pic.twitter.com/Xx0HCAc4To

— Manuel Sainsily (@ManuVision) July 30, 2024

El modo de voz avanzado se lanzó posteriormente en versión beta para los suscriptores Plus y Enterprise en septiembre, aunque sin sus capacidades visuales adicionales. Por supuesto, eso no impidió que los usuarios se volvieran locos al probar los límites vocales de la función. Advanced Voice, «ofrece conversaciones más naturales y en tiempo real, te permite interrumpir en cualquier momento y siente y responde a tus emociones», según la compañía.

La adición de ojos digitales sin duda diferenciaría al Modo de Voz Avanzado de los principales competidores de OpenAI, Google y Meta, quienes en los últimos meses han introducido sus propias funciones conversacionales.

Gemini Live puede hablar más de 40 idiomas, pero no puede ver el mundo que le rodea (al menos hasta que Project Astra despegue), ni las Interacciones de Voz Natural de Meta, que debutaron en el evento Connect 2024 en septiembre, pueden usar entradas de cámara.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Sam Altman critica a su ChatGPT: su personalidad es molesta y sus últimos modelos alucinan mucho
Sam Altman

El CEO de OpenAI, Sam Altman, admitió anoche que las últimas actualizaciones de GPT-4o han afectado a la personalidad del chatbot, y no en el buen sentido.

Si utilizas ChatGPT con la suficiente frecuencia, es posible que hayas notado un cambio en su comportamiento últimamente. Parte de esto puede deberse a su memoria, ya que en mi experiencia, el chatbot se dirige a ti de manera diferente cuando no se basa en chats anteriores para guiar la forma en que (potencialmente) querrías que respondiera. Sin embargo, parte de esto es solo que en algún momento del camino, OpenAI ha convertido a ChatGPT en el llamado "hombre del sí", una herramienta que está de acuerdo contigo en lugar de desafiarte y, a veces, el resultado puede ser un poco desagradable.

Leer más
Ranking de los mejores chatbots: Grok explota en crecimiento, pero ¿quién es el rey: ChatGPT, Gemini, DeepSeek?
Grok

La nueva carrera frenética en el mundo de la tecnología es la de los chatbots de IA, donde han habido cambios significativos en el ranking de los mejores (basados en cifras de usuarios), según  el directorio de herramientas de IA aitools.xyz.

El mercado experimentó cambios significativos en marzo de 2025. ChatGPT lideró con un aumento de 400 millones de visitas intermensuales, alcanzando los 5.600 millones de visitas. Grok experimentó el crecimiento más explosivo, añadiendo 105,4 millones de visitas para un aumento del 193,04%, superando a competidores como DeepSeek y Gemini.

Leer más
La investigación profunda de ChatGPT ahora será gratis y más ligera
ChatGPT

Hay mucho bombo publicitario sobre la IA flotando por ahí, y parece que todas las marcas quieren incluirlo en sus productos. Pero también hay algunas herramientas notablemente útiles, aunque son bastante caras. La investigación profunda de ChatGPT es una de esas características, y parece que OpenAI finalmente se siente un poco generoso al respecto.

La compañía ha creado una versión ligera de Deep Research que funciona con su nuevo modelo de lenguaje o4-mini. OpenAI dice que esta variante es "más rentable al tiempo que conserva la alta calidad". Más importante aún, está disponible para su uso de forma gratuita sin ninguna advertencia de suscripción.

Leer más