Skip to main content

ChatGPT ya habla, ahora también podrá verte

ChatGPT conoce a un perro
IA abierta

El modo de voz avanzado de ChatGPT, que permite a los usuarios conversar con el chatbot en tiempo real, pronto podría obtener el don de la vista, según el código descubierto en la última versión beta de la plataforma. Si bien OpenAI aún no ha confirmado el lanzamiento específico de la nueva función, el código de la versión beta de ChatGPT v1.2024.317 detectado por Android Authority sugiere que la llamada «cámara en vivo» podría estar inminente.

OpenAI había mostrado por primera vez las capacidades de visión del modo de voz avanzado para ChatGPT en mayo, cuando la función se lanzó por primera vez en alfa. Durante una demostración publicada en ese momento, el sistema pudo identificar que estaba mirando a un perro a través de la alimentación de la cámara del teléfono, identificar al perro en función de interacciones pasadas, reconocer la pelota del perro y asociar la relación del perro con la pelota (es decir, jugar a buscar).

Dog meets GPT-4o

La función también fue un éxito inmediato entre los probadores alfa. El usuario de X, Manuel Sainsily, lo empleó con gran efecto para responder preguntas verbales sobre su nuevo gatito basándose en la transmisión de video de la cámara.

Recommended Videos

Trying #ChatGPT’s new Advanced Voice Mode that just got released in Alpha. It feels like face-timing a super knowledgeable friend, which in this case was super helpful — reassuring us with our new kitten. It can answer questions in real-time and use the camera as input too! pic.twitter.com/Xx0HCAc4To

— Manuel Sainsily (@ManuVision) July 30, 2024

El modo de voz avanzado se lanzó posteriormente en versión beta para los suscriptores Plus y Enterprise en septiembre, aunque sin sus capacidades visuales adicionales. Por supuesto, eso no impidió que los usuarios se volvieran locos al probar los límites vocales de la función. Advanced Voice, «ofrece conversaciones más naturales y en tiempo real, te permite interrumpir en cualquier momento y siente y responde a tus emociones», según la compañía.

La adición de ojos digitales sin duda diferenciaría al Modo de Voz Avanzado de los principales competidores de OpenAI, Google y Meta, quienes en los últimos meses han introducido sus propias funciones conversacionales.

Gemini Live puede hablar más de 40 idiomas, pero no puede ver el mundo que le rodea (al menos hasta que Project Astra despegue), ni las Interacciones de Voz Natural de Meta, que debutaron en el evento Connect 2024 en septiembre, pueden usar entradas de cámara.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Ya puedes probar ChatGPT Search gratis
chatgpt search

Como parte de su evento "12 Days of OpenAI", OpenAI tiene otra actualización para ChatGPT, esta vez llevando su función de búsqueda al nivel gratuito. Anteriormente, la alternativa de la Búsqueda de Google era solo para suscriptores pagos en los niveles ChatGPT Plus o Pro.

"Lo lanzamos para los usuarios de pago hace unos dos meses", dijo Kevin Weil, director de producto de OpenAI, durante la transmisión en vivo del lunes. "No puedo imaginar ChatGPT sin Search ahora. Lo uso muy a menudo. Estoy muy emocionado de traerlo a todos ustedes de forma gratuita a partir de hoy".

Leer más
Esta última función de ChatGPT ahora es gratis
ChatGPT: qué es y cómo usar el chatbot del que todo el mundo habla.

IA abierta
En octubre, OpenAI debutó con su función Canvas, una interfaz colaborativa que previsualiza la respuesta de la IA a la solicitud de escritura o codificación del usuario. Sin embargo, solo estuvo disponible como una función beta para los suscriptores de Plus y Teams. El martes, la compañía anunció que está llevando Canvas a todos los usuarios, incluso en el nivel gratuito.

Si bien uno podría confundir fácilmente Canvas con una imitación flagrante de la función Artifacts de Anthropic, OpenAI también está incorporando una serie de nuevas capacidades en Canvas. Por un lado, Canvas ahora está integrado directamente en el modelo GPT-4o para que se ejecute de forma nativa dentro de ChatGPT, eliminando la necesidad de seleccionarlo específicamente de la lista de selección de modelos.

Leer más
Sora el generador de video de OpenAI se incorpora a los planes ChatGPT
sora generador video openai incorpora planes chatgpt

Después de varias demostraciones durante 2024, finalmente este último mes del año, OpenAI acaba de anunciar que Sora, su generador de IA de texto a video, saldrá al ruedo comercial y estará presente en los planes de pago de ChatGPT: el Plus y el Pro.

Lo primero que ha enseñado OpenAI (con Sam Altman en escena) es Explore, un repositorio donde los usuarios pueden descubrir y compartir sus creaciones. Como la generación de vídeo va a ser complicada, acompañan a los vídeos los prompts introducidos para llegar a crear algo así.

Leer más