Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

ChatGPT ya habla, ahora también podrá verte

ChatGPT conoce a un perro
IA abierta

El modo de voz avanzado de ChatGPT, que permite a los usuarios conversar con el chatbot en tiempo real, pronto podría obtener el don de la vista, según el código descubierto en la última versión beta de la plataforma. Si bien OpenAI aún no ha confirmado el lanzamiento específico de la nueva función, el código de la versión beta de ChatGPT v1.2024.317 detectado por Android Authority sugiere que la llamada «cámara en vivo» podría estar inminente.

OpenAI había mostrado por primera vez las capacidades de visión del modo de voz avanzado para ChatGPT en mayo, cuando la función se lanzó por primera vez en alfa. Durante una demostración publicada en ese momento, el sistema pudo identificar que estaba mirando a un perro a través de la alimentación de la cámara del teléfono, identificar al perro en función de interacciones pasadas, reconocer la pelota del perro y asociar la relación del perro con la pelota (es decir, jugar a buscar).

Dog meets GPT-4o

La función también fue un éxito inmediato entre los probadores alfa. El usuario de X, Manuel Sainsily, lo empleó con gran efecto para responder preguntas verbales sobre su nuevo gatito basándose en la transmisión de video de la cámara.

Recommended Videos

Trying #ChatGPT’s new Advanced Voice Mode that just got released in Alpha. It feels like face-timing a super knowledgeable friend, which in this case was super helpful — reassuring us with our new kitten. It can answer questions in real-time and use the camera as input too! pic.twitter.com/Xx0HCAc4To

— Manuel Sainsily (@ManuVision) July 30, 2024

El modo de voz avanzado se lanzó posteriormente en versión beta para los suscriptores Plus y Enterprise en septiembre, aunque sin sus capacidades visuales adicionales. Por supuesto, eso no impidió que los usuarios se volvieran locos al probar los límites vocales de la función. Advanced Voice, «ofrece conversaciones más naturales y en tiempo real, te permite interrumpir en cualquier momento y siente y responde a tus emociones», según la compañía.

La adición de ojos digitales sin duda diferenciaría al Modo de Voz Avanzado de los principales competidores de OpenAI, Google y Meta, quienes en los últimos meses han introducido sus propias funciones conversacionales.

Gemini Live puede hablar más de 40 idiomas, pero no puede ver el mundo que le rodea (al menos hasta que Project Astra despegue), ni las Interacciones de Voz Natural de Meta, que debutaron en el evento Connect 2024 en septiembre, pueden usar entradas de cámara.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Adobe entrega una herramienta esencial para Youtube Shorts
Art, Collage, Animal

Adobe ha anunciado una estrategia ambiciosa para consolidarse en el mercado de la edición de video móvil, estrechando lazos con YouTube mediante el lanzamiento de un espacio dedicado dentro de Premiere Mobile para los creadores de Shorts. Esta iniciativa representa un movimiento táctico significativo en el panorama competitivo de las herramientas de creación de contenido, donde gigantes como CapCut y Meta Edits han ganado terreno acelerado en los últimos años.

El nuevo centro de creación "Create for YouTube" se presenta como una solución integral diseñada específicamente para quienes desean producir contenido viral optimizado para la plataforma de Google. Los usuarios tendrán acceso a plantillas exclusivas curadas por creadores de alto rendimiento, transiciones profesionales y efectos visuales preconfigurados, junto con la capacidad de publicar directamente en sus canales de YouTube sin necesidad de cambiar de aplicación. Este flujo de trabajo simplificado busca reducir la fricción que actualmente experimentan los creadores que utilizan herramientas alternativas.

Read more
OpenAI desmiente que la publicidad ya haya aparecido en ChatGPT
Computer, Electronics, Laptop

Nick Turley, líder de ChatGPT en OpenAI, respondió públicamente a crecientes especulaciones sobre la integración de anuncios dentro de la plataforma, proporcionando una aclaración que, paradójicamente, no resuelve completamente las dudas sobre la dirección futura de la compañía. En una publicación en X (anteriormente Twitter), Turley declaró categóricamente que "no hay pruebas en vivo de anuncios" y que "cualquier captura de pantalla que hayas visto no es real o no representa anuncios".

Esta declaración surgió después de que Benjamin De Kraker, un exempleado de xAI, compartiera una imagen mostrando una opción para comprar en Target directamente dentro de una conversación con ChatGPT. La captura generó considerable especulación en línea sobre un posible cambio de modelo comercial. Sin embargo, Daniel McAuley de OpenAI argumentó que se trataba simplemente de una integración de aplicaciones que la compañía había anunciado públicamente en octubre, no de publicidad tradicional. Más tarde, Mark Chen, Chief Research Officer de OpenAI, añadió un matiz importante: reconoció que en este caso específico "no cumplieron adecuadamente" y que "cualquier cosa que parezca un anuncio necesita ser manejada con cuidado".

Read more
Windows 11 gran actualización de diciembre: todo lo nuevo que llega
Windows 11

Este martes 9 de diciembre de 2025, se espera que Microsoft comience a lanzar la última actualización Patch Tuesday de 2025 para Windows 11, que introduce varias funciones significativas, mejoras y correcciones de errores.

En esta actualización, la empresa finalmente está corrigiendo las inconsistencias de diseño entre el menú de Inicio y la Búsqueda de Windows, y una versión actualizada del Explorador de Archivos aporta mejoras en el modo oscuro.

Read more