Skip to main content
  1. Home
  2. Computación
  3. Features

DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Recommended Videos

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
CES 2026 responderá a grandes preguntas sobre las GPUs RTX 50 Super
Photography, Clothing, Coat

Con su arquitectura Blackwell bien establecida en centros de datos de IA, servicios en la nube, estaciones de trabajo y ordenadores de sobremesa/portátiles, el evento de prensa CES 2026 de Nvidia probablemente se centrará menos en los nuevos lanzamientos. Más bien, se espera que la compañía profundice en los refinamientos, las señales de hoja de ruta y cómo planea impulsar su pila de hardware y software durante el próximo año.

Nvidia ha confirmado que el fundador y CEO Jensen Huang ofrecerá la ponencia inaugural del CES el 5 de enero, un día antes de la apertura principal del CES. CES se ha convertido en una de las etapas más importantes del año para Nvidia, aunque la compañía no esté lanzando una nueva generación de GPUs.

Read more
Olvídate de la Galaxy S26: esto presentará Samsung en CES 2026
Computer Hardware, Electronics, Hardware

Una de las mayores empresas a seguir en CES 2026, un evento tecnológico anual que este año comienza el 6 de enero, es Samsung. De hecho, probablemente deberías dejar una marca antes en tu calendario: la rueda de prensa vinculada de la marca coreana comienza antes del CES, el 4 de enero.

No, no es donde veremos a la familia Samsung Galaxy S26. O la Galaxy Tab S12, o los Buds 4 o el Watch 9 o cualquier otra tecnología móvil que anheles de la marca. Probablemente lleguen a finales de enero o en febrero, pero lo que Samsung muestre podría ser igual de interesante.

Read more
ChatGPT Go llega a Latinoamérica de la mano de Rappi
Rappi

OpenAI anunció ChatGPT Go en Latinoamérica, un nuevo plan por suscripción diseñado para ampliar el acceso a las capacidades avanzadas de ChatGPT. Esta es una nueva versión premium de menor costo, alternativa entre las opciones gratuita y Plus y llega al mercado con beneficios para los usuarios Rappi, quienes podrán obtenerla hasta por seis meses de manera gratuita.

Los suscriptores de ChatGPT Go, incluyendo aquellos que son usuarios de Rappi, obtendrán acceso a algunas de las características más populares de ChatGPT con mayor límite de mensajes, generación de imágenes, carga de archivos y memoria. Este nuevo plan permitirá que más personas aprovechen los beneficios más avanzados de la IA para las necesidades cotidianas, ya sean traducciones y tutorías hasta apoyo en escritura, aprendizaje o guía paso a paso para realizar distintas tareas.

Read more