DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Recommended Videos

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Recomendaciones del editor

Topics
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Cómo Google cerró el círculo de la omnipresencia con Drive

Nadie duda que Google está en todas partes. Sin embargo, gran parte de su omnipresencia actual comenzó a cerrarse hace nueve años, con la llegada de Google Drive.

El 24 de abril de 2012, el gigante de las búsquedas anunciaba su plataforma de almacenamiento en la nube, en un abierto desafío a Dropbox, que entonces reinaba con holgura en este mercado.

Leer más
Celebra este 4 de julio con béisbol y juegos pirotécnicos en el Google Doodle

Esta semana se celebra la independencia de los Estados Unidos que tiene su apogeo el 4 de Julio, un día de fiesta nacional caracterizado por parrilladas, festivales, conciertos, y -por supuesto- una gran variedad de juegos pirotécnicos que se han convertido en una tradición. Y parece que Google quiere unirse a la celebración.

Por eso, el Google Doodle de este año presenta un juego interactivo que representa uno de los deportes más representativos de este país: el béisbol, en un estilo divertido para chicos y grandes, y con personajes inspirados en los elementos de comida más populares en estas época. El creativo juego, que apareció en la página de inicio que Google usa para celebrar fechas o personajes relevantes, fue publicado un día antes del 4 de julio para alentar la exploración y diversión de quienes residen en los Estados Unidos, mientras planifican sus festividades y comidas al aire libre.

Leer más
¿Windows 10 está teniendo una noche de los muertos vivientes?

Microsoft sigue luchando con la adopción de Windows 11 entre sus usuarios. Datos recientes de Statcounter revelan una notable disminución en la cuota de mercado del sistema operativo, específicamente en comparación con Windows 10.

Después de alcanzar un máximo histórico del 28,16% en febrero de 2024, Windows 11 ha experimentado una caída, cayendo por debajo de la marca del 26%.

Leer más