Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Recommended Videos

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Google arregló la pizza: dice que mejoró su búsqueda por IA para evitar errores
Google pizza

Google no quiere pasar más bochornos después de anunciar con bombos y platillos en Google I/O 2024 que AI Overview se implementaría como la nueva forma de buscar en internet.

Esto después de que diversos resultados, incluida una receta de pizza con pegamento, dejaron en vergüenza a los de Mountain View.

Leer más
Vi el futurista Proyecto Astra de Google, y me dejó boquiabierto
proyecto astra google me dejo boquiabierto

El periodista de DT en inglés, Joe Maring, estuvo presente en Google I/O y estuvo en presencia de un proyecto revolucionario.

Si hay algo que salió de Google I/O 2024 que realmente me llamó la atención, es el Proyecto Astra de Google. En resumen, Astra es un nuevo asistente de IA con capacidades de voz, visión, texto y memoria. Puedes hablarle como si fuera otra persona en la habitación, pedirle que describa las cosas que ve e incluso pedirle que recuerde información sobre esas cosas.

Leer más
Por qué este 14 de mayo de 2024 las búsquedas de Google empiezan su funeral
Google muere

Las búsquedas de Google, ese cajón casi infinito de respuestas a casi todas nuestras interrogantes cotidianas, ha dado un paso este 14 de mayo de 2024 a su funeral y comienzo de un camino de muerte y transición. Hoy en la conferencia inaugural de Google I/O 2024, el paradigma del tráfico, la manera de encontrar respuestas, está dando un giro radical.

Sí, será un cambio paulatino, nada brusco, pero que comenzará poco a poco a notarse entre usuarios y creadores web. Sobre todo estos últimos que posiblemente verán resentidos sus niveles de ingresos orgánicos y cambiando además las reglas del juego para la monetización y los anuncios.

Leer más