Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Recomendaciones del editor

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Cómo Google cerró el círculo de la omnipresencia con Drive
Google Drive

Nadie duda que Google está en todas partes. Sin embargo, gran parte de su omnipresencia actual comenzó a cerrarse hace nueve años, con la llegada de Google Drive.

El 24 de abril de 2012, el gigante de las búsquedas anunciaba su plataforma de almacenamiento en la nube, en un abierto desafío a Dropbox, que entonces reinaba con holgura en este mercado.

Leer más
Celebra este 4 de julio con béisbol y juegos pirotécnicos en el Google Doodle
google doodle 4 de julio 0

Esta semana se celebra la independencia de los Estados Unidos que tiene su apogeo el 4 de Julio, un día de fiesta nacional caracterizado por parrilladas, festivales, conciertos, y -por supuesto- una gran variedad de juegos pirotécnicos que se han convertido en una tradición. Y parece que Google quiere unirse a la celebración.

Por eso, el Google Doodle de este año presenta un juego interactivo que representa uno de los deportes más representativos de este país: el béisbol, en un estilo divertido para chicos y grandes, y con personajes inspirados en los elementos de comida más populares en estas época. El creativo juego, que apareció en la página de inicio que Google usa para celebrar fechas o personajes relevantes, fue publicado un día antes del 4 de julio para alentar la exploración y diversión de quienes residen en los Estados Unidos, mientras planifican sus festividades y comidas al aire libre.

Leer más
Los 6 mejores laptops para ingenieros en 2024
mejores laptops para ingenieros samsung galaxy book3 pro 360

La ingeniería puede ser muy difícil, desde las largas noches hasta la gran responsabilidad; Si no tienes las herramientas adecuadas para hacer las cosas correctamente, puede resultar abrumador. Afortunadamente, la mayor parte de la ingeniería moderna ocurre con la asistencia de una computadora, por lo que tener una PC sólida es importante tanto para hacer un buen trabajo como para mantener su salud mental para que no tenga problemas con sus herramientas. Es por eso que hemos salido y elegimos nuestras computadoras portátiles de ingeniería favoritas y las hemos puesto a continuación para que las revise. Si bien es cierto que hay una gran cantidad de tipos diferentes de ingeniería, la mayoría de estos deberían encajar en todos los ámbitos porque tienen procesadores potentes y mucha RAM con la que trabajar.
Los mejores portátiles para ingenieros en 2024

Compra el ASUS ROG Zephyrus M16 si quieres el mejor portátil para ingenieros
Compra el MacBook Air 15 M3 si quieres el mejor portátil MacBook para ingenieros
Compra el Samsung Galaxy Book3 Pro 360 si quieres el mejor portátil 2 en 1 para ingenieros
Compra el LG Gram 17 si quieres el mejor portátil delgado y portátil para ingenieros
Compre el Legion Pro 5 Gen 8 si desea la computadora portátil con la mejor relación calidad-precio para ingenieros

Leer más