Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Recommended Videos

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Por qué este 14 de mayo de 2024 las búsquedas de Google empiezan su funeral
Google muere

Las búsquedas de Google, ese cajón casi infinito de respuestas a casi todas nuestras interrogantes cotidianas, ha dado un paso este 14 de mayo de 2024 a su funeral y comienzo de un camino de muerte y transición. Hoy en la conferencia inaugural de Google I/O 2024, el paradigma del tráfico, la manera de encontrar respuestas, está dando un giro radical.

Sí, será un cambio paulatino, nada brusco, pero que comenzará poco a poco a notarse entre usuarios y creadores web. Sobre todo estos últimos que posiblemente verán resentidos sus niveles de ingresos orgánicos y cambiando además las reglas del juego para la monetización y los anuncios.

Leer más
Google te muestra cómo cambiará Gmail con toda la IA de Gemini

A partir de hoy tras ser anunciado en Google I/O 2024, Gemini estará en el panel lateral de Gmail, Documentos, Drive, Presentaciones y Hojas de cálculo usando Gemini 1.5 Pro. Con una ventana de contexto más larga y un razonamiento más avanzado, Géminis puede responder a una variedad más amplia de preguntas y proporcionar respuestas más perspicaces. Además, es fácil comenzar con resúmenes que aparecerán en el panel lateral, indicaciones sugeridas y más.
Gracias a la ventana de contexto más larga, Gemini puede hacer referencia a conjuntos de datos mucho más grandes.
https://twitter.com/Google/status/1790441491338264973
Cómo cambiará Gemini IA la experiencia en Gmail

Resumir los correos electrónicos: Ponerse al día con los largos hilos de correo electrónico puede llevar mucho tiempo desde cualquier dispositivo, pero es especialmente difícil en pantallas pequeñas. Con esta función, Gemini puede analizar los hilos de correo electrónico y proporcionar una vista resumida directamente en la aplicación Gmail. Simplemente toque el botón de resumen en la parte superior de su hilo de correo electrónico para obtener los aspectos más destacados. Esto estará disponible para los usuarios de Workspace Labs este mes, y para todos los clientes de Gemini for Workspace y los suscriptores de Google One AI Premium el próximo mes.
Respuesta inteligente contextual: durante años, los usuarios de Gmail han ahorrado tiempo con las respuestas sugeridas de Respuesta inteligente, las sugerencias a medida que escribes de Redacción inteligente y los borradores de correo electrónico completos de Ayúdame a escribir. Pronto, Gemini en Gmail ofrecerá respuestas sugeridas aún más detalladas y matizadas basadas en el contexto de su hilo de correo electrónico. Con la respuesta inteligente contextual, puede editar o simplemente enviar tal cual. Estará disponible para los usuarios de Workspace Labs en dispositivos móviles y web a partir de julio.
Preguntas y respuestas de Gmail: Pronto, cuando hagas clic en el nuevo icono de Gemini en la aplicación móvil, Gemini en Gmail ofrecerá opciones útiles, como "resumir este correo electrónico", "enumerar los próximos pasos" o "sugerir una respuesta". Y al igual que en el panel lateral del escritorio, puede utilizar el cuadro de solicitud abierto cuando tenga solicitudes más específicas. Por ejemplo, puedes pedirle a Gemini que "encuentre la oferta del contratista de techos" que está enterrada en algún lugar de tu bandeja de entrada. O tal vez no quieras buscar en tu Drive el documento con detalles sobre tu club de lectura. En su lugar, podrías preguntarle a Géminis: "¿Cuáles son las preguntas de discusión para mi próxima reunión del club de lectura?" Las preguntas y respuestas de Gmail estarán disponibles para los usuarios de Workspace Labs en dispositivos móviles y en la Web a partir de julio.

Leer más
Google adelanta con un video que Gemini competirá con GPT-4o
google video gemini compite gpt 4o

Acusando el golpe estratégico de GPT-4o, la gente de Google hizo un adelanto de su conferencia magistral Google I/O 2024, mostrando las nuevas potencialidades de Gemini AI con un video.

Y para eso se adelantó unas horas a lo que anunciaría Sam Altman y compañía.

Leer más