Skip to main content
  1. Home
  2. Computación
  3. Features

DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Add as a preferred source on Google

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Recommended Videos

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
Nvidia actualiza su aplicación con DLSS 4.5 con nuevas funciones mejoradas
NVIDIA

Nvidia ha lanzado una actualización sustancial de su aplicación móvil, introduciendo la versión 4.5 de su tecnología DLSS (Deep Learning Super Sampling) junto con diversas mejoras en el panel de control de funciones gráficas.

La nueva versión de DLSS 4.5 representa un avance significativo en la optimización de rendimiento para usuarios de dispositivos móviles compatibles. Esta actualización permite que los usuarios experimenten mejor escalabilidad gráfica, reduciendo la demanda de procesamiento mientras mantienen una calidad visual superior. La tecnología de aprendizaje profundo de Nvidia continúa evolucionando para entregar resultados más refinados y naturales.

Read more
Por fin puedes desinstalar Microsoft Copilot en Windows 11, pero…
Art, Tape, Landmark

Microsoft finalmente permite que algunos usuarios eliminen Copilot de Windows, pero la letra pequeña deja claro que no es el corte limpio que muchos esperaban. Tras llevar Copilot a fondo en Windows 11, Microsoft ha introducido una nueva opción en una reciente versión de Windows 11 Insider Preview que permite desinstalar completamente Copilot.

La cuestión es que solo funciona en situaciones muy concretas, y la mayoría de los usuarios habituales no cumplen los requisitos. Hasta ahora, Copilot podía desactivarse o ocultarse, pero no podía eliminarse por completo. Eso cambia con una nueva configuración de Directiva de Grupo llamada RemoveMicrosoftCopilotApp, que aparece en las últimas versiones de Insider sobre los canales Developer y Beta.

Read more
La máquina pensante: así es el libro sobre el CEO de Nvidia
Libro la máquina pensante

En junio de 2024, impulsada por el auge de la inteligencia artificial tras el lanzamiento de ChatGPT, Nvidia se convirtió en la corporación más valiosa del mundo. Tres décadas después de su fundación en un restaurante Denny’s, la compañía pasó de fabricar componentes para videojuegos a liderar el mercado global del hardware para IA. Esta transformación histórica es el eje central de La máquina pensante, el nuevo libro del periodista Stephen Witt.

En esta obra, Witt narra cómo Jensen Huang, cofundador y director general de Nvidia, apostó hace más de una década por una tecnología que entonces parecía marginal: la inteligencia artificial. Una decisión arriesgada que terminó redefiniendo la arquitectura del ordenador moderno y situando a la compañía en el centro de la revolución tecnológica actual.

Read more