Skip to main content
  1. Home
  2. Computación
  3. Features

DT en Español podría recibir una comisión si compras un producto desde el sitio

El burdo engaño de Google con su demostración de Gemini

Add as a preferred source on Google

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado «Hands-on with Gemini: Interacting with multimodal AI», no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Hands-on with Gemini: Interacting with multimodal AI

¿Qué se ve en el video?: En 6 minutos muestra las capacidades multimodales de Gemini (indicaciones conversacionales habladas combinadas con reconocimiento de imágenes, por ejemplo). Aparentemente, Gemini reconoce las imágenes rápidamente, incluso para las imágenes que conectan los puntos, responde en segundos y rastrea un fajo de papel en un juego de taza y pelota en tiempo real. Claro, los humanos pueden hacer todo eso, pero esta es una IA capaz de reconocer y predecir lo que sucederá a continuación.

Recommended Videos

Sin embargo, en la descripción del video se puede leer: «Para los propósitos de esta demostración, la latencia se ha reducido y las salidas de Gemini se han acortado para mayor brevedad».

La demostración de video no ocurrió en tiempo real con indicaciones habladassino que usó fotogramas de imágenes fijas de imágenes sin procesar y luego escribió indicaciones de texto a las que Gemini respondió. «Eso es bastante diferente de lo que Google parecía estar sugiriendo: que una persona podría tener una conversación de voz fluida con Gemini mientras observaba y respondía en tiempo real al mundo que lo rodeaba», escribe Bloomberg.

La respuesta de Google

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Pero para Google no hay engaño. La compañía señaló en una publicación de Oriol Vinyals, vicepresidente de investigación y líder de aprendizaje profundo en DeepMind de Google (también colíder de Gemini), que explica cómo el equipo hizo el video.

«Todas las indicaciones y salidas del usuario en el video son reales, acortadas para mayor brevedad», dice Vinyals. «El video ilustra cómo podrían ser las experiencias de usuario multimodo creadas con Gemini. Lo hicimos para inspirar a los desarrolladores».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
Asus: La RTX 5070 Ti y la RTX 5060 Ti 16 GB no han sido descontinuadas
Electronics, Hardware, Computer Hardware

La tarjeta gráfica RTX 5070 Ti ha sido objeto de un tira y afloja comunicacional. Tras diversos pronunciamientos contradictorios en redes sociales, ASUS finalmente aclaró su estrategia: continuará comercializando el modelo a pesar de los desafíos en la cadena de suministro relacionados con la disponibilidad de memoria especializada. Esta aclaración llega después de que la compañía generara confusión mediante publicaciones imprecisas sobre la supuesta descontinuación del producto.

La situación refleja tensiones internas en la industria de semiconductores, donde la demanda de memoria de alto rendimiento ha superado las expectativas de los proveedores. La RTX 5070 Ti, como generación intermedia de la línea GeForce, enfrenta presiones similares a otros componentes de la serie 50, pero ASUS ha decidido que su relevancia en el mercado justifica mantener su línea de producción activa.

Read more
Wikipedia 25 años: contra todo somos la columna vertebral del conocimiento
Wikipedia en español

Wikipedia, la mayor enciclopedia colaborativa en la historia de Internet, celebra hoy su vigésimo quinto aniversario desde su fundación el 15 de enero de 2001. Para conmemorar este significativo logro, la Fundación Wikimedia ha lanzado una campaña global denominada "Wikipedia25" bajo el lema "El conocimiento es humano", enfatizando el valor fundamental de la contribución humana en la era de la inteligencia artificial.

A lo largo de sus dos décadas y media de existencia, Wikipedia ha evolucionado desde cuatro artículos iniciales hasta un colosal repositorio que contiene más de 65 millones de artículos distribuidos en más de 300 idiomas, con un promedio de 15.000 millones de visitas mensuales. Este crecimiento extraordinario ha sido posible gracias a una comunidad global de aproximadamente 250.000 editores voluntarios que mensualmente dedican su tiempo y conocimiento a crear, verificar y mantener contenidos bajo rigurosos estándares de neutralidad y confiabilidad.

Read more
El truco supuestamente infalible para mejorar tus prompts en chatbots
ChatGPT

Si tu asistente de IA sigue dejando de lado detalles o hablando más allá de la pregunta, no necesitas un modelo nuevo para obtener mejores resultados. Pequeños cambios en mejores prompts de chatbot pueden limpiar gran parte del desastre.

Una solución es mecánica. Un artículo de investigación de Google destacado por VentureBeat señala un movimiento muy sencillo: pegar tu petición exacta dos veces en el mismo mensaje. Está pensado para aumentar la precisión en trabajos sencillos como la extracción, respuestas cortas y reescritura básica, no en razonamientos largos y de varios pasos.

Read more