La periodista de DT en inglés, Christine Romero-Chan , está impresionada por uno de los anuncios de IA que se presentaron en el Google I/O 2024.
El discurso principal de Google I/O 2024 estuvo repleto de un montón de nuevas funciones de IA que llegarán a computadoras de escritorio y dispositivos móviles, gracias a Gemini. Habrá nuevas formas de buscar en Google a través de solicitudes de video y avisos multimodales, mientras que los teléfonos inteligentes eventualmente obtendrán superpoderes de IA a través de la cámara con Project Astra.
Pero hay una función que realmente me llamó la atención: Preguntar fotos con Gemini en Google Fotos.
Primero, ¿qué es Gemini?
En primer lugar, ¿qué es Gemini? Es básicamente la familia de modelos de IA de Google, que incluye Gemini Nano, Gemini Pro y Gemini Ultra. En resumen, es la versión de Google de OpenAI y sus propios modelos GPT, como ChatGPT.
Gemini puede entender y generar texto como otros modelos de lenguaje grandes (LLM), como GPT de OpenAI. Sin embargo, Géminis puede hacer un poco más: entiende, opera y combina otras formas de información como imágenes, video, audio e incluso código.
Para los teléfonos inteligentes Android, utiliza Gemini Nano, que funciona localmente en el propio dispositivo. Gracias al modelo Gemini Nano, las funciones existentes, como Circle to Search, mejorarán aún más con la capacidad de ayudar a los estudiantes con la tarea de física y matemáticas.
También será aún más consciente del contexto de lo que está actualmente en su pantalla, ya que podrá hacer preguntas a Gemini sobre un video que está viendo o un PDF largo que está navegando en lugar de desplazarse por docenas de páginas. Gemini Nano incluso traerá capacidades multimodales a su teléfono inteligente, como consultas de búsqueda con múltiples solicitudes en una.
Ask Photos with Gemini es una de las muchas nuevas funciones de Gemini anunciadas en I/O 2024, y estará en Google Photos a finales de este año. En pocas palabras, puede buscar en su enorme biblioteca de fotos con un enfoque más conversacional en lugar de palabras clave.
En la demostración de Google I/O, Google mostró que puedes preguntar «¿Cuál es mi matrícula otra vez?» o «¿Cuándo aprendió a nadar mi hija?» para que aparezcan fotos que respondan a esas solicitudes.
Incluso va un paso más allá con peticiones como «Muéstrame cómo ha progresado la natación de mi hija». Consultas como esta hacen que Géminis revise tus fotos por fecha y contexto para obtener un resultado apropiado.
Cuando Ask Photos with Gemini se mostró en el escenario, estaba emocionado y no puedo esperar para tenerlo en mis manos.
El compañero de IA de uno de los padres
Solo he sido mamá por un poco más de dos años. Pero en ese tiempo, he tomado más fotos que nunca porque me encanta capturar todos los pequeños momentos de mi hija. Con un iPhone 15 Pro de 1 TB y los innumerables teléfonos Android que pruebo, siempre estoy tomando fotos de mi hija.
Puede que pienses que es una exageración, tal vez lo sea. Pero no tengo muchas fotos, y mucho menos videos, de mi infancia de mis padres. Realmente no capturaron todos mis momentos especiales, y solo tengo recuerdos vagos, nada súper detallado o específico. Con toda la tecnología que tenemos ahora, me ha ayudado a asegurarme de que mi hija tenga evidencia visual de su infancia.
Aunque tomo fotos y videos para compartir con miembros de la familia y amigos seleccionados, principalmente capturo estos momentos porque quiero recordarlos más tarde. Ya sea que solo esté buscando un estímulo rápido para traerme una sonrisa a la cara o cuando soy una anciana senil y necesito un paseo por el carril de la memoria, reviso bastante mis recuerdos visuales.
Con Ask Photos with Gemini, no puedo esperar para pedirle que me muestre el progreso de mi hija con varios eventos de la vida. Por ejemplo, vamos a empezar a trabajar en preescolar este mes de agosto. Me encantaría pedirle a Geminique me muestre su progreso a lo largo de la escuela o simplemente que me muestre todos sus «primeros días» de cada año escolar. O cuando aprenda a andar en bicicleta, pude ver su progreso en la transición de las ruedas de entrenamiento a una bicicleta completa. Diablos, incluso podría mostrarme cuando mi hija sopla las velas de su pastel de cumpleaños todos los años.
Hay tantas posibilidades para utilizar Ask Photos, pero esas son solo algunas ideas que me vienen a la mente. Y aunque es genial para los padres por los hitos de sus hijos, también es genial para otras cosas. Puedo verme usándolo para mis aniversarios, vacaciones e incluso para mis mascotas.
Claro, ahora podría revisar todas mis fotos y buscar con caras y palabras clave. Pero Ask Photos with Gemini parece una forma mucho más simple, rápida y natural de hacerlo. Y cuando tienes una biblioteca de fotos de más de 50,000 fotos y videos, bueno, me vendría bien una forma más fácil de buscarla.
No puedo esperar para usar esto
Ask Photos no es la única función de Gemini AI que Google mostró en Google I/O 2024. Y aunque es el que más me entusiasma por su practicidad, también hay otras cosas interesantes que quiero comprobar.
Por ejemplo, el Proyecto Astra parecía intrigante. A menudo uso mi teléfono para capturar una foto de algo que quiero guardar para más tarde y aprender más, como plantas y flores. Pero con Astra, tendrás esa bondad de la IA directamente en la cámara, y puede decirte lo que estás viendo en tiempo real. Y aunque Google no anunció ninguna gafa inteligente, Project Astra demostró que esta sería una característica increíble para tener en las gafas inteligentes en algún momento.
También estoy ansioso por revisar las solicitudes de avisos multimodales en la Búsqueda de Google con tecnología Gemini. No soy el tipo de persona que disfruta planeando nada, así que si Google puede hacer el trabajo por mí, entonces estoy totalmente a favor. Y aunque no creo que las alertas de estafas en tiempo real sean muy útiles para mí (de todos modos, nunca contesto el teléfono), será una función muy útil para otros.
Ask Photos with Gemini debería llegar a Google Photos a finales de este verano, y no puedo esperar para probarlo.