El periodista de DT en inglés, Joe Maring, estuvo presente en Google I/O y estuvo en presencia de un proyecto revolucionario.
Si hay algo que salió de Google I/O 2024 que realmente me llamó la atención, es el Proyecto Astra de Google. En resumen, Astra es un nuevo asistente de IA con capacidades de voz, visión, texto y memoria. Puedes hablarle como si fuera otra persona en la habitación, pedirle que describa las cosas que ve e incluso pedirle que recuerde información sobre esas cosas.
Durante el discurso de apertura de I/O en el anuncio de Astra, uno de los momentos más impresionantes ocurrió cuando una persona estaba ejecutando Astra en un teléfono, pidiéndole que describiera cosas en una habitación. Cuando la persona le preguntó a Astra dónde estaban sus gafas, Astra rápidamente señaló dónde estaban en la habitación, incluso sin que se le preguntara antes en el video sobre ellas.
Pero, ¿funciona realmente así el Proyecto Astra en el mundo real? Pude verlo en acción durante una demostración rápida de 10 minutos en I/O, ¿y sabes qué? Estoy bastante impresionado.
‘¡Esa es una buena figura de palo!’
Google nos guió a través de un puñado de demostraciones de Astra: Alliteration, Pictionary, Storytelling y Free Form. Todos hicieron lo que cabría esperar, y todos fueron igualmente impresionantes. Para contextualizar, la demostración de Astra que Google mostró durante su discurso de apertura de I/O tenía la IA ejecutándose en un teléfono. En la demostración que vi (de la que no se me permitió tomar fotos o videos), Astra se ejecutaba en una computadora portátil y estaba conectada a una cámara más una pantalla táctil.
En la demostración de Alliteration, los miembros del equipo del Proyecto Astra hicieron que «mirara» objetos aleatorios (con la cámara apuntando a una mesa de demostración). Identificó con precisión lo que estaba mirando (un animal de peluche, una manzana de juguete y un perrito caliente de juguete) y habló en aliteraciones todo el tiempo que estaba describiendo lo que veía. Todo era un poco ridículo, pero Astra sabía todo lo que estaba mirando, y me puso una sonrisa en la cara.
Otro momento divertido ocurrió durante la demostración de Pictionary. Alguien del equipo de Astra utilizó la pantalla táctil conectada para dibujar una figura de palo. Mientras explicaba que iba a dibujar la figura de palo primero, Astra, sin que nadie se lo pidiera, exclamó: «¡Esa es una buena figura de palo!» con mucho entusiasmo.
Fue un momento sutil, pero realmente me hizo ver lo diferente que es Astra de, por ejemplo, el Asistente de Google. Nadie necesitó preguntar: «Oye Astra, ¿qué piensas de esta figura de palo?» Vio la figura de palo, escuchó al Googler hablar de ella y proporcionó comentarios por su cuenta. Fue algo asombroso. A partir de ahí, el miembro del equipo de Astra puso un emoji de calavera en la mano extendida de la figura de palo. Cuando se le preguntó qué juego se suponía que representaba el dibujo, Astra inmediatamente adivinó Hamlet.
La narración de historias y la forma libre también tuvieron sus momentos. Para la demostración de Storytelling, a Astra se le mostró un cangrejo de juguete y se le pidió que contara una historia sobre él. Astra comenzó a contar una historia detallada sobre el cangrejo caminando por una playa. Luego se colocó un fidget spinner sobre la mesa y se le pidió a Astra que lo incorporara a la historia. Lo hizo sin perder el ritmo.
Como su nombre indica, la demostración de forma libre puso a Astra en condiciones de hacer lo que se le pidiera. Se le mostraron tres animales de peluche y se les dijeron sus nombres. Alguien le pidió a Astra que recordara los nombres de los distintos animales, y acertó dos de cada tres. Al igual que tú y yo, Astra recuerda las cosas que ve y oye. Google todavía está averiguando cuánto debe recordar Astra y cuánto tiempo debe retener esa información, y esos son detalles críticos que deben resolverse. Pero el hecho de que esto suceda es nada menos que mágico.
Oír es creer
Quizás lo que más me llamó la atención durante mi demostración fue lo natural que se sentía Astra. Los miembros del equipo de Astra nunca necesitaron decir «Hey Astra» o «OK Astra» para llamar su atención para los comandos de voz. Una vez que Astra estuvo en funcionamiento, pudo escuchar continuamente preguntas/comandos/comentarios y responder a ellos como si fuera otra persona en la sala.
La calidad de sus respuestas fue igual de impresionante. Al escuchar Astra, nunca sentí que estuviera escuchando a un asistente virtual que me hablaba. Las inflexiones de voz y el patrón de habla natural que Astra ofrecía eran realmente impresionantes. Si cerraba los ojos, podría engañarme a mí mismo pensando que estaba escuchando a otra persona en la habitación conmigo, no a una computadora.
Si alguna vez vamos a llegar a un punto en el que la IA se sienta como un asistente amigable, servicial y agradable, debe sentirse como si estuvieras hablando con un amigo. Astra parece estar muy cerca de eso, y eso es infinitamente más emocionante que las gemas, los tokens o cualquier otra jerga de IA de la que Google pasó dos horas hablando durante su presentación.
¿Es Astra realmente la IA del futuro?
Como sugiere el nombre «Proyecto Astra», Astra sigue siendo un trabajo en progreso y no es algo que Google esté listo para lanzar pronto. ¿Astra eventualmente reemplazará al Asistente de Google en mi teléfono Android? ¿Necesitaré un teléfono si puedo tener un par de gafas inteligentes con Astra integradas? Quizás lo más importante, ¿estamos cerca de que Astra esté listo para el uso normal y diario?
Todas esas son preguntas muy importantes que Google aún debe abordar, e imagino que pasará un tiempo antes de que tengamos respuestas a cualquiera de ellas. Pero después de experimentar Astra por mí mismo y reflexionar sobre el tiempo que pasé con él, no puedo evitar sentirme entusiasmado con su potencial.
¿Un asistente de IA inteligente, amigable, memorable y fácil de hablar que realmente parece sacado de una película de ciencia ficción? Eso es algo de lo que hay que hablar.
Es muy fácil sentirse mal por la IA, y con razón. Cuando Google dedicó parte del discurso de apertura de I/O a presumir de la generación de imágenes de IA, el uso de la IA para crear películas o hacer que la IA resumiera los resultados de la Búsqueda de Google, lo que bien podría acabar con la Internet moderna tal y como la conocemos, no pude evitar temer el futuro plagado de IA hacia el que nos dirigimos rápidamente. Pero, ¿un asistente de IA inteligente, amigable, memorable y fácil de hablar que realmente parezca sacado de una película de ciencia ficción? Eso es algo de lo que hay que hablar.
No sé si Astra alguna vez será tan genial o abarcador como lo estoy soñando. Pero realmente parece que podría haber un futuro en el que eso suceda, y espero que ese sea el futuro de la IA por el que Google ponga sus esfuerzos.