Android, Wear OS, Pixel y más. Google tiene algunas de las marcas más grandes y conocidas del mundo en su haber, y Google I/O es su celebración anual de software que prepara el escenario para todo lo que la compañía ha planeado para el próximo año. Este año no parece estar menos lleno de lo habitual, y el discurso de apertura al comienzo del evento es, como siempre, cuando es probable que veamos los anuncios y noticias más importantes.
Android 15, Wear OS 5 y Google Gemini están en la parte superior de la lista de anuncios que esperamos escuchar durante el discurso de apertura de Google I/O, pero como siempre, esté atento a algunas revelaciones sorprendentes que no esperábamos. Aunque es poco probable que se anuncien por completo, es posible que también oigamos hablar de la próxima gama Google Pixel 9 y Pixel Watch 3.
Sigue revisando a menudo, ya que actualizaremos este artículo a lo largo del programa a medida que lleguen más noticias.
La IA de Géminis gobierna el gallinero
No debería sorprender a nadie que la IA esté ocupando un lugar central en este Google I/O. Parece como si el mundo no hubiera hablado de nada más que durante todo este último año, y Google nunca ha sido una empresa que ignore una tendencia desenfrenada como esta. Google está completamente en su «era Géminis», según el CEO Sundar Pichai, por lo que se espera ver a la IA tocando cada parte de los anuncios de este año.
Más de 1,5 millones de desarrolladores utilizan el modelo de IA anteriormente conocido como Bard, y Gemini está disponible para más de 2 mil millones de usuarios en Android. AI Overview, la integración de Gemini con el principal motor de búsqueda de Google, llegará pronto a los EE. UU. y otros países. Gemini también se agregará a Google Photos, agregando capacidades de búsqueda adicionales a través de la función Ask Photos. Pregúntale «cuál es mi matrícula de nuevo» y buscará en tus fotos para encontrar la respuesta más probable, evitando que tengas que mirar manualmente tus fotos para encontrarla tú mismo.
Como era de esperar, Gemini se extenderá a otras partes de la cartera de Google, como Gmail. Pídele que resuma la información de la escuela de tu hijo, y puede hacerlo. Notebook LM, destacado en el Google I/O del año pasado, también tendrá Gemini introducido, llevando su inteligencia artificial a niveles aún más altos. Durante la presentación, se nos mostró que se le pedía que desglosara la ciencia utilizando el baloncesto como ejemplo. Es probable que este tipo de personalización para el aprendizaje se vuelva más frecuente a medida que avanzamos hacia el futuro.
Gemini 1.5 Pro estará disponible para todos los desarrolladores y usuarios avanzados a partir de hoy, en más de 35 idiomas.
Los agentes de Gemini pueden hacerlo por ti
Gemini no es solo para hacer preguntas, y Google está trabajando arduamente para llevarlo más allá de ser simplemente un motor de búsqueda más agradable. Los agentes son una gran parte de eso, y algo con lo que Google está experimentando. La idea central de Agents es usar la IA para, bueno, hacer cosas por ti.
En teoría, podrías enviarle a Gemini una foto de un par de zapatos y decirle que quieres devolverlos, y los agentes entrarían en acción, organizando todo el proceso por ti. Esto también podría usarse para planificar vacaciones, viajes de trabajo o cualquier necesidad relacionada con ellos.
Proyecto Astra
Otro proyecto experimental para Google es Astra. Esto vincula a Géminis con las cámaras y le permite comprender e interpretar el mundo que lo rodea. En la demostración que vimos, Astra fue capaz de identificar un altavoz, desglosar qué parte del altavoz hacía ruidos, leer el código y explicarlo. Astra también podría usarse para agregar IA en un par de gafas inteligentes, como se mostró en la demostración.
IA generativa
La IA generativa es la IA más convencional que existe, y Google no ignora este elemento tan importante de la IA. Su modelo de IA más reciente para crear imágenes se llama Imagine 3, y Google afirma que es el mejor modelo que ha hecho hasta ahora para crear imágenes con palabras, pero también para comprender indicaciones.
No se trata solo de imágenes, y Google ha estado trabajando arduamente en la creación de modelos de IA para generar música, y Veo, un modelo de IA que puede crear algunos videos HD muy impresionantes. Las indicaciones se pueden usar para editar videos existentes, por lo que no es necesario volver a crear videos desde cero cada vez, y los ejemplos de video que se muestran definitivamente se ven mejor que la mayoría de los videos creados por IA.
We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO pic.twitter.com/XMrQYGeSiO
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Together with @YouTube, we’ve been building Music AI Sandbox, a suite of AI tools to transform how music can be created. 🎵
To help us design and test them, we’ve been working closely with musicians, songwriters and producers. ↓ #GoogleIO pic.twitter.com/pMLa3aCveu
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Introducing Veo: our most capable generative video model. 🎥
It can create high-quality, 1080p clips that can go beyond 60 seconds.
From photorealism to surrealism and animation, it can tackle a range of cinematic styles. 🧵 #GoogleIO pic.twitter.com/6zEuYRAHpH
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Estas herramientas se pueden encontrar en ImageFX y Video FX.
La IA generativa también se utilizará en la Búsqueda de Google, gracias a una versión personalizada de Gemini. Los resúmenes de IA son clave para esto, ya que lo ayudan a acelerar su investigación en lugar de tener que saltar a varios sitios web diferentes. El razonamiento de varios pasos desglosará sus solicitudes, aprovechando los índices de Google para brindarle la información más relevante. Incluso puede ayudarte a planificar un viaje.
Géminis en Workspace
Gemini ha estado disponible en el espacio de trabajo de Google desde hace un tiempo, y Google está listo para llevarlo al siguiente nivel. El panel lateral con motor Gemini estará disponible el próximo mes. Géminis también llegará a Meet en más idiomas.
Gmail está listo para aún más IA. Como era de esperar, Gemini se implementará en Gmail. Pídele que resuma la información de la escuela de tu hijo, y puede hacerlo, o simplemente resumir los correos electrónicos largos para que tú no tengas que hacerlo. Escribe una pregunta o un mensaje, y Géminis podrá responderlo por ti, o realizar una acción. Por ejemplo, podrá reunir presupuestos separados para trabajos de construcción y traerlos a una lista para usted. Las respuestas inteligentes también se actualizan con las respuestas inteligentes contextuales. Estas capacidades se implementarán para los usuarios de Workspace Labs este verano.
Es posible que pronto estés trabajando con una IA. Google mostró a un «compañero de equipo de IA», llamado Chip, que estaba a cargo de monitorear los recursos del equipo. Chip estaba disponible para responder preguntas en los chats de Google Workspace, y era capaz de recordar cuándo se habían tomado decisiones y el progreso del proyecto específico mencionado.
Workspace apps like Gmail, Docs and Calendar already work well together. But Gemini for Workspace will make working across apps even easier — for example recognizing a receipt in Gmail and organizing it in Drive and Sheets. #GoogleIO pic.twitter.com/TtBmkH9cp0
— Google (@Google) May 14, 2024
La aplicación Gemini
Géminis siempre iba a llegar en forma de aplicación. Efectivamente, un Asistente de Google actualizado, puede comunicarse con Gemini de la misma manera que lo haría con el Asistente de Google, incluido el texto y la voz, pero también podrá usar video y una forma más conversacional de hablarle, conocida como Gemini Live.
Las gemas de Géminis son versiones más pequeñas y personalizadas de Géminis que se pueden especializar en varios nichos. Entonces, si usa Géminis de maneras específicas una y otra vez, puede crear una gema para ahorrar tiempo cuando la necesite una y otra vez. Entonces, si quieres usar Géminis para contarte historias, puedes crear una gema que se especialice precisamente en eso, para que puedas sumergirte cuando quieras.
La aplicación Gemini es capaz de hacer una serie de cosas que esperas de Gemini, incluida la posibilidad de planificar un viaje y establecer un itinerario. Esta función se implementará este verano.
This summer, we’re expanding Gemini’s multimodal capabilities — including the ability to have an in-depth two-way conversation using your voice. This new experience is called Live. #GoogleIO pic.twitter.com/eAZbaO5WKz
— Google (@Google) May 14, 2024
IA y Android
Google está utilizando la IA para redefinir la forma en que usa su teléfono inteligente, y eso comienza en Android. Circle to Search fue la primera parte de esto en salir, pero este año, Google también agregará Gemini como su asistente de IA estándar en Android y agregará más funciones de IA bajo el capó.
Piensa en Gemini en Android como si fuera el Asistente de Google con esteroides. Podrá comprender contextualmente el contenido de su pantalla, lo que incluye poder descifrar resúmenes de videos de YouTube, crear imágenes para respuestas y responder cualquier pregunta que pueda tener, sin tener que salir de la pantalla que está mirando.
Gemini on @Android is becoming more helpful and context aware. Later this year, you’ll be able to drag-and-drop generated images into Google Messages & Gmail, and ask questions about @YouTube videos and PDFs right on your device. #GoogleIO pic.twitter.com/ZRajfzXBWw
— Google (@Google) May 14, 2024
La accesibilidad es una característica clave que ofrece la IA. La función Talkback existe desde hace tiempo, pero ahora, gracias a Gemini, las imágenes se pueden describir en profundidad y en detalle, lo que brinda a las personas con problemas de visión una forma más fácil de usar sus teléfonos. Y dado que Gemini está disponible en el dispositivo, es rápido y rápido.
Gemini también podrá ayudar a lidiar con las llamadas de spam y estafas. Gemini escuchará tus llamadas y te dará una advertencia cuando detecte actividad sospechosa, y dado que todo está en el dispositivo, la información no saldrá de tu teléfono. Sin embargo, esta función aún se está ajustando y no estará disponible por un tiempo.
Thanks to Gemini Nano, @Android will warn you in the middle of a call as soon as it detects suspicious activity, like being asked for your social security number and bank info. Stay tuned for more news in the coming months. #GoogleIO pic.twitter.com/wtc3rrk0Gc
— Google (@Google) May 14, 2024