Skip to main content

Google Gemini facilita la navegación web para usuarios con problemas de visión y audición

Google Gemini Navegación Talk Back
DTES

Los dispositivos Android han ofrecido una función de lector de pantalla incorporada llamada TalkBack durante años. Ayuda a las personas con problemas de visión a dar sentido a lo que aparece en la pantalla de su teléfono y les permite controlarlo con la voz. En 2024, Google añadió su Gemini AI a la mezcla para ofrecer a los usuarios una descripción más detallada de las imágenes.

Google ahora lo está reforzando con una capa completamente nueva de conveniencia interactiva para los usuarios. Hasta ahora, Géminis solo ha descrito imágenes. Ahora, cuando los usuarios miran imágenes, incluso pueden hacer preguntas de seguimiento sobre ellas y tener una conversación más detallada.

Recommended Videos

¿Cómo ayuda a los usuarios con dificultades visuales?

«La próxima vez que un amigo te envíe un mensaje de texto con una foto de su nueva guitarra, puedes obtener una descripción y hacer preguntas de seguimiento sobre la marca y el color, o incluso sobre qué más hay en la imagen», dice Google. Esto se basa en la actualización de accesibilidad que integró Gemini dentro del sistema Talkback a finales del año pasado.

El menú Talkback en Android ahora muestra una función dedicada a la pantalla de descripción que pone a Gemini en el asiento del conductor. Así, por ejemplo, si los usuarios están navegando por un catálogo de prendas, Gemini no solo describirá lo que aparece en la pantalla, sino que también responderá a las preguntas relevantes.

Por ejemplo, los usuarios pueden hacer preguntas como «¿Qué vestido sería el mejor para una salida fría de invierno?» o «¿Qué salsa iría mejor con un sándwich?» Gemini también podrá analizar toda la pantalla e informar a los usuarios sobre detalles granulares del producto, o si hay algún descuento disponible.

Hacer que los subtítulos sean expresivos y mejorar el zoom del texto

En el navegador Chrome, Google está dando un pequeño impulso a los subtítulos generados automáticamente para los videos. Digamos que estás viendo un partido de fútbol. Los subtítulos ya no se limitarán a seguir las palabras del comentarista, sino que también coincidirán con sus emociones y expresiones.

Por ejemplo, en lugar de «gol», los usuarios con problemas de audición verán un sonoro «gooooooooo Google los llama Subtítulos Expresivos.

Además del habla humana, ahora también cubrirán sonidos importantes como silbidos, vítores o incluso el altavoz simplemente aclarándose la garganta. Los subtítulos expresivos estarán disponibles en todos los dispositivos con Android 15 o una versión posterior, en EE. UU., Reino Unido, Canadá y Australia.

Otro cambio significativo que llegará al navegador Chrome es el zoom de texto adaptativo, que es esencialmente una actualización del sistema Page Zoom disponible en los teléfonos Android. Ahora, cuando los usuarios aumenten el tamaño del texto, no afectará el diseño del resto de la página web.

«Puedes personalizar cuánto quieres acercar y aplicar fácilmente la preferencia a todas las páginas que visitas o solo a algunas específicas», dice Google. Los usuarios podrán realizar ajustes en el rango de zoom usando un control deslizante en la parte inferior de la página.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Las próximas gafas inteligentes de Google tendrán el lujo de Gentle Monster y Warby Parker
Gafas Gentle Monster

El Google I/O 2025 fue la oportunidad tan esperada para la marca liderada por Sundar Pichai para mostrar cómo trabajarán las próximas gafas inteligentes de la compañía, dejando muy claro que el software de Android XR será lo único casi de desarrollo propio, ya que habrá importantes asociaciones con marcas de lujo para la fabricación del hardware.

La decisión de Google de no mostrar ningún modelo propio listo para el consumidor de repente tuvo sentido cuando anunció dos asociaciones relacionadas con las gafas inteligentes, la coreana Gentle Monster y la estadounidense Warby Parker, en el escenario, junto con una tercera, la francesa Kering Eyewear, fuera de la presentación.

Leer más
Google está destruyendo la Torre de Babel y eso es bueno y malo a la vez
Google Meet traductor

En Génesis 11 se cuenta una historia extraordinaria de cómo el caos se apoderó del mundo. Se trata del mito de la Torre de Babel, que explica el origen de las diferentes lenguas humanas. Según la historia, en la antigüedad toda la humanidad hablaba un mismo idioma y decidió construir una torre en la llanura de Sinar que llegara hasta el cielo, como símbolo de su unidad y grandeza.

Sin embargo, Dios consideró este acto como un exceso de soberbia y decidió castigar a los constructores. Para ello, confundió sus lenguas, haciendo que cada grupo hablara un idioma diferente, lo que les impidió comunicarse y continuar con la obra. Como resultado, las personas se dispersaron por toda la Tierra, dando origen a las distintas lenguas y culturas.

Leer más
Google I/O 2025: todo el resumen y cómo la IA ya se tomó la película entera
Google I/O 2025

Este martes 20 de mayo se dio inicio a Google I/O 2025, el gran evento de desarrolladores de la compañía de Mountain View, que hoy se enfocó principalmente en IA y en todos los desarrollos y modelos nuevos de lenguaje de Gemini y las nuevas potencialidades de traducción en tiempo real, video y productividad.

El CEO de la compañía, Sundar Pichai, entregó los primeros conceptos al respecto:

Leer más