Skip to main content

Live Transcribe: cuando la inteligencia artificial transforma tu vida

Abres la cámara del teléfono, tomas la foto y, como por arte de birlibirloque, la inteligencia artificial reconoce los objetos fotografiados y, en función de los que ve, mejora la foto. Es solo uno de los múltiples usos de la IA en los celulares. Está claro que esta tecnología facilita mucho el día a día de cualquiera. En el caso de las personas con alguna discapacidad o mayores, transforma la vida radicalmente. Dimitri Kanevsky, científico de Google, sordo desde los tres años, lo sabe bien. Lleva treinta años investigando en proyectos relacionados con aplicaciones que hacen este mundo más accesible a quienes padecen pérdida auditiva.

Imagen utilizada con permiso del titular de los derechos de autor

Live Transcribe es una de esas aplicaciones mágicas desarrolladas por Kanevsky. Integrada en el móvil, permite obtener una transcripción de una conversación en tiempo real. Hemos podido comprobar su gran utilidad a través del investigador, quien ha realizado una demostración de esta tecnología en las oficinas de Google en Madrid. Así, mientras contaba todos los proyectos de investigación en los que trabaja actualmente, los asistentes podíamos leer al instante en una pantalla todo lo que explicaba. Gracias a este software, que está disponible en 70 idiomas, él puede comunicarse mejor con sus nietos.

Recommended Videos

Ahora que los podcast están más de moda que nunca, imaginaos lo que aplicaciones como Live Caption suponen para las personas sordas: esta herramienta facilita el poder leer lo que escucha. O lo que es lo mismo, subtitula automáticamente lo que se reproduce en un teléfono. Pero no vale cualquier celular ni funciona en español. Si quieres disfrutar de este software que solo es compatible con el inglés, deberás comprar un Pixel 4 o un Pixel 3.

El científico de Google también trata de mejorar la comunicación de personas con problemas del habla a través de los proyectos de investigación Euphonia y Parrotron. El primero, que se enmarca dentro del programa de Google “AI for social good”, tiene como objetivo optimizar los algoritmos basados en inteligencia artificial para que los móviles y computadoras transcriban de forma más precisa las palabras pronunciadas por enfermos de ELA con dificultades del habla. El segundo, convierte las palabras de un hablante con patrones de habla atípicos directamente en habla sintetizada fluida. Así, Kanevsky ha efectuado una demostración de cómo esta tecnología posibilita el entendimiento con el altavoz inteligente Google Home.

Con un algoritmo de reconocimiento de sonidos con IA basado en el software TensorFlow, la startup Visualfy se dedica a integrar en los hogares una aplicación para que las personas sordas se den cuenta de cuándo suena el timbre, salta la alarma o llora un bebé. El sistema se basa en un dispositivo central y micrófonos situados en distintos sitios que escuchan todo lo que sucede en la casa y traducen estos sonidos en señales luminosas. “Nuestro trabajo sin la inteligencia artificial sería inviable. Con ella podemos implementar este sistema de una manera sencilla y de forma más eficaz y económica”, ha señalado Manel Alcaide, CEO de Visualfy.

Google Play Store: Live Transcribe

La inteligencia artificial también ha dado ojos a las personas invidentes. La aplicación Lookout facilita como nunca su autonomía. Basada en el uso de la cámara del teléfono móvil, la app informa en voz alta de todo que reconoce cuando la enfocas. De esta manera, les es posible identificar todo lo que hay a su alrededor, saber dónde están, por dónde van y poder interactuar con el mundo. “Con la inteligencia artificial, coloco el dispositivo más o menos a la altura de mi cara y con la cámara puedo saber las puertas de embarque en un aeropuerto. Simplemente con eso ya puedo guiarme solo”, ha explicado Enhamed Enhamed, medallista paralímpico español, quien utiliza el móvil para saber los restaurantes cercanos a su alrededor, conocer las cartas con el menú o saber con qué billete va pagar la cuenta. “Estas tecnologías me han facilitado la vida enormemente porque puedo enterarme del contenido de los mensajes de correo electrónico, de los comentarios de las redes sociales, de las cartas que te llegan a casa y de los textos de las imágenes”.

En el encuentro organizado por Google todos han resaltado la importancia de la tecnología para las personas con discapacidad. El acercamiento a ella surge por una necesidad, y es algo que le puede pasar a cualquiera. Porque todos nos vamos a hacer mayores y es entonces cuando merman las capacidades auditivas y visuales.

Marta Villalba
Marta Villalba, periodista madrileña, se inició en el periodismo tecnológico cuando todavía no existía Google y los…
La pantalla de bloqueo del Galaxy S25 tendrá su propio asistente de IA
samsung galaxy s25 pantalla bloqueo asistente ia s24 ultra

Samsung nos ha dado un primer vistazo a una de las grandes características de software que podemos esperar en la serie Galaxy S25. Se llama Now Bar, y Samsung compartió algunos detalles sobre ella cuando lanzó la versión beta de One UI 7. Ahora, tenemos muchos más detalles y una mejor idea de cómo encaja con la gran visión de IA de Samsung.

La Now Bar vivirá en la pantalla de bloqueo y mostrará datos personalizados sobre su día y actividades. Samsung afirma que es donde "controlará su entretenimiento, cronometrará su próximo mejor entrenamiento personal, obtendrá direcciones para su próxima reunión o comenzará a comunicarse en otros idiomas". No dice específicamente que Now Bar sea un asistente de IA, pero cuando entra en más detalles sobre lo que puede hacer, ciertamente comienza a sonar como uno.

Leer más
Motorola anuncia la nueva familia Moto G15 y el Moto G05
motorola anuncia moto g15 g05

Un lanzamiento de fin de año ha sacado Motorola en su línea de celulares de gama baja, dos teléfonos Moto G15, la versión normal y la Power y el Moto G05.

Sus principales atractivos son grandes baterías y además los primeros del nivel de entrada que vienen con Android 15.
Moto G15 y Moto G15 Power

Leer más
realme GT 7 Pro: precio y disponibilidad en México
Una fotografía del realme GT 7 Pro.

El realme GT 7 Pro ya está disponible en México a través de Mercado Libre. Se trata del celular gama alta de realme para 2025, y el primero que se comercializa en México con el Snapdragon 8 Elite, el chipset más potente de Qualcomm a la fecha y que logra un rendimiento tope en apps de gran demanda gráfica, así como varias funciones de edición fotográfica impulsada por inteligencia artificial.
realme GT 7 Pro: características y especificaciones

realme GT 7 Pro

Leer más