Live Transcribe: cuando la inteligencia artificial transforma tu vida

Abres la cámara del teléfono, tomas la foto y, como por arte de birlibirloque, la inteligencia artificial reconoce los objetos fotografiados y, en función de los que ve, mejora la foto. Es solo uno de los múltiples usos de la IA en los celulares. Está claro que esta tecnología facilita mucho el día a día de cualquiera. En el caso de las personas con alguna discapacidad o mayores, transforma la vida radicalmente. Dimitri Kanevsky, científico de Google, sordo desde los tres años, lo sabe bien. Lleva treinta años investigando en proyectos relacionados con aplicaciones que hacen este mundo más accesible a quienes padecen pérdida auditiva.

Live Transcribe es una de esas aplicaciones mágicas desarrolladas por Kanevsky. Integrada en el móvil, permite obtener una transcripción de una conversación en tiempo real. Hemos podido comprobar su gran utilidad a través del investigador, quien ha realizado una demostración de esta tecnología en las oficinas de Google en Madrid. Así, mientras contaba todos los proyectos de investigación en los que trabaja actualmente, los asistentes podíamos leer al instante en una pantalla todo lo que explicaba. Gracias a este software, que está disponible en 70 idiomas, él puede comunicarse mejor con sus nietos.

Ahora que los podcast están más de moda que nunca, imaginaos lo que aplicaciones como Live Caption suponen para las personas sordas: esta herramienta facilita el poder leer lo que escucha. O lo que es lo mismo, subtitula automáticamente lo que se reproduce en un teléfono. Pero no vale cualquier celular ni funciona en español. Si quieres disfrutar de este software que solo es compatible con el inglés, deberás comprar un Pixel 4 o un Pixel 3.

El científico de Google también trata de mejorar la comunicación de personas con problemas del habla a través de los proyectos de investigación Euphonia y Parrotron. El primero, que se enmarca dentro del programa de Google “AI for social good”, tiene como objetivo optimizar los algoritmos basados en inteligencia artificial para que los móviles y computadoras transcriban de forma más precisa las palabras pronunciadas por enfermos de ELA con dificultades del habla. El segundo, convierte las palabras de un hablante con patrones de habla atípicos directamente en habla sintetizada fluida. Así, Kanevsky ha efectuado una demostración de cómo esta tecnología posibilita el entendimiento con el altavoz inteligente Google Home.

Con un algoritmo de reconocimiento de sonidos con IA basado en el software TensorFlow, la startup Visualfy se dedica a integrar en los hogares una aplicación para que las personas sordas se den cuenta de cuándo suena el timbre, salta la alarma o llora un bebé. El sistema se basa en un dispositivo central y micrófonos situados en distintos sitios que escuchan todo lo que sucede en la casa y traducen estos sonidos en señales luminosas. “Nuestro trabajo sin la inteligencia artificial sería inviable. Con ella podemos implementar este sistema de una manera sencilla y de forma más eficaz y económica”, ha señalado Manel Alcaide, CEO de Visualfy.

La inteligencia artificial también ha dado ojos a las personas invidentes. La aplicación Lookout facilita como nunca su autonomía. Basada en el uso de la cámara del teléfono móvil, la app informa en voz alta de todo que reconoce cuando la enfocas. De esta manera, les es posible identificar todo lo que hay a su alrededor, saber dónde están, por dónde van y poder interactuar con el mundo. “Con la inteligencia artificial, coloco el dispositivo más o menos a la altura de mi cara y con la cámara puedo saber las puertas de embarque en un aeropuerto. Simplemente con eso ya puedo guiarme solo”, ha explicado Enhamed Enhamed, medallista paralímpico español, quien utiliza el móvil para saber los restaurantes cercanos a su alrededor, conocer las cartas con el menú o saber con qué billete va pagar la cuenta. “Estas tecnologías me han facilitado la vida enormemente porque puedo enterarme del contenido de los mensajes de correo electrónico, de los comentarios de las redes sociales, de las cartas que te llegan a casa y de los textos de las imágenes”.

En el encuentro organizado por Google todos han resaltado la importancia de la tecnología para las personas con discapacidad. El acercamiento a ella surge por una necesidad, y es algo que le puede pasar a cualquiera. Porque todos nos vamos a hacer mayores y es entonces cuando merman las capacidades auditivas y visuales.

Recomendaciones del editor