Skip to main content

Live Transcribe: cuando la inteligencia artificial transforma tu vida

Abres la cámara del teléfono, tomas la foto y, como por arte de birlibirloque, la inteligencia artificial reconoce los objetos fotografiados y, en función de los que ve, mejora la foto. Es solo uno de los múltiples usos de la IA en los celulares. Está claro que esta tecnología facilita mucho el día a día de cualquiera. En el caso de las personas con alguna discapacidad o mayores, transforma la vida radicalmente. Dimitri Kanevsky, científico de Google, sordo desde los tres años, lo sabe bien. Lleva treinta años investigando en proyectos relacionados con aplicaciones que hacen este mundo más accesible a quienes padecen pérdida auditiva.

Imagen utilizada con permiso del titular de los derechos de autor

Live Transcribe es una de esas aplicaciones mágicas desarrolladas por Kanevsky. Integrada en el móvil, permite obtener una transcripción de una conversación en tiempo real. Hemos podido comprobar su gran utilidad a través del investigador, quien ha realizado una demostración de esta tecnología en las oficinas de Google en Madrid. Así, mientras contaba todos los proyectos de investigación en los que trabaja actualmente, los asistentes podíamos leer al instante en una pantalla todo lo que explicaba. Gracias a este software, que está disponible en 70 idiomas, él puede comunicarse mejor con sus nietos.

Ahora que los podcast están más de moda que nunca, imaginaos lo que aplicaciones como Live Caption suponen para las personas sordas: esta herramienta facilita el poder leer lo que escucha. O lo que es lo mismo, subtitula automáticamente lo que se reproduce en un teléfono. Pero no vale cualquier celular ni funciona en español. Si quieres disfrutar de este software que solo es compatible con el inglés, deberás comprar un Pixel 4 o un Pixel 3.

El científico de Google también trata de mejorar la comunicación de personas con problemas del habla a través de los proyectos de investigación Euphonia y Parrotron. El primero, que se enmarca dentro del programa de Google “AI for social good”, tiene como objetivo optimizar los algoritmos basados en inteligencia artificial para que los móviles y computadoras transcriban de forma más precisa las palabras pronunciadas por enfermos de ELA con dificultades del habla. El segundo, convierte las palabras de un hablante con patrones de habla atípicos directamente en habla sintetizada fluida. Así, Kanevsky ha efectuado una demostración de cómo esta tecnología posibilita el entendimiento con el altavoz inteligente Google Home.

Con un algoritmo de reconocimiento de sonidos con IA basado en el software TensorFlow, la startup Visualfy se dedica a integrar en los hogares una aplicación para que las personas sordas se den cuenta de cuándo suena el timbre, salta la alarma o llora un bebé. El sistema se basa en un dispositivo central y micrófonos situados en distintos sitios que escuchan todo lo que sucede en la casa y traducen estos sonidos en señales luminosas. “Nuestro trabajo sin la inteligencia artificial sería inviable. Con ella podemos implementar este sistema de una manera sencilla y de forma más eficaz y económica”, ha señalado Manel Alcaide, CEO de Visualfy.

Google Play Store: Live Transcribe

La inteligencia artificial también ha dado ojos a las personas invidentes. La aplicación Lookout facilita como nunca su autonomía. Basada en el uso de la cámara del teléfono móvil, la app informa en voz alta de todo que reconoce cuando la enfocas. De esta manera, les es posible identificar todo lo que hay a su alrededor, saber dónde están, por dónde van y poder interactuar con el mundo. “Con la inteligencia artificial, coloco el dispositivo más o menos a la altura de mi cara y con la cámara puedo saber las puertas de embarque en un aeropuerto. Simplemente con eso ya puedo guiarme solo”, ha explicado Enhamed Enhamed, medallista paralímpico español, quien utiliza el móvil para saber los restaurantes cercanos a su alrededor, conocer las cartas con el menú o saber con qué billete va pagar la cuenta. “Estas tecnologías me han facilitado la vida enormemente porque puedo enterarme del contenido de los mensajes de correo electrónico, de los comentarios de las redes sociales, de las cartas que te llegan a casa y de los textos de las imágenes”.

En el encuentro organizado por Google todos han resaltado la importancia de la tecnología para las personas con discapacidad. El acercamiento a ella surge por una necesidad, y es algo que le puede pasar a cualquiera. Porque todos nos vamos a hacer mayores y es entonces cuando merman las capacidades auditivas y visuales.

Marta Villalba
Marta Villalba, periodista madrileña, se inició en el periodismo tecnológico cuando todavía no existía Google y los…
Xiaomi Smart Factory: la fábrica cien por ciento automatizada de la marca china
xiaomi smart factory fabrica cien por ciento automatizada

¿Sabías que el último Xiaomi Mix Fold de la compañía china fue fabricado de manera íntegra por robots y procesos automatizados? Sí, eso es así, fueron más de 1 millón de dispositivos que salieron de la Xiaomi Smart Factory.

La compañía dice que el sistema es lo suficientemente inteligente como para diagnosticar y solucionar problemas, así como para optimizar sus propios procesos para "evolucionar por sí mismo".
La instalación de 80.000 metros cuadrados (860.000 pies cuadrados), ubicada en el distrito de Changping, en las afueras del noreste de Beijing.
"Hay 11 líneas de producción", dice el fundador y CEO de Xiaomi, Lei Jun, en un breve video, incrustado a continuación. "El 100% de los procesos clave están automatizados. Para lograrlo, desarrollamos todo nuestro software de producción y fabricación".

Leer más
Los mapas de PamPam revivieron mi interés en ser un Local Guide
Una imagen de la plataforma de mapas PamPam.

Llegué a PamPam bajo la promesa de conocer una especie de nuevo Waze con inteligencia artificial. Lo que hallé me pareció más bien una especie de Google Maps con suficiente encanto para revivir al curioso que fui que gustaba de aportar cualquier detalle a los mapas de Google cuando era un ávido local guide.

PamPam, explica su cofundadora Helena Jaramillo, es “una nueva forma de hacer guías y mapas para tu comunidad”. Sí, es algo que ya hemos visto con aplicaciones como los famosos mapas de Google, pero PamPam tiene su encanto. Por ejemplo, cada lugar se decora con una imagen que me recuerda a los memojis, los iconos animados del iPhone. También les puedes colocar links de redes sociales. 

Leer más
Unboxing de todos los productos que Samsung presentó en su Unpacked
unboxing samsung unpacked 2024 galaxy z fold 6

Samsung
Samsung lanzó oficialmente una serie de dispositivos nuevos y renovados en su muy esperado evento Unpacked el miércoles.

El botín incluye dos teléfonos plegables, el Galaxy Z Fold 6 y el Galaxy Z Flip 6, el nuevo Galaxy Watch Ultra, la primera incursión de Samsung en los anillos inteligentes en forma de Galaxy Ring, y los Galaxy Buds 3 y Buds 3 Pro.

Leer más