Un equipo de investigadores de la Universidad de California (UC) en Berkeley entrenaron un sistema de inteligencia artificial (IA) para que interpretara los movimientos de los músculos del rostro y la garganta de una persona y reprodujera las palabras que ese individuo en cuestión quería decir… Sin abrir la boca.
Este dispositivo de IA les permite a los científicos entender a aquellas personas que no pueden pronunciar palabras de forma audible, informa Venture Beat.
Lo que ellos denominan como “habla silenciosa” se detecta mediante electromiografía (EMG), es decir, con electrodos colocados en la cara y la garganta del paciente. El modelo se centra en lo que los investigadores llaman “voz digital” que predice palabras y genera habla artificial.
Los investigadores creen que su método puede facilitar la creación de aplicaciones para personas que no pueden producir habla audible y podría permitir que asistentes de IA puedan detectar las voces.
“Expresar digitalmente el habla silenciosa tiene una amplia gama de aplicaciones potenciales”, se lee en el documento presentado por el equipo investigador.
“Por ejemplo, podría usarse para crear un dispositivo análogo a un auricular bluetooth. Este podría permitir a las personas mantener conversaciones telefónicas sin interrumpir a quienes las rodean. Un dispositivo de este tipo también podría ser útil en entornos en los que el ambiente es demasiado ruidoso para capturar el habla audible o donde es importante mantener el silencio”.
Para realizar este trabajo los investigadores utilizaron grabaciones de audio y las compararon con las señales silenciosas producidas por los electrodos del sistema de detección.
La IA interpretó las señales silenciosas con resultados similares a las grabaciones de audio.