Un modelo de reconocimiento de sonidos basado en el aprendizaje profundo permitirá detectar la ubicación de los sonidos de tos en tiempo real, según anunciaron investigadores coreanos.
El sistema funciona con una cámara de sonido, que es capaz de rastrear y registrar información sobre la persona que tosió, cuántas veces lo hizo y su ubicación precisa en espacios públicos. Todo en tiempo real.
El mecanismo obtuvo una precisión de 87,4 por ciento en las pruebas iniciales, según el Centro de Control de Ruido y Vibraciones del Instituto Avanzado de Ciencia y Tecnología de Corea (Kaist).
Yong-Hwa Park, académico de la casa de estudios coreana y responsable de la investigación, afirmó que el desarrollo puede ser útil en lugares públicos, como escuelas, oficinas y restaurantes, y para monitorear a los pacientes en un hospital.
«Cuando se aplica a una habitación de hospital, la condición del paciente se puede rastrear las 24 horas del día y apoyar diagnósticos más precisos al tiempo que se reduce el esfuerzo del personal médico», explicó Park.
La fiebre y la tos son los síntomas más relevantes de afecciones respiratorias. Los investigadores también esperan que la tecnología permita detectar la transmisión de enfermedades sin contacto, como el coronavirus.
«En una situación de pandemia como la que estamos viviendo con el COVID-19, una cámara de detección de tos puede contribuir a la prevención y detección temprana de epidemias en lugares públicos», pronosticó el especialista.
Cómo funciona
El modelo de clasificación tos se combina con una cámara de sonido que visualiza el evento e indica su ubicación en un video, con una imagen de contorno con una etiqueta de «tos».
Para desarrollar un modelo de reconocimiento, se realizó un aprendizaje supervisado con una red neuronal convolucional (CNN, por sus siglas en inglés).
El modelo realiza una clasificación binaria con una entrada de una característica de perfil de sonido de un segundo, generando una salida en caso de que se trate de otro sonido.
La tos y otros sonidos se extrajeron de Audioset, mientras que se usaron otros sonidos como fondo, de modo que este modelo pudiera conocer distintos sonidos en lugares públicos.