Comprueban cómo se puede engañar a un detector de deepfakes

A finales de 2020, Microsoft anunció un software que podía ayudar a detectar fotos o videos deepfakes (ultrafalsos).

Sin embargo, un grupo de informáticos recién aseguró que estos sistemas pueden ser engañados.

Durante la conferencia WACV 2021, los investigadores demostraron que los detectores pueden ser derrotados mediante la inserción de entradas denominadas “ejemplos adversos” en cada fotograma del video.

Los ejemplos adversos pueden ser definidos como entradas ligeramente manipuladas, que hacen que los sistemas de inteligencia artificial (IA), se equivoquen y cometan errores.

El equipo de investigadores también pudo demostrar que el ataque sigue funcionando después de comprimir los videos, además de advertir sobre los riesgos que pueden significar la posibilidad de vencer a los detectores de ultrafalsos.

“Nuestro trabajo demuestra que los ataques a los detectores de deepfakes pueden ser una amenaza en el mundo real”, explicó Shehzeen Hussain, doctorando en ingeniería informática de la Universidad de California en San Diego.

Agregó que “demostramos que es posible elaborar deepfakes adversarios robustos, incluso cuando un adversario puede no ser consciente del funcionamiento interno del modelo de aprendizaje automático utilizado por el detector”.

La difusión masiva de videos falsos en las redes sociales ha causado gran preocupación en todo el mundo. Según los autores, esto también afectaría la credibilidad de los medios digitales.

“Si los atacantes tienen algún conocimiento del sistema de detección, pueden diseñar entradas que apunten a los puntos ciegos del detector y evitarlo”, añadió Paarth Neekhara, otro de los autores del artículo.

Como conclusión principal, los científicos demostraron que los métodos actuales de detección de ultrafalsos pueden ser eludidos con facilidad por alguien que tenga un conocimiento completo o incluso parcial del detector.

Por lo mismo, recomiendan que estos sistemas sean mejorados y adaptados para que no puedan ser eludidos por los atacantes.

Recomendaciones del editor