Skip to main content

La inteligencia artificial detecta mensajes de odio incluso con el uso de códigos

inteligencia artificial mensajes odio redes sociales hatespeech 640x0
Imagen utilizada con permiso del titular de los derechos de autor
Los trolls racistas utilizan con frecuencia palabras-código como insultos. Pero existe un algoritmo inteligente, diseñado para saber lo que están diciendo.

Cualquier persona que haya tenido un sitio web bloqueado por su filtro de Internet sabe que los programas diseñados para bloquear ciertas piezas de contenido a menudo pueden dar problemas.

Una de las razones de esto es que las búsquedas de palabras clave pueden resultar herramientas demasiado contundentes para tratar con algo tan complejo y en constante evolución como el lenguaje.

Esto es particularmente cierto cuando se trata de encontrar palabras clave odiosas en las redes sociales.

Por ejemplo, el año pasado Alphabet publicó un algoritmo diseñado para filtrar palabras racistas, sólo para los trolls que comenzaron a sustituir el nombre de los productos de Google por insultos raciales.

Sin embargo, un nuevo algoritmo, desarrollado por investigadores de la Universidad de Rochester, cree que el problema se ha resquebrajado.

Analizando los comentarios en Twitter se han podido distinguir frases como «gas the Skypes» (un sustituto de «Judios») y «I hate Skype» (“Odio Skype”) con un impresionante 80% de precisión.

«Hemos desarrollado un algoritmo de análisis de datos inteligente para seguir los códigos de odio en constante evolución que están diseñados para evadir la detección», explica a Digital Trends el profesor Jiebo Luo, coautor del artículo.

«Empezamos con un conjunto de códigos de odio conocidos, recuperamos los mensajes de odio que contienen estos códigos, [y] construimos un modelo de lenguaje usando técnicas de aprendizaje automático para reconocer mensajes de odio. En base a esto, hacemos dos cosas: [en primer lugar], usando el modelo de lenguaje detectamos mensajes de odio en curso que pueden contener nuevos códigos de odio, y [en segundo lugar] usamos mensajes de odio detectados para identificar a los propagadores de odio cuyos nuevos mensajes se usan para descubrir nuevos códigos de odio», matiza Luo.

Se trata de saber qué palabras se correlacionan con otras, descubriendo así cuando una palabra del soporte se está utilizando para algo más, agregando contexto. Claro que estos pueden ser cambiados también, pero hay un límite de palabras que un troll puede cambiar antes de hacer su declaración original totalmente ininteligible.

En conclusión, se trata de un uso muy inteligente del aprendizaje automático. Sí, los límites de lo que está bien decir online todavía están siendo elaborados. Pero cuando se trata de detener a la gente con retórica odiosa, herramientas como ésta van mucho más allá de búsquedas de palabras clave simples.

«Esperamos obtener más datos para hacer nuestro modelo más robusto y preciso», subraya Luo. «En última instancia, esperamos que las principales plataformas de redes sociales, como Twitter, Facebook y otras, puedan adoptar nuestra tecnología, que se describe en este documento, y probablemente estará más desarrollada para ofrecer una mayor precisión. Nuestro esfuerzo continuo es utilizar la ciencia de los datos para el bien social «.

Recomendaciones del editor

Estefania Oliver
Ex escritor de Digital Trends en Español
Estefania Oliver Palazón nació y creció en Valencia, España. Allí estudió Comunicación Audiovisual y, durante sus…
La IA detecta el cáncer de mamas como los humanos y más rápido
ia detecta cancer de mamas rebekah vos koqlw776d2o unsplash

Un avance científico muy valioso podría estar dándose en el campo de la salud y en la detección del cáncer de mamas de manera más específica, ya que un estudio publicado en la revista The Lancet Oncology realizó un ensayo aleatorizado con 80,000 mujeres entre las edades de 40 a 80, con una edad media de 54 años, para comparar la eficacia de la IA en la lectura de mamografías en comparación con las lecturas estándar de los radiólogos.

Para llevar a cabo el ensayo, las mujeres que optaron por participar en el estudio en los cuatro sitios de detección en Suecia fueron asignadas aleatoriamente a exámenes apoyados por IA o lecturas dobles estándar sin IA en una proporción de 1: 1, lo que significa que la mitad fueron examinadas por AI y la otra mitad por radiólogos.

Leer más
WhatsApp ahora permite transferencia de chats solo con un código QR
WhatsApp pantalla

Este viernes 30 de junio, Mark Zuckerberg, anunció oficialmente la nueva funcionalidad de WhatsApp: la transferencia de chats y archivos solo con un código QR y con un sistema interno, dejando las molestias de respaldar y pasar por Google Cloud o iCloud.

A través de un vídeo señala brevemente cómo utilizar esta nueva funcionalidad que ya ha comenzado su despliegue y, según nos confirman, “llegará en los próximos días” a todos.

Leer más
Australia amenaza a Twitter con enormes multas por discurso de odio
memes muerte fin twitter

Twitter podría recibir enormes multas en Australia después de que el organismo de control cibernético de la nación antípoda le pidiera a la compañía de redes sociales que explicara qué está haciendo para prevenir el odio en línea.

El comisionado de eSafety dijo el jueves que ha recibido más quejas sobre el odio en línea en Twitter en los últimos 12 meses que cualquier otra plataforma, y ha recibido un número creciente de informes de graves abusos en línea desde la adquisición de la compañía por parte de Elon Musk en octubre.

Leer más