Skip to main content

La inteligencia artificial detecta mensajes de odio incluso con el uso de códigos

inteligencia artificial mensajes odio redes sociales hatespeech 640x0
Imagen utilizada con permiso del titular de los derechos de autor
Los trolls racistas utilizan con frecuencia palabras-código como insultos. Pero existe un algoritmo inteligente, diseñado para saber lo que están diciendo.

Cualquier persona que haya tenido un sitio web bloqueado por su filtro de Internet sabe que los programas diseñados para bloquear ciertas piezas de contenido a menudo pueden dar problemas.

Una de las razones de esto es que las búsquedas de palabras clave pueden resultar herramientas demasiado contundentes para tratar con algo tan complejo y en constante evolución como el lenguaje.

Esto es particularmente cierto cuando se trata de encontrar palabras clave odiosas en las redes sociales.

Por ejemplo, el año pasado Alphabet publicó un algoritmo diseñado para filtrar palabras racistas, sólo para los trolls que comenzaron a sustituir el nombre de los productos de Google por insultos raciales.

Sin embargo, un nuevo algoritmo, desarrollado por investigadores de la Universidad de Rochester, cree que el problema se ha resquebrajado.

Analizando los comentarios en Twitter se han podido distinguir frases como «gas the Skypes» (un sustituto de «Judios») y «I hate Skype» (“Odio Skype”) con un impresionante 80% de precisión.

«Hemos desarrollado un algoritmo de análisis de datos inteligente para seguir los códigos de odio en constante evolución que están diseñados para evadir la detección», explica a Digital Trends el profesor Jiebo Luo, coautor del artículo.

«Empezamos con un conjunto de códigos de odio conocidos, recuperamos los mensajes de odio que contienen estos códigos, [y] construimos un modelo de lenguaje usando técnicas de aprendizaje automático para reconocer mensajes de odio. En base a esto, hacemos dos cosas: [en primer lugar], usando el modelo de lenguaje detectamos mensajes de odio en curso que pueden contener nuevos códigos de odio, y [en segundo lugar] usamos mensajes de odio detectados para identificar a los propagadores de odio cuyos nuevos mensajes se usan para descubrir nuevos códigos de odio», matiza Luo.

Se trata de saber qué palabras se correlacionan con otras, descubriendo así cuando una palabra del soporte se está utilizando para algo más, agregando contexto. Claro que estos pueden ser cambiados también, pero hay un límite de palabras que un troll puede cambiar antes de hacer su declaración original totalmente ininteligible.

En conclusión, se trata de un uso muy inteligente del aprendizaje automático. Sí, los límites de lo que está bien decir online todavía están siendo elaborados. Pero cuando se trata de detener a la gente con retórica odiosa, herramientas como ésta van mucho más allá de búsquedas de palabras clave simples.

«Esperamos obtener más datos para hacer nuestro modelo más robusto y preciso», subraya Luo. «En última instancia, esperamos que las principales plataformas de redes sociales, como Twitter, Facebook y otras, puedan adoptar nuestra tecnología, que se describe en este documento, y probablemente estará más desarrollada para ofrecer una mayor precisión. Nuestro esfuerzo continuo es utilizar la ciencia de los datos para el bien social «.

Recomendaciones del editor

Estefania Oliver
Ex escritor de Digital Trends en Español
Estefania Oliver Palazón nació y creció en Valencia, España. Allí estudió Comunicación Audiovisual y, durante sus…
Verizon celebra el Mes de la Herencia Hispana con el Pibe Valderrama
verizon mes de la herencia hispana pibe valderrama carlos 2016

Son más de 60 millones los hispanos que viven en Estados Unidos y por eso desde el 15 de septiembre hasta el 15 de octubre, se celebra el Mes de la Herencia Hispana.

Y Verizon quiere celebrar este hito con algunos anuncios:

Leer más
OJO con las aplicaciones de embarazo y el periodo y la privacidad
aplicaciones embarazos periodos falta privacidad smiling pregnant woman using her smartphone at home

En un mundo post-Roe, ahora que el aborto es ilegal y restringido en la mayoría de los estados, los estadounidenses se han preocupado por las protecciones de privacidad que proporcionan sus aplicaciones favoritas para el período y el embarazo. Parece que la preocupación está justificada, ya que un informe de Mozilla ha encontrado que las aplicaciones de seguimiento de ciclos más populares no protegen la privacidad de sus usuarios en absoluto.

Investigadores de la Fundación Mozilla, una organización sin fines de lucro mejor conocida por el navegador Firefox que ahora trabaja para promover una Internet abierta, analizaron 25 aplicaciones de salud reproductiva y dispositivos portátiles que podrían recopilar datos confidenciales y compartirlos con terceros, y eso incluye a las autoridades que pueden usarlo para procesar a las personas que cruzan las fronteras estatales para buscar abortos. El informe encontró que la mayoría de esas aplicaciones, 18 de ellas, no tenían claro qué datos compartirían con las fuerzas del orden y cuándo.

Leer más
Juega a «detectar la diferencia» con el nuevo logotipo de Play Store de Google
malware apps google play store

Google Play, la tienda de aplicaciones donde probablemente obtenga la mayoría de sus aplicaciones de Android, ha cumplido 10 años y para celebrar el aniversario, Google ha desechado el antiguo logotipo y le ha dado a la tienda en línea uno completamente nuevo. Bueno, cuando decimos "completamente nuevo", podemos estar presionándolo un poco, ya que el nuevo logotipo de Google Play sigue siendo un triángulo multicolor que se asemeja a un botón de reproducción tradicional, así que no esperes un gran cambio.
Nuevo logotipo de Play (izquierda) y antiguo logotipo de Play (derecha)
¿Qué es exactamente diferente? La mejor manera de entender lo que Google ha alterado es mirar los logotipos antiguos y nuevos uno al lado del otro, lo que puede hacer en la imagen de arriba. Aunque sigue siendo un triángulo, los cambios son obvios cuando los ves juntos. Los mismos colores permanecen: azul (#4285F4), rojo (#EA4335), amarillo (#FBBC04) y verde (#34A853), pero son sólidos y menos vívidos que en la versión anterior, y el diseño tiene un mejor equilibrio. El triángulo en sí tiene una forma ligeramente diferente, y las esquinas son significativamente más curvas.

Según Tain Lim, vicepresidente de Google Play, el nuevo logotipo: "Refleja mejor la magia de Google y coincide con la marca compartida por muchos de nuestros productos útiles: Búsqueda, Asistente, Fotos, Gmail y más".

Leer más