Skip to main content
  1. Home
  2. Redes sociales
  3. Features

El próximo paso de ChatGPT: moderar contenido ilegal y polémico en Facebook

Add as a preferred source on Google

GPT-4, el modelo de lenguaje grande (LLM) que impulsa ChatGPT Plus, pronto puede asumir un nuevo papel como moderador en línea, vigilando foros y redes sociales en busca de contenido nefasto que no debería ver la luz del día. Eso es según una nueva publicación de blog del desarrollador de ChatGPT OpenAI, que dice que esto podría ofrecer «una visión más positiva del futuro de las plataformas digitales».

Al reclutar inteligencia artificial (IA) en lugar de moderadores humanos, OpenAI dice que GPT-4 puede promulgar «iteraciones mucho más rápidas en los cambios de política, reduciendo el ciclo de meses a horas». Además de eso, «GPT-4 también es capaz de interpretar reglas y matices en la documentación de políticas de contenido largo y adaptarse instantáneamente a las actualizaciones de políticas, lo que resulta en un etiquetado más consistente», afirma OpenAI.

Una pantalla de computadora portátil muestra la página de inicio de ChatGPT, el chatbot de inteligencia artificial de OpenAI.
Rolf van Root / Unsplash

Por ejemplo, la publicación del blog explica que los equipos de moderación podrían asignar etiquetas al contenido para explicar si cae dentro o fuera de las reglas de una plataforma determinada. GPT-4 podría entonces tomar el mismo conjunto de datos y asignar sus propias etiquetas, sin saber las respuestas de antemano.

Recommended Videos

Los moderadores podrían comparar los dos conjuntos de etiquetas y usar cualquier discrepancia para reducir la confusión y agregar aclaraciones a sus reglas. En otras palabras, GPT-4 podría actuar como un usuario cotidiano y evaluar si las reglas tienen sentido.

El costo humano

Imagen utilizada con permiso del titular de los derechos de autor

El modelo de lenguaje grande GPT-4 de OpenAI intenta moderar una pieza de contenido. El resultado se compara con el análisis humano del contenido.

En este momento, la moderación de contenido en varios sitios web es realizada por humanos, lo que los expone a contenido potencialmente ilegal, violento o dañino de forma regular. Hemos visto repetidamente el terrible costo que la moderación de contenido puede tener en las personas, con Facebook pagando $ 52 millones a los moderadores que sufrieron de trastorno de estrés postraumático debido a los traumas de su trabajo.

Reducir la carga de los moderadores humanos podría ayudar a mejorar sus condiciones de trabajo, y dado que las IA como GPT-4 son inmunes al tipo de estrés mental que los humanos sienten cuando manejan contenido problemático, podrían implementarse sin preocuparse por el agotamiento y el trastorno de estrés postraumático.

Sin embargo, plantea la cuestión de si el uso de la IA de esta manera resultaría en pérdidas de empleos. La moderación de contenido no siempre es un trabajo divertido, pero es un trabajo de todos modos, y si GPT-4 toma el relevo de los humanos en esta área, es probable que exista la preocupación de que los antiguos moderadores de contenido simplemente sean redundantes en lugar de reasignados a otros roles.

OpenAI no menciona esta posibilidad en su publicación de blog, y eso realmente es algo que las plataformas de contenido deben decidir. Pero podría no hacer mucho para disipar los temores de que la IA sea implementada por grandes empresas simplemente como una medida de ahorro de costos, con poca preocupación por las consecuencias.

Aún así, si la IA puede reducir o eliminar la devastación mental que enfrentan los equipos sobrecargados de trabajo y subestimados que moderan el contenido en los sitios web utilizados por miles de millones de personas todos los días, podría haber algo bueno en todo esto. Queda por ver si eso se verá atenuado por despidos igualmente devastadores.

Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
Topics
Estafas cripto se disfrazan de MrBeast en Threads
Thread MrBeast

Una investigación reveló que las cuentas que inundan Threads con capturas falsas sobre Mr. Beast forman parte de una red masiva de fraude criptográfico . El análisis, realizado por Zach Edwards, investigador de seguridad de Infoblox, identificó más de 10,000 sitios web fraudulentos vinculados a este esquema, presentados como "casinos cripto" . Estas cuentas publican capturas de pantalla de baja resolución que imitan artículos de medios como The Times o CNN, acompañadas de frases sin sentido, y suelen incluir imágenes de flores junto a un iPhone, en un patrón diseñado para evadir la moderación algorítmica.

Según explicó Edwards, la estrategia busca "enterrar" el dominio fraudulento dentro de la publicación para que los sistemas de detección automatizados no lo detecten con facilidad.

Read more
X Live Studio: de qué se trata esta nueva herramienta post Twitter
X Live Studio

X está haciendo un esfuerzo serio para convertirse en un destino para el vídeo en directo, lanzando una nueva herramienta llamada Live Studio y comprometiéndose a pagar 1 millón de dólares a los creadores para atraer streamers a la plataforma. Nikita Bier, jefe de producto de X, anunció la herramienta en X con una demo mostrando cómo funciona.

Controles de streaming, análisis en tiempo real y un pago de 1 millón de dólares

Read more
WhatsApp te vende: los usernames abren la puerta a publicidad personalizada
WhatsApp pantalla

WhatsApp lanzó una de sus funciones más visibles en años: nombres de usuario únicos que permiten localizar y contactar a una cuenta sin compartir el número telefónico, una opción pensada para modernizar la forma de conectar en la app. Pero detrás de la comodidad aparece una pregunta incómoda: ¿sirven estos usernames para algo más que facilitar contactos? La respuesta, según varias fuentes y la propia arquitectura del ecosistema Meta, apunta a que sí —y a que ese “sí” podría traducirse en un terreno más propicio para la publicidad personalizada.

La idea oficial es simple y legítima: sustituir el número por un identificador público, evitar suplantaciones y permitir búsquedas más directas. WhatsApp incorpora reglas para los nombres, evita duplicados y permite reservar identificadores, incluso reservando y bloqueando nombres vinculados a marcas o cuentas empresariales para prevenir fraudes. Pero la funcionalidad no nace en aislamiento: Meta promueve la vinculación de cuentas a través del Centro de Cuentas —la capa que integra Facebook, Instagram, Threads y WhatsApp— y esa interconexión es justo el factor que convierte un simple “@usuario” en una pieza útil para la segmentación publicitaria.

Read more