Skip to main content

Investigación expone el lado más turbio de ChatGPT y la industria de chatbots de IA

Una investigación de Time ha expuesto el lado más oscuro de la industria de chatbots de IA, destacando cómo al menos una startup ha estado utilizando prácticas cuestionables para mejorar su tecnología.

Publicado el miércoles, el informe de Time se centra en OpenAI respaldado por Microsoft y su chatbot ChatGPT, una tecnología que ha ganado mucha atención recientemente por su notable capacidad para producir texto conversacional altamente natural.

Recommended Videos

La investigación de Time descubrió que para entrenar la tecnología de IA, OpenAI utilizó los servicios de un equipo en Kenia para estudiar detenidamente el texto que incluía temas perturbadores como el abuso sexual infantil, la bestialidad, el asesinato, el suicidio, la tortura, las autolesiones y el incesto. Y por sus esfuerzos para etiquetar el contenido aborrecible, muchos en el equipo recibieron menos de $ 2 por hora.

El trabajo, que comenzó en noviembre de 2021, era necesario ya que el predecesor de ChatGPT, GPT-3, aunque impresionante, tenía una tendencia a arrojar contenido ofensivo, ya que su conjunto de datos de entrenamiento se había compilado raspando cientos de miles de millones de palabras de todos los rincones de la web.

El equipo con sede en Kenia, operado por la firma Sama de San Francisco, etiquetaría el contenido ofensivo para ayudar a entrenar el chatbot de OpenAI, mejorando así su conjunto de datos y reduciendo las posibilidades de cualquier resultado objetable.

Digital Trends Español

Time dijo que los cuatro empleados de Sama que entrevistó describieron estar mentalmente marcados por su trabajo. Sama ofreció sesiones de asesoramiento, pero los empleados dijeron que eran ineficaces y rara vez se llevaron a cabo debido a las demandas del trabajo, aunque un portavoz de Sama le dijo a Time que los terapeutas estaban disponibles en cualquier momento.

Un trabajador le dijo a Time que leer el material impactante a veces se sentía como «tortura», y agregó que se sentían «perturbados» al final de la semana.

En febrero de 2022, las cosas tomaron un giro aún más oscuro para Sama cuando OpenAI lanzó un proyecto separado no relacionado con ChatGPT que requería que su equipo de Kenia recopilara imágenes de naturaleza sexual y violenta. OpenAI le dijo a Time que el trabajo era necesario para hacer que sus herramientas de IA fueran más seguras.

A las pocas semanas de que comenzara este proyecto basado en imágenes, la naturaleza alarmante de las tareas llevó a Sama a cancelar todos sus contratos con OpenAI, aunque Time sugiere que también podría haber sido provocado por las consecuencias de relaciones públicas de un informe sobre un tema similar que publicó sobre Facebook aproximadamente al mismo tiempo.

Open AI le dijo a Time que había habido «una falta de comunicación» sobre la naturaleza de las imágenes que le pidió a Sama que recopilara, insistiendo en que no había pedido las imágenes más extremas y que no había visto ninguna de las que se habían enviado.

Pero la finalización de los contratos afectó los medios de vida de los trabajadores, ya que algunos miembros del equipo en Kenia perdieron sus empleos, mientras que otros fueron trasladados a proyectos con salarios más bajos.

La investigación de Time ofrece una mirada incómoda pero importante al tipo de trabajo que se está realizando en los chatbots impulsados por IA que recientemente han estado entusiasmando tanto a la industria tecnológica.

Si bien es transformadora y potencialmente beneficiosa, la tecnología claramente tiene un costo humano y plantea una serie de preguntas éticas sobre cómo las empresas desarrollan sus nuevas tecnologías y, en términos más generales, sobre cómo los países más ricos continúan asignando tareas menos deseables a las naciones más pobres por un menor desembolso financiero.

Las nuevas empresas detrás de la tecnología estarán bajo un escrutinio más centrado en los próximos meses y años, por lo que harían bien en revisar y mejorar sus prácticas lo antes posible.

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
¿Por qué ChatGPT es malo en matemáticas?
ChatGPT buscador

Cualquier usuario asiduo de ChatGPT sabe que el modelo de lenguaje amplio de OpenAI es malo en matemáticas. Sí, claro que resolverá problemas simples como una resta, pero cuando le pides una operación relativamente básica como una multiplicación con cifras medianamente grandes, ChatGPT comienza a mostrar sus carencias. ¿Por qué ChatGPT es malo en matemáticas? Hay varias razones, pero también algunas soluciones que podrían resultar interesantes desde un punto de vista de desarrollo que vamos a tratar de explicar.
Es que las matemáticas no son lo suyo

Hay varias razones que explican por qué ChatGPT es malo en matemáticas. Quizá la más importante es el tipo de material con el que ha sido entrenado: internet. Nos explicamos. ChatGPT es un modelo de lenguaje amplio (large language model o LLM por sus siglas en inglés) diseñado para generar conversaciones similares a las que tendrían dos humanos. Para lograr esta característica fue entrenado con técnicas de deep learning, es decir, ChatGPT “aprende” de patrones y estructuras de millones de textos disponibles en internet. Con esa “fuente de conocimiento” genera respuestas relevantes según el contexto en el que se le pregunta.

Leer más
Un investigador hace creer a ChatGPT que tiene 102 años y vive en la Matrix
¿Qué es ChatGPT? Cómo usar el chatbot del que todo el mundo habla.

ChatGPT, el modelo amplio de lenguaje más utilizado y prometedor del mundo, puede usarse para extraer información sensible de un usuario, según reportó a OpenAI el investigador en ciberseguridad Johann Rehberger.

Su hallazgo, contado en un videoblog consignado por  ArsTechnica, es una fuente de preocupación, pues señala que “cada que el usuario inicia una nueva conversación ChatGPT continúa extrayendo información”.

Leer más
ChatGPT: la cantidad de recursos que necesita para funcionar se está saliendo de control
IA generativa ChatGPT.

No es un secreto que el crecimiento de la IA generativa ha requerido cantidades cada vez mayores de agua y electricidad, dado que la infraestructura necesaria para soportar estas tecnologías implica un uso intensivo de recursos. Sin embargo, un nuevo estudio de The Washington Post e investigadores de la Universidad de California, Riverside, muestra cuántos recursos necesita el chatbot de OpenAI para realizar incluso sus funciones más básicas.

En términos de uso de agua, la cantidad necesaria para que ChatGPT redacte un correo electrónico de 100 palabras depende del estado y de la proximidad del usuario al centro de datos más cercano de OpenAI. Cuanto menos prevalente sea el agua en una región determinada y cuanto más barato sea la electricidad, más probable es que el centro de datos dependa de unidades de aire acondicionado eléctricas. En Texas, por ejemplo, el chatbot solo consume un estimado de 235 mililitros para generar un correo electrónico de 100 palabras. Ese mismo correo redactado en Washington, por otro lado, requeriría 1,408 mililitros (casi un litro y medio) por correo.

Leer más