Han pasado casi dos meses desde que OpenAI lanzó su revolucionario nuevo sistema GPT-4o, que incursionaba en la interacción conversacional y por audio con el usuario.
Bueno, recién después de este tiempo, la gente de la compañía lanzó resultados de una evaluación de seguridad que hicieron al nuevo protocolo.
Se evaluaron riesgos tales como la posibilidad de que GPT-4o generara clones no autorizados de la voz de alguien, contenido erótico y violento, o fragmentos de audio con derechos de autor. Actualmente, se están revelando los resultados de dicha evaluación.
Según el propio marco de OpenAI, los investigadores consideraron que GPT-4o tenía un riesgo «medio». El nivel de riesgo general se tomó de la calificación de riesgo más alta de cuatro categorías generales: ciberseguridad, amenazas biológicas, persuasión y autonomía del modelo. Todos estos se consideraron de bajo riesgo, excepto la persuasión, donde los investigadores encontraron que algunas muestras de escritura de GPT-4o podrían ser mejores para influir en las opiniones de los lectores que el texto escrito por humanos, aunque las muestras del modelo no fueron más persuasivas en general.
«OpenAI ha implementado varias medidas y mitigaciones de seguridad a lo largo del proceso de desarrollo y despliegue de GPT-4o. Como parte de nuestro proceso de implementación iterativo, continuaremos monitoreando y actualizando las mitigaciones de acuerdo con el panorama en evolución. Esperamos que esta tarjeta del sistema fomente la exploración en áreas clave que incluyen, entre otras: mediciones y mitigaciones para la robustez adversaria de los modelos omni, impactos relacionados con el antropomorfismo de la IA, el uso de modelos omni para la investigación y el avance científicos, mediciones y mitigaciones para capacidades peligrosas como la automejora, la autonomía del modelo y la intriga. Más allá de estas áreas, fomentamos la investigación sobre los impactos económicos de los modelos omni y cómo el uso de herramientas podría mejorar las capacidades de los modelos», concluye el estudio completo que se puede leer acá.