La IA es lo más parecido a un músculo humano, mientras más entrenamiento logres darle, mayor serán las satisfacciones en relación a la respuesta que puede dar. De alguna manera, «golpeará más fuerte donde hay que pegar» y eso es lo que todas las compañías dedicas a estos sistemas de aprendizaje buscan. Apple, que ha estado un poco rezagada en ponerse al día con la IA, ahora quiere dotar a Apple Intelligence y su potencial nuevo Siri, de más datos.
Y para entrenar cualquier IA, se necesitan datos humanos, lenguaje, estudios, documentos, incluso con el riesgo de pasar a llevar la propiedad intelectual o la privacidad del usuario.
Esto se debe a que los chatbots, que técnicamente se conocen como Grandes Modelos de Lenguaje (LLM), intentan comprender el patrón y la relación entre las palabras. Herramientas como ChatGPT, que ahora están integradas en Siri y Apple Intelligence, son esencialmente predictores de palabras.
¿Qué dirías si para entrenar a la IA, Apple usara lo que escribes o recibes en tus correos electrónicos? Se encenderían las alarmas de peligro posiblemente.
¿Qué quiere hacer Apple para entrenar a su IA?
Los de Cupertino publicaron un documento de investigación de Machine Learning que detalla un nuevo enfoque para entrenar su IA integrada utilizando datos almacenados en su iPhone, comenzando con correos electrónicos. Estos mails se utilizarán para mejorar funciones como el resumen de correo electrónico y las herramientas de escritura.
Ahora, ¿cómo pretende Apple saltarse la delgada línea roja que separa la privacidad del usuario y la ilegalidad que supondría comenzar a sacar datos y mensajes de los iPhones de sus usuarios?.
Lo que realmente haría la gente de Tim Cook es echar un vistazo indirecto a sus correos electrónicos, sin copiarlos ni enviarlos nunca a sus servidores. En pocas palabras, todos sus datos permanecen en su teléfono. Además, Apple técnicamente no va a «leer» sus correos electrónicos. En su lugar, simplemente los comparará con una pila de correos electrónicos sintéticos.
El ingrediente secreto aquí es identificar qué datos sintéticos son los que más se acercan a un correo electrónico escrito por un humano. Eso le daría a Apple una idea sobre qué tipo de datos es la forma más realista en que los humanos participan en una conversación. Hasta ahora, Apple ha utilizado «normalmente» datos sintéticos para el entrenamiento de IA, informa Bloomberg.
«Estos datos sintéticos se pueden utilizar para probar la calidad de nuestros modelos en datos más representativos e identificar áreas de mejora para características como el resumen», explica la compañía. Podría conducir a mejoras tangibles en las respuestas que obtenga de Siri y Apple Intelligence en el futuro.
Apple promete que tú seguirás teniendo el control
Como informa Digital Trends en inglés, «solo los usuarios que hayan acordado explícitamente compartir datos de Device Analytics con Apple formarán parte del proceso de entrenamiento de IA».
Puede habilitarlo siguiendo esta ruta: Configuración > Privacidad y seguridad > Análisis y mejoras. Según se informa, la compañía pondrá en marcha los planes con las próximas actualizaciones beta de iOS 18.5, iPad 18.5 y macOS 15.5. Ya se ha lanzado una compilación correspondiente dirigida a desarrolladores.
«Este proceso nos permite mejorar los temas y el lenguaje de nuestros correos electrónicos sintéticos, lo que nos ayuda a entrenar nuestros modelos para crear mejores salidas de texto en funciones como resúmenes de correo electrónico, al tiempo que protegemos la privacidad», dice la compañía.
Veremos qué tan cuidadosos serán en el proceso.