El CEO de Tesla/X, Elon Musk, parece creer que entrenar modelos de IA con datos creados únicamente por humanos se está volviendo imposible. Musk afirma que hay una creciente falta de datos del mundo real con los que entrenar modelos de IA, incluido su chatbot Grok AI.
«Ahora hemos agotado básicamente la suma acumulada del conocimiento humano… en el entrenamiento de IA», dijo Musk durante una entrevista en vivo realizada por el presidente de Stagwell, Mark Penn. «Eso sucedió básicamente el año pasado».
Los comentarios de Musk reflejan los del exinvestigador de OpenAI Ilya Sutskever, quien predijo en diciembre pasado que la industria de la IA había alcanzado «datos máximos». La solución de Musk a este problema, los datos sintéticos, también refleja la industria en general. Google, OpenAI, Anthropic y Meta ya aprovechan los datos sintéticos para entrenar sus modelos.
«La única forma de complementar [los datos del mundo real] es con datos sintéticos, donde la IA crea [datos de entrenamiento]», dijo Musk. «Con datos sintéticos… [La IA] se calificará a sí misma y pasará por este proceso de autoaprendizaje».
Si bien el uso de datos sintéticos puede ofrecer importantes ahorros de costos a las empresas, algunos estudios sugieren que la dependencia excesiva de los datos sintéticos puede conducir al colapso del modelo, donde las respuestas de la IA se vuelven menos creativas y más sesgadas con el tiempo, ya que se entrenan repetidamente con datos generados recursivamente.
La falta de datos derivados de humanos no ha impedido que X convierta su función Grok AI en su propia aplicación para iOS el jueves. El chatbot y el generador de imágenes, notables por su completa falta de propiedad intelectual o barreras de seguridad, solían estar disponibles solo para personas que desembolsaban $ 8 al mes por una cuenta premium X. Sin embargo, la nueva aplicación es gratuita para que cualquiera la descargue.