Para los desarrolladores valientes que quieran incursionar en el código abierto y que busquen una alternativa de ChatGPT, Philip Wang, el desarrollador responsable de la ingeniería inversa de sistemas de IA de código cerrado, lanzó PaLM + RLHF.
El sistema combina PaLM, un modelo de lenguaje grande de Google, y una técnica llamada Reinforcement Learning with Human Feedback (RLHF, para abreviar) para crear un sistema que pueda realizar casi cualquier tarea que ChatGPT pueda, incluida la redacción de correos electrónicos y la sugerencia de código informático.
Sin embargo, existe un problema: el sistema no ha sido entrenado con los datos de ejemplo de la web necesarios para que realmente funcione. Descargar PaLM + RLHF no instalará mágicamente una experiencia similar a ChatGPT, lo que requeriría compilar gigabytes de texto de los que el modelo puede aprender y encontrar hardware lo suficientemente robusto como para manejar la carga de trabajo de entrenamiento.
Sebastian Raschka, un investigador de IA, señala en una publicación de LinkedIn sobre PaLM + RLHF que ampliar los flujos de trabajo de desarrollo necesarios también podría ser un desafío. «Incluso si alguien le proporciona 500 GPU para entrenar este modelo, aún necesita tener que lidiar con la infraestructura y tener un marco de software que pueda manejar eso», dijo. «Obviamente es posible, pero es un gran esfuerzo en este momento (por supuesto, estamos desarrollando marcos para hacerlo más simple, pero aún no es trivial)».