Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

OpenAI acusa con pruebas que DeepSeek plagió sus modelos de entrenamiento

DeepSeek
DTES

Una grave acusación está realizando OpenAI a su más novel competidor chino, DeepSeek, ya que en una investigación conjunta con Microsoft está indicando con «pruebas concretas» de que la IA asiática entrenó su modelo con datos robados de la compañía de Sam Altman.

Fuentes de Bloomberg, dijeron que los investigadores de seguridad de Microsoft detectaron que a finales de 2024 se estaban filtrando grandes cantidades de datos a través de las cuentas de los desarrolladores de OpenAI, que la empresa cree que están afiliadas a DeepSeek.

Recommended Videos

OpenAI le dijo al Financial Times que encontró evidencia que vincula a DeepSeek con el uso de la destilación, una técnica común que los desarrolladores usan para entrenar modelos de IA extrayendo datos de otros más grandes y capaces. Es una forma eficiente de entrenar modelos más pequeños a una fracción de los más de 100 millones de dólares que OpenAI gastó para entrenar GPT-4. Si bien los desarrolladores pueden usar la API de OpenAI para integrar su IA con sus propias aplicaciones, destilar los resultados para construir modelos rivales es una violación de los términos de servicio de OpenAI. 

El jefe de la inteligencia artificial del presidente Donald Trump, David Sacks, dijo que «es posible» que se haya producido un robo de propiedad intelectual. «Hay evidencia sustancial de que lo que DeepSeek hizo aquí es destilar conocimiento de los modelos de OpenAI y no creo que OpenAI esté muy contento con esto», dijo Sacks a Fox News el martes.

Lo que dijo OpenAI

Esto es un extracto de lo que OpenAI envío como comunicado al medio Bloomberg en respuesta a esta acusación.

«Sabemos que las empresas con sede en la República Popular China (China), y otras, están constantemente tratando de destilar los modelos de las principales empresas de IA de EE. UU.», dijo OpenAI en un comunicado a Bloomberg. «Como líder en la construcción de IA, nos involucramos en contramedidas para proteger nuestra propiedad intelectual, incluido un proceso cuidadoso para determinar qué capacidades de frontera incluir en los modelos lanzados, y creemos que, a medida que avanzamos, es de vital importancia que trabajemos en estrecha colaboración con el gobierno de los EE. UU. para proteger mejor los modelos más capaces de los esfuerzos de los adversarios y competidores para tomar la tecnología estadounidense».

 

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
¿Qué es DeepSeek AI y por qué tiene asustados y en jaque a ChatGPT y todos los demás?
DeepSeek

El mundo de la IA se despertó este lunes 27 de enero en Estados Unidos en pánico, con OpenAI y Perplexity y otras plataformas mirando con atención la aparición en el top 1 de descargas de la App Store de Apple de DeepSeek AI, un modelo de IA proveniente de China que se caracteriza a grandes rasgos por ser de código abierto y donde además los usuarios comentan que la función de búsqueda que acompaña a DeepSeek ahora es superior a competidores como OpenAI y Perplexity, y solo rivaliza con Gemini Deep Research de Google.
DeepSeek afirma que DeepSeek R1 supera a los modelos de IA de la competencia en varios puntos de referencia clave.

https://twitter.com/deepseek_ai/status/1881318130334814301?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1881318130334814301%7Ctwgr%5E979fce7d8d6b5b56a885ac9540261299e735f8e9%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fmashable.com%2Farticle%2Fdeepseek-chatgpt-apple-app-store

Leer más
Misterioso acuerdo entre OpenAI y propietario de enorme editorial
Penguin Random House

Un acuerdo bastante curioso es el que se fraguó esta semana entre Bertelsmann (propietario de la editorial Penguin Random House) y la firma de IA de Sam Altman, OpenAI.
Esta alianza, que incluye la implementación de herramientas como ChatGPT Enterprise para todos los empleados del grupo, busca potenciar la creación de contenido, mejorar la eficiencia operativa y explorar nuevas formas de distribución digital.
De entrada, Bertelsmann ha dejado claro que el objetivo es usar la IA generativa para apoyar y potenciar los procesos creativos en todas sus divisiones. En el ámbito editorial, esto se traduce en iniciativas como recomendaciones de libros personalizadas en redes sociales, una herramienta que PRHGE ya venía explorando.
Lo más curioso de todo, es que la misma editorial Penguin Random House había señalado en octubre de 2024  que prohibiría el uso de sus libros para entrenar modelos de lenguaje de gran tamaño (LLM). La multinacional implementó una advertencia en los derechos de autor de todos sus libros, indicando que «ninguna parte de este libro puede utilizarse o reproducirse de ninguna manera con el propósito de entrenar tecnologías o sistemas de inteligencia artificial». Además, alineándose con la regulación de la Unión Europea, también expresó su rechazo al scraping de sus obras y reafirmó su compromiso de proteger los derechos de sus autores.
Rolf Hellermann, CFO de Bertelsmann, asegura que el compromiso con el "uso responsable" de la IA es prioritario, pero estas palabras necesitarán traducirse en acciones concretas para ganar la confianza de la comunidad creativa.
Un ejemplo reciente es el de la editorial HarperCollins que permitió que se usaran ciertos títulos de no ficción para entrenar modelos de IA, pero solo con el consentimiento expreso de los autores y ofreciendo compensaciones económicas. Aunque este modelo de "consentimiento informado" podría ser un camino intermedio, también deja preguntas sobre qué tan inclusivo o rentable puede ser para los autores de menor perfil o para títulos de catálogo menos visibles.

Leer más
OpenAI sube otro peldaño: así será la nueva IA que debuta en días
ChatGPT: qué es y cómo usar el chatbot del que todo el mundo habla.

El último modelo de razonamiento de OpenAI, o3 mini, ya es oficial, y el CEO de la compañía, Sam Altman, ha compartido recientemente detalles sobre la tecnología en X. Señaló que el modelo debería estar listo para su lanzamiento en un par de semanas, con disponibilidad para los usuarios de API y ChatGPT al mismo tiempo.

https://twitter.com/sama/status/1880356297985638649?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1880356297985638649%7Ctwgr%5E8a635ee3b0c9d557d0288130c96bce62d80c09d9%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fwww.digitaltrends.com%2Fcomputing%2Fopenai-prepares-o3-mini-model-launch-with-over-o1%2F

Leer más