Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. Tendencias
  5. News

DeepSeek coder: qué es y cómo funciona

DeepSeek
DTES

¿Cómo se construye el modelo de lenguaje de DeepSeek?, ¿Necesita cierta capacidad de GPU para desarrollarse? y ¿Cómo le va contra la competencia?.

Bueno, comencemos por una definición del DeepSeek coder: DeepSeek-Coder-V2 es un modelo de lenguaje de código abierto Mixture-of-Experts (MoE) que logra un rendimiento comparable al de GPT4-Turbo en tareas específicas de código.

Recommended Videos

En concreto, DeepSeek-Coder-V2 se entrena previamente desde un punto de control intermedio de DeepSeek-V2 con 6 billones de tokens adicionales. A través de este entrenamiento previo continuo, DeepSeek-Coder-V2 mejora sustancialmente las capacidades de codificación y razonamiento matemático de DeepSeek-V2, al tiempo que mantiene un rendimiento comparable en tareas generales del lenguaje. 

DeepSeek Coder comprende una serie de modelos de lenguaje de código entrenados desde cero con un 87 % de código y un 13 % de lenguaje natural en inglés y chino, con cada modelo pre entrenado en tokens 2T. Proporcionamos varios tamaños del modelo de código, que van desde las versiones 1B hasta 33B.

«Cada modelo se entrena previamente en un corpus de código a nivel de repositorio mediante el empleo de un tamaño de ventana de 16K y una tarea adicional de rellenar los espacios en blanco, lo que da como resultado modelos fundamentales (DeepSeek-Coder-Base). Ajustamos aún más el modelo base con 2 mil millones de tokens de datos de instrucción para obtener modelos ajustados a la instrucción, denominados DeepSeek-Coder-Instruct», dicen en DeepSeek.

  • Entrenado previamente en 2 billones de tokens en más de 80 lenguajes de programación.
  • Varios tamaños de modelo (1.3B5.7B6.7B y 33B) para cumplir con diferentes requisitos.
  • Un tamaño de ventana de 16K, que admite la finalización y el relleno de código a nivel de proyecto.
  • Rendimiento de última generación entre modelos de código abierto.
  • Código abierto y gratuito para investigación y uso comercial.

En su sitio de GitHub, DeepSeek afirma que  «Si desea utilizar DeepSeek-Coder-V2 en formato BF16 para la inferencia, se requieren GPU de 80 GB*8».

Rendimiento de DeepSeek coder

En las evaluaciones de referencia estándar, y según ellos mismos muestran, DeepSeek-Coder-V2 logra un rendimiento superior en comparación con los modelos de código cerrado como GPT4-Turbo, Claude 3 Opus y Gemini 1.5 Pro en las pruebas comparativas de codificación y matemáticas:

Imagen utilizada con permiso del titular de los derechos de autor

«DeepSeek-Coder-V2 demuestra avances significativos en varios aspectos de las tareas relacionadas con el código, así como en el razonamiento y las capacidades generales. Además, DeepSeek-Coder-V2 amplía su compatibilidad con lenguajes de programación de 86 a 338, al tiempo que amplía la longitud del contexto de 16K a 128K», dice la compañía china.

ACÁ EL CÓDIGO EN GITHUB DE DEEPSEEK

ACÁ EL CÓDIGO EN GITHUB DE DEEPSEEK
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El Padrino de la IA dice que Google superará con creces a OpenAI
Geoffrey Hinton

Geoffrey Hinton, investigador legendario considerado uno de los pioneros fundamentales en el desarrollo de la inteligencia artificial moderna, ha realizado una declaración que genera reverberaciones significativas dentro de la industria tecnológica: sostiene que Google está en proceso de superar a OpenAI en la competición por liderar la próxima generación de sistemas de IA. Esta evaluación proviene de una figura cuya trayectoria científica incluye contribuciones decisivas a los campos del aprendizaje profundo y las redes neuronales, galardones que le permitieron obtener el Premio Nobel de Física en 2024.​

Durante una entrevista concedida a Business Insider, Hinton reflexionó sobre la ironía histórica de esta situación. Recordó que Google fue pionera en tecnología de transformadores desde 2017, cuando sus investigadores publicaron el revolucionario artículo "Attention Is All You Need" que transformaría radicalmente el panorama de la IA. Además, Google desarrolló chatbots avanzados antes que cualquier otra organización, pero una postura excesivamente cautelosa limitó su velocidad en la comercialización de estas tecnologías. Hinton atribuyó esta prudencia a la preocupación corporativa por proteger la reputación global de Google tras observar los desastres de imagen que enfrentó Microsoft con su fallido chatbot Tay en 2016, cuando la herramienta generó contenido ofensivo en redes sociales.

Read more
¿Quién es el nuevo amo y señor del Mundial de Excel?
Mundial Excel

Diarmuid Early, un consultor financiero irlandés con experiencia especializada en modelado financiero avanzado, se ha coronado como campeón del Microsoft Excel World Championship 2025, consolidando su posición como la máxima autoridad global en el dominio de la aplicación de hojas de cálculo mediante un desempeño que dejó un margen de superioridad abrumador sobre sus competidores.

Early completó exitosamente todos los desafíos presentados en la final en vivo realizada en la HyperX Arena de Las Vegas, terminando su caso ganador con una ventaja de más de cinco minutos sobre sus rivales más cercanos en tiempo de ejecución.​

Read more
Tu próximo PC Dell o Lenovo podría costar más muy pronto
Computer, Computer Hardware, Computer Keyboard

¿Qué ha pasado? La crisis de oferta en DRAM y NAND flash, impulsada inicialmente por el aumento de la demanda de los centros de datos de IA, ha afectado por fin duramente al hardware de consumo. Según informes recientes del sector a través de TrendForce, las principales marcas están reaccionando: según se informa, Dell y Lenovo están preparando aumentos significativos de precios en sus líneas de PC y servidores para absorber el aumento vertiginoso de los costes de los componentes. Esto ocurre después de que HP ya advirtiera de subidas de precios en su gama de PCs y portátiles, mientras que AMD también advirtió sobre un aumento en los precios de sus GPU.

Según se informa, Dell planea un aumento del 15–20% en muchos de sus servidores y PC tan pronto como a mediados de diciembre.

Read more