Skip to main content

DeepSeek coder: qué es y cómo funciona

DeepSeek
DTES

¿Cómo se construye el modelo de lenguaje de DeepSeek?, ¿Necesita cierta capacidad de GPU para desarrollarse? y ¿Cómo le va contra la competencia?.

Bueno, comencemos por una definición del DeepSeek coder: DeepSeek-Coder-V2 es un modelo de lenguaje de código abierto Mixture-of-Experts (MoE) que logra un rendimiento comparable al de GPT4-Turbo en tareas específicas de código.

Recommended Videos

En concreto, DeepSeek-Coder-V2 se entrena previamente desde un punto de control intermedio de DeepSeek-V2 con 6 billones de tokens adicionales. A través de este entrenamiento previo continuo, DeepSeek-Coder-V2 mejora sustancialmente las capacidades de codificación y razonamiento matemático de DeepSeek-V2, al tiempo que mantiene un rendimiento comparable en tareas generales del lenguaje. 

DeepSeek Coder comprende una serie de modelos de lenguaje de código entrenados desde cero con un 87 % de código y un 13 % de lenguaje natural en inglés y chino, con cada modelo pre entrenado en tokens 2T. Proporcionamos varios tamaños del modelo de código, que van desde las versiones 1B hasta 33B.

«Cada modelo se entrena previamente en un corpus de código a nivel de repositorio mediante el empleo de un tamaño de ventana de 16K y una tarea adicional de rellenar los espacios en blanco, lo que da como resultado modelos fundamentales (DeepSeek-Coder-Base). Ajustamos aún más el modelo base con 2 mil millones de tokens de datos de instrucción para obtener modelos ajustados a la instrucción, denominados DeepSeek-Coder-Instruct», dicen en DeepSeek.

  • Entrenado previamente en 2 billones de tokens en más de 80 lenguajes de programación.
  • Varios tamaños de modelo (1.3B5.7B6.7B y 33B) para cumplir con diferentes requisitos.
  • Un tamaño de ventana de 16K, que admite la finalización y el relleno de código a nivel de proyecto.
  • Rendimiento de última generación entre modelos de código abierto.
  • Código abierto y gratuito para investigación y uso comercial.

En su sitio de GitHub, DeepSeek afirma que  «Si desea utilizar DeepSeek-Coder-V2 en formato BF16 para la inferencia, se requieren GPU de 80 GB*8».

Rendimiento de DeepSeek coder

En las evaluaciones de referencia estándar, y según ellos mismos muestran, DeepSeek-Coder-V2 logra un rendimiento superior en comparación con los modelos de código cerrado como GPT4-Turbo, Claude 3 Opus y Gemini 1.5 Pro en las pruebas comparativas de codificación y matemáticas:

Imagen utilizada con permiso del titular de los derechos de autor

«DeepSeek-Coder-V2 demuestra avances significativos en varios aspectos de las tareas relacionadas con el código, así como en el razonamiento y las capacidades generales. Además, DeepSeek-Coder-V2 amplía su compatibilidad con lenguajes de programación de 86 a 338, al tiempo que amplía la longitud del contexto de 16K a 128K», dice la compañía china.

ACÁ EL CÓDIGO EN GITHUB DE DEEPSEEK

ACÁ EL CÓDIGO EN GITHUB DE DEEPSEEK
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
He aquí por qué el módem C1 de Apple es una buena noticia para la futura duración de la batería de la MacBook
macbook air 15 pulgadas m2 analisis precio 11

En 2008, Steve Jobs dijo que Apple había pensado en agregar un módem 3G a sus computadoras portátiles para brindarles capacidades inalámbricas sin necesidad de una conexión Wi-Fi. Sin embargo, la compañía finalmente abandonó la idea porque los chips ocuparían demasiado espacio dentro de las famosas computadoras portátiles de Apple. Durante años, la idea parecía muerta en el agua.
Ahora, finalmente podría llegar a buen término 20 años después de la sincera afirmación de Jobs. Es un giro notable de los acontecimientos y podría traer numerosos beneficios a los usuarios de MacBook.
Esta idea ha sido planteada por el periodista de Bloomberg Mark Gurman en su boletín Power On. Allí, Gurman explica que Apple planea llevar su chip de módem interno, demostrado por primera vez en el reciente iPhone 16e, a otros dispositivos Apple en los próximos años. Es casi seguro que eso incluiría algunos de los mejores MacBooks, y si lo hace, podría traer una gran cantidad de beneficios.
Trae los beneficios

Apple

Leer más
Algunos analistas creen que DeepSeek solo será un “Temu” de la IA
DeepSeek

La irrupción de DeepSeek provocó olas en Wall Street, con Nvidia perdiendo $600 mil millones de dólares de valuación en un solo día —la mayor pérdida registrada en un solo día por una empresa en la historia de Estados Unidos—. Sin embargo, analistas de la firma Wedbush consideran que, pese a que DeepSeek es sorprendente, “este pequeño laboratorio chino de inteligencia artificial no va a tirar todo el ecosistema tecnológico de Estados Unidos”, indican en una nota que puedes leer aquí. “Decían hace algunos años que Temu sería ‘el modelo que destruirá a Amazon’, Amazon ajustó y bueno, juzguen ustedes”, agregan los analistas.

En su nota, los analistas sugieren que las declaraciones acerca de cuánto costó desarrollar el modelo gratuito de DeepSeek podrían ser, básicamente, mentiras.

Leer más
Las tablets regresan como el Ave Fenix y dos marcas chinas triunfan
tableta Huawei MatePad Pro 5G

El pasado año 2024 fue un momento de resurrección en la venta de tablets, ya que desde la pandemia que no tenían un peak tan importante, tal como lo reflejó un estudio de la consultora Canalys.

Pero lo más significativo, es que en la cuota de mercado, si bien Apple y sus iPads siguen dominando en volumen de venta a nivel mundial, las marcas chinas Xiaomi y Huawei son las que más porcentaje de crecimiento anual tuvieron con un 73,1% y un 29,3% respectivamente.
"A medida que el mercado de PC gira hacia un ciclo de actualización comercial, también hay una recuperación en la demanda de tabletas", dijo Himani Mukka, gerente de investigación de Canalys. "Una encuesta reciente de Canalys a socios de canal encontró que el 52% de los que venden tabletas comerciales esperan que sus envíos aumenten en 2025, con un 32% que espera un rendimiento plano y solo el 16% que anticipa una disminución. Las oportunidades de actualización seguirán siendo abundantes en una variedad de industrias y verticales, ya que se espera que la inversión en TI se fortalezca después de un período prolongado de restricciones presupuestarias".
En 2024, los proveedores chinos tuvieron un buen desempeño en el mercado de tabletas. Xiaomi lideró la carga con un notable crecimiento anual del 73%, asegurando el quinto lugar en la clasificación general, superando a Amazon. Huawei también experimentó un crecimiento impresionante, con un aumento del 29% en los envíos, lo que le permitió ascender al tercer lugar. Lenovo ocupó el cuarto lugar, con 10 millones de tabletas vendidas y un crecimiento interanual del 12%. Apple amplió su posición de liderazgo con un crecimiento del 14% en el cuarto trimestre de 2024 y un modesto aumento del 5,3% para todo el año, enviando 16,9 millones de iPads en el trimestre. Este crecimiento fue impulsado por el lanzamiento de los nuevos modelos iPad Mini y iPad Air. Samsung ocupó el segundo lugar, con 7,1 millones de unidades vendidas y un crecimiento anual del 3,9%.

Leer más