Secciones

La Rioja
Sucesos
Logroño
Fiestas de San Mateo
Comarcas
Calahorra

Arnedo

Haro

Lardero

Alfaro

Villamediana

Nájera

Santo Domingo

Cervera
Vino
Esquelas
Campo
Deportes
Fútbol

Primera RFEF

Segunda RFEF

Tercera Riojana

Balonmano

Baloncesto

Pelota
España
Mundo
Economia
Ader
Universidad de La Rioja
Vivir
Planes
Festival Actual

Pantallas
Culturas
Opinión
Sociedad
Gente
Salud
Ciencia
Antropía
Tecnología
Degusta
Mascotas
Tengo una tienda
Edificios secretos
Podcast
Blogs
Última hora
XL Semanal
Fotogalerías
Videos
TVR

Servicios

Destacamos

Las tripas de DeepSeek. Así ha sorprendido la IA china

El éxito de la empresa asiática se basa en materiales más baratos, pero también en sistemas de pensamiento más eficaces que los occidentales

Óscar Beltrán de Otálora

Miércoles, 29 de enero 2025, 00:23 | Actualizado 10:12h.

Lo que ha pasado con DeepSeek es algo así como si un Seat Panda hubiese ganado las 24 horas de Le Mans, dejando a las grandes escuderías a la altura del barro. La empresa China ha creado uno de los denominados 'momentos Sputnik'. Este término hace referencia a la carrera espacial entre Estados Unidos y la Unión Soviética y al instante en el que los comunistas consiguieron colocar un satélite en órbita ante la mirada atónita de los norteamericanos. Ahora ha sucedido lo mismo. Mientras que las grandes empresas como Open AI, Meta o Google se sentían en la cima del mundo y sus dueños posaban en la foto con el nuevo presidente de Estados Unidos, los chinos han demostrado que pueden hacer lo mismo, pero por una porción ridícula de dinero.

Para entender esta victoria hay una serie de factores a tener en cuenta, tanto técnicos como teóricos.

¿Quién manda en DeepSeek?

Liang Wenfeng, máximo responsable de DeepSeek

DeepSeek es una creación de la startup china HighFlyer. Su máximo responsable es Liang Wenfeng, un joven nacido hace 40 años en Cantón, China. Según algunas fuentes, uno de sus aciertos fue conseguir acumular miles de GPUs (unidades de procesamiento gráfico en inglés) del fabricante norteamericano Nvidia en un almacén antes de que desde Estados Unidos se prohibiera la venta de determinado equipamiento a China, precisamente, para evitar que lo utilizase en la carrera de la Inteligencia Artificial.

Sus primeros modelos de Inteligencia Artificial comenzaron a divulgarse en 2023, pero todavía no eran tan conocidos como el ChatGPT de Open AI. El 20 de enero de 2025 lanzó su modelo 'Deep Seek R1', el que ha revolucionado el mundo de la tecnología. El fin de semana pasado divulgaron en un 'paper' cómo lo habían creado y cómo habían conseguido abaratar todo el proceso. El lunes, cuando la cotización de Nvidia se hundió, la aplicación de DeepSeek ya era la más descargada en Apple.

Nvidia H800, la GPU 'limitada' para el mercado chino

Cubierta metálica

Smartphone a escala

26 cm

11 cm

Conexión PCI-E

(a la placa base)

Coste por unidad:

19.000 -

29.000 €

(según la cantidad)

2.048

GPUs utilizadas por Deepseek para su entrenamiento

16.000

chips más potentes y caros para entrenar ChatGPT-4

Cubierta metálica

Smartphone a escala

26 cm

11 cm

Conexión PCI-E

(a la placa base)

Coste por unidad:

19.000 -

29.000 €

(según la cantidad)

2.048

GPUs utilizadas por Deepseek para su entrenamiento

16.000

chips más potentes y caros para entrenar ChatGPT-4

Smartphone a escala

Cubierta metálica

26 cm

11 cm

Conexión PCI-E

(a la placa base)

Coste por unidad:

19.000 - 29.000 €

(según la cantidad)

16.000

2.048

GPUs utilizadas por Deepseek para su entrenamiento

chips más potentes y caros para entrenar ChatGPT-4

Smartphone a escala

Cubierta metálica

26 cm

11 cm

Conexión PCI-E

(a la placa base)

Coste por unidad:

19.000 - 29.000 €

(según la cantidad)

16.000

2.048

GPUs utilizadas por Deepseek para su entrenamiento

chips más potentes y caros para entrenar ChatGPT-4

Menos chips y más baratos

Los desarrolladores chinos han demostrado que son capaces de utilizar una cantidad reducida de chips para entrenar a su modelo de inteligencia artificial. Frente a los 16.000 que requiere un sistema de entrenamiento de las IAs occidentales, la china solo ha utilizado 2.000 chips Nvidia.

Esta empresa tecnológica, que lleva años liderando la fabricación de chips destinados entre otras cosas, a entrenar modelos de Inteligencia Artificial, lanzó al mercado su 'H100', un procesador considerado de los más avanzados del mundo por la cantidad de información que es capaz de gestionar. Era el Ferrari de este tipo de dispositivos. Pero el Gobierno de Estados Unidos prohibió su venta a China, ya que su uso marcaba, en ese momento, la frontera en el desarrollo de la IA. ¿Qué hizo DeepSeek? utilizó una versión anterior con mucha menos capacidad de gestionar información: el H800. Este aparato, con un precio aproximado de 20.000 euros por unidad, es asequible y de venta libre. Era un producto de capacidad limitada creado para el mercado chino y sortear así las limitaciones existentes en Estados Unidos para vender tecnología en el gigante asiático.

Coste del entrenamiento de los distintos modelos

(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)

ChatGPT-4

ChatGPT-3

4 mill.

41 millones

DeepSeek

78 millones

6 millones

DALL-E

Gemini-1

0,18-0,30 millones

30 millones

191 millones

Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar

1.000

millones

(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)

ChatGPT-4

ChatGPT-3

DALL-E

4 millones

0,18-0,30

41 millones

DeepSeek

78 millones

6 millones

Gemini-1

30 millones

191 millones

Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar

1.000

millones

(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)

Gemini-1

ChatGPT-3

ChatGPT-4

2 millones

DALL-E

4 millones

41 millones

Entre

0,18-0,30

millones

30 millones

78 millones

191 millones

DeepSeek

6 millones

Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar

1.000 millones

ChatGPT-4

ChatGPT-5

(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)

Gemini-1

ChatGPT-3

2 millones

4 millones

DeepSeek

6 millones

DALL-E

Entre

ChatGPT-4

0,18-0,30

millones

30 millones

191 millones

41 millones

78 millones

Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar

1.000 millones

ChatGPT-4

ChatGPT-5

Noticia relacionada

DeepSeek frente a ChatGPT: así responden las IA del momento

José A. González

Las 'recompensas'

Una de las claves de DeepSeek es que el entrenamiento de sus modelos de IA es mucho más sencillo. Mientras que las inteligencias artificiales que se utilizaban hasta ahora utilizaban un sistema complejo y con asistentes exteriores para entrenar sus capacidades, DeepSeek ha empleado un sistema distinto. La IA china se basa en el modelo de «recompensas», lo que implica que tiene unos baremos internos que dan la aprobación a sus contenidos. Esta recompensa se basa en dos conceptos: la eficacia y el estilo. El primero de ellos se refiere a la precisión a la hora de manejar la información que encuentra en la red. El segundo, a cuestiones como el uso correcto del idioma en el que es apelada, el formato, el tipo de texto, etc…Lo que significa esta innovación, en términos simplificados, es que a DeepSeek no hay que pagarle el colegio, sino que ella se autoeduca.

En este sentido, una de las novedades que aporta DeepSeek con respecto a otros chatbots es que el usuario puede pulsar la función R1, en la que la IA muestra su «proceso mental». El cliente, de esa forma, puede leer todo el 'razonamiento' que ha utilizado la máquina para responder a la pregunta que se le ha cuestionado.

Los 'expertos'

Otra de las ventajas de DeepSeek es que dispone de la figura de los 'expertos' más avanzados hasta el momento. Simplificando mucho, las IAs más avanzadas disponen de los conocidos como MoE (Mezcla de Expertos, por sus siglas en inglés) que se encargan de priorizar la información que gestionan los procesadores ante las demandas de los clientes. En la práctica, los MoE de la IA China simplifican toda la gestión, con lo que es más fácil conseguir información y se ahorra en consumo de energía y necesidad de soporte técnico.

Código abierto

Quizás este sea el avance más demoledor. DeepSeek está escrito en código abierto, es decir, en un lenguaje informático público y de libre acceso a todo el mundo. ¿Qué supone? Es posible descargarse el código y crear una IA propia en un ordenador si dispone de la capacidad suficiente. Además, se puede adaptar por los propios usuarios y es gratuita, no como los modelos más avanzados de ChatGPT, que son de pago. Por ello, millones de personas han corrido a instalársela en el móvil o el ordenador. Y es que, en principio, ofrece los mismos servicios que las versiones avanzadas que la inteligencia artificial de Open AI, pero sin pagar un euro.

Créditos