Secciones
Servicios
Destacamos
Óscar Beltrán de Otálora
Miércoles, 29 de enero 2025, 00:23
Lo que ha pasado con DeepSeek es algo así como si un Seat Panda hubiese ganado las 24 horas de Le Mans, dejando a las grandes escuderías a la altura del barro. La empresa China ha creado uno de los denominados 'momentos Sputnik'. Este término hace referencia a la carrera espacial entre Estados Unidos y la Unión Soviética y al instante en el que los comunistas consiguieron colocar un satélite en órbita ante la mirada atónita de los norteamericanos. Ahora ha sucedido lo mismo. Mientras que las grandes empresas como Open AI, Meta o Google se sentían en la cima del mundo y sus dueños posaban en la foto con el nuevo presidente de Estados Unidos, los chinos han demostrado que pueden hacer lo mismo, pero por una porción ridícula de dinero.
Para entender esta victoria hay una serie de factores a tener en cuenta, tanto técnicos como teóricos.
DeepSeek es una creación de la startup china HighFlyer. Su máximo responsable es Liang Wenfeng, un joven nacido hace 40 años en Cantón, China. Según algunas fuentes, uno de sus aciertos fue conseguir acumular miles de GPUs (unidades de procesamiento gráfico en inglés) del fabricante norteamericano Nvidia en un almacén antes de que desde Estados Unidos se prohibiera la venta de determinado equipamiento a China, precisamente, para evitar que lo utilizase en la carrera de la Inteligencia Artificial.
Sus primeros modelos de Inteligencia Artificial comenzaron a divulgarse en 2023, pero todavía no eran tan conocidos como el ChatGPT de Open AI. El 20 de enero de 2025 lanzó su modelo 'Deep Seek R1', el que ha revolucionado el mundo de la tecnología. El fin de semana pasado divulgaron en un 'paper' cómo lo habían creado y cómo habían conseguido abaratar todo el proceso. El lunes, cuando la cotización de Nvidia se hundió, la aplicación de DeepSeek ya era la más descargada en Apple.
Cubierta metálica
Smartphone a escala
26 cm
11 cm
Conexión PCI-E
(a la placa base)
Coste por unidad:
19.000 -
29.000 €
(según la cantidad)
2.048
GPUs utilizadas por Deepseek para su entrenamiento
16.000
chips más potentes y caros para entrenar ChatGPT-4
Cubierta metálica
Smartphone a escala
26 cm
11 cm
Conexión PCI-E
(a la placa base)
Coste por unidad:
19.000 -
29.000 €
(según la cantidad)
2.048
GPUs utilizadas por Deepseek para su entrenamiento
16.000
chips más potentes y caros para entrenar ChatGPT-4
Smartphone a escala
Cubierta metálica
26 cm
11 cm
Conexión PCI-E
(a la placa base)
Coste por unidad:
19.000 - 29.000 €
(según la cantidad)
16.000
2.048
GPUs utilizadas por Deepseek para su entrenamiento
chips más potentes y caros para entrenar ChatGPT-4
Smartphone a escala
Cubierta metálica
26 cm
11 cm
Conexión PCI-E
(a la placa base)
Coste por unidad:
19.000 - 29.000 €
(según la cantidad)
16.000
2.048
GPUs utilizadas por Deepseek para su entrenamiento
chips más potentes y caros para entrenar ChatGPT-4
Los desarrolladores chinos han demostrado que son capaces de utilizar una cantidad reducida de chips para entrenar a su modelo de inteligencia artificial. Frente a los 16.000 que requiere un sistema de entrenamiento de las IAs occidentales, la china solo ha utilizado 2.000 chips Nvidia.
Esta empresa tecnológica, que lleva años liderando la fabricación de chips destinados entre otras cosas, a entrenar modelos de Inteligencia Artificial, lanzó al mercado su 'H100', un procesador considerado de los más avanzados del mundo por la cantidad de información que es capaz de gestionar. Era el Ferrari de este tipo de dispositivos. Pero el Gobierno de Estados Unidos prohibió su venta a China, ya que su uso marcaba, en ese momento, la frontera en el desarrollo de la IA. ¿Qué hizo DeepSeek? utilizó una versión anterior con mucha menos capacidad de gestionar información: el H800. Este aparato, con un precio aproximado de 20.000 euros por unidad, es asequible y de venta libre. Era un producto de capacidad limitada creado para el mercado chino y sortear así las limitaciones existentes en Estados Unidos para vender tecnología en el gigante asiático.
(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)
ChatGPT-4
ChatGPT-3
2
4 mill.
41 millones
DeepSeek
78 millones
6 millones
DALL-E
Gemini-1
0,18-0,30 millones
30 millones
191 millones
Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar
1.000
millones
(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)
ChatGPT-4
ChatGPT-3
2
DALL-E
4 millones
0,18-0,30
41 millones
DeepSeek
78 millones
6 millones
Gemini-1
30 millones
191 millones
Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar
1.000
millones
(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)
Gemini-1
ChatGPT-3
ChatGPT-4
2 millones
DALL-E
4 millones
41 millones
Entre
0,18-0,30
millones
30 millones
y
6
78 millones
191 millones
DeepSeek
6 millones
Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar
1.000 millones
ChatGPT-4
ChatGPT-5
(horquilla de las diferentes estimaciones en millones de dólares sin contar el salario de los empleados)
Gemini-1
ChatGPT-3
2 millones
6
4 millones
DeepSeek
6 millones
DALL-E
Entre
ChatGPT-4
0,18-0,30
millones
30 millones
y
191 millones
41 millones
78 millones
Se estima que entrenar a la siguiente evolución de chatGPT, la quinta, iba a costar
1.000 millones
ChatGPT-4
ChatGPT-5
Noticia relacionada
José A. González
Una de las claves de DeepSeek es que el entrenamiento de sus modelos de IA es mucho más sencillo. Mientras que las inteligencias artificiales que se utilizaban hasta ahora utilizaban un sistema complejo y con asistentes exteriores para entrenar sus capacidades, DeepSeek ha empleado un sistema distinto. La IA china se basa en el modelo de «recompensas», lo que implica que tiene unos baremos internos que dan la aprobación a sus contenidos. Esta recompensa se basa en dos conceptos: la eficacia y el estilo. El primero de ellos se refiere a la precisión a la hora de manejar la información que encuentra en la red. El segundo, a cuestiones como el uso correcto del idioma en el que es apelada, el formato, el tipo de texto, etc…Lo que significa esta innovación, en términos simplificados, es que a DeepSeek no hay que pagarle el colegio, sino que ella se autoeduca.
En este sentido, una de las novedades que aporta DeepSeek con respecto a otros chatbots es que el usuario puede pulsar la función R1, en la que la IA muestra su «proceso mental». El cliente, de esa forma, puede leer todo el 'razonamiento' que ha utilizado la máquina para responder a la pregunta que se le ha cuestionado.
Otra de las ventajas de DeepSeek es que dispone de la figura de los 'expertos' más avanzados hasta el momento. Simplificando mucho, las IAs más avanzadas disponen de los conocidos como MoE (Mezcla de Expertos, por sus siglas en inglés) que se encargan de priorizar la información que gestionan los procesadores ante las demandas de los clientes. En la práctica, los MoE de la IA China simplifican toda la gestión, con lo que es más fácil conseguir información y se ahorra en consumo de energía y necesidad de soporte técnico.
Quizás este sea el avance más demoledor. DeepSeek está escrito en código abierto, es decir, en un lenguaje informático público y de libre acceso a todo el mundo. ¿Qué supone? Es posible descargarse el código y crear una IA propia en un ordenador si dispone de la capacidad suficiente. Además, se puede adaptar por los propios usuarios y es gratuita, no como los modelos más avanzados de ChatGPT, que son de pago. Por ello, millones de personas han corrido a instalársela en el móvil o el ordenador. Y es que, en principio, ofrece los mismos servicios que las versiones avanzadas que la inteligencia artificial de Open AI, pero sin pagar un euro.
Créditos
GRÁFICOS: Gonzalo de las Heras
¿Ya eres suscriptor/a? Inicia sesión
Publicidad
Publicidad
José A. González y Álex Sánchez
Clara Alba y José A. González
Alberto Gil | Logroño
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.