Conferencia de Directores y Decanos de Ingeniería Informática

El informático Eduardo César Garrido nos habla de DeepSeek y «las claves de la bomba china que tumba a ChatGPT, NVIDIA y las Big Tech norteamericanas»

Hace dos años que OpenAI consiguió el efecto Coca-Cola con su producto estrella, ChatGPT. Pero el nuevo bombazo, que en este caso más bien sería el efecto Bruce Lee, lo han dado DeepSeek-R1 y Qwen 2.5, increíblemente baratos en su desarrollo y de código abierto. Ambos, made in China.

La gente común, que no pertenece a la comunidad de expertos en IA –los de verdad, no los del hype–, apenas conoce la existencia de otras IA, y mucho menos si son o no libres, de código abierto. Hace tiempo que existen alternativas a ChatGPT como Gemini, de Alphabet, que también es una corporación privada norteamericana. Y entre las IA de código abierto, la más usada es LLaMA (Large Language Model Meta AI), que ha servido de base al desarrollo de ALIA, la IA española de código abierto que acaba de estrenarse.

Con todo esto, China es hoy la indiscutible protagonista tecnológica en el mundo. Podría decirse que ha puesto pie en la Luna de la carrera por la IA.

DeepSeek ya se puede usar

DeepSeek-R1, con una interfaz gráfica muy similar a ChatGPT, ya se puede utilizar libremente desde su página web. Ahora serán los usuarios quienes decidan si se quedan o no, pero su atractivo parece irresistible: es gratis, y seguirá siendo gratis. ChatGPT no lo es si se usa con todas sus prestaciones, y Gemini dejará de serlo en cuanto pase su periodo de fidelización.

Pero lo más abrumador de la llegada de DeepSeek es que ha tumbado a un gigante. La salida a la calle del modelo chino ha provocado un desplome del precio del todopoderoso fabricante de chips NVIDIA de más del 16 % en el momento de escribir este artículo (cae en picado por minutos). NVIDIA ha perdido 700 000 millones de dólares en menos de 24 horas. Estamos ante la mayor pérdida de capitalización bursátil de la historia.

¿Por qué es tan barato DeepSeek? En primer lugar, sus desarrolladores han reducido enormemente el coste de entrenamiento del modelo en relación con su rendimiento.

Según la propia DeepSeek, han empleado 5,57 millones de dólares (5,33 millones de euros). Para que se entiendan estas cifras, este gasto supone menos de una décima parte del gasto del modelo de pago de la empresa irónicamente llamada OpenAI.

El entrenamiento, siempre según DeepSeek, ha durado 55 días, utilizando un conjunto de 2.048 unidades de procesadores gráficos H800 del fabricante de chips estadounidense NVIDIA, con 671 billones de parámetros. También hay versiones destiladas más pequeñas. De hecho se está replicando el entrenamiento completo de DeepSeek-R1 en Github, una plataforma de desarrollo colaborativo, lo que confirma que estamos ante una IA abierta y libre.

Además, este modelo también es diez veces más pequeño que los de OpenIA, lo que le hace mucho más rápido respondiendo a prompts (instrucciones). Pero la cosa no termina aquí.

Noticia completa: La mar de Onuba

Eduardo César Garrido Merchán es Profesor Colaborador Asistente, Departamento de Métodos Cuantitativos, Universidad Pontificia Comillas. Investigador de Inteligencia Artificial, IA socialmente justa y Profesor de Machine Learning y Estadística. Doctor Cum Laude en Ingeniería Informática y de Telecomunicación por el grupo de Aprendizaje Automático de la Universidad Autónoma de Madrid en su tesis doctoral sobre Optimización Bayesiana. Estudió en la Universidad Pontificia de Comillas, donde se graduó con premio extraordinario de su promoción en Ingeniería Informática. Master en Inteligencia Artificial por la Universidad Politécnica de Madrid con el Premio José Cuena. Investiga en nuevos métodos y aplicaciones de optimización Bayesiana y aprendizaje por refuerzo. Recientemente también investiga un enfoque justo de la IA y las redes sociales para mitigar la opresión de esta estructura tecnológica hacia colectivos vulnerables, ética de la IA para hacerla mas igualitaria y políticas internacionales para mitigar la creciente desigualdad tecnológica impuesta por la clase tecnoliberal.