DeepSeek abre la puerta de la hiperley de Moore

El panorama de la IA sigue siendo dinámico y competitivo, y es probable que en el futuro haya más sorpresas

Semiconductores en una placa base.Florence Lo (REUTERS)

En noviembre de 2024, con las acciones de Nvidia en un ascenso que se creía imparable, Jesse Huang formulaba la hiperley de Moore. El consejero delegado de la compañía fabless preveía un futuro en el que el rendimiento de la computación con inteligencia artificial se duplicaría o triplicaría anualmente. A diferencia de la Ley de Moore, limitada por los avances en hardware, este ritmo hiperacelerado lo veía impulsado por mejoras holísticas en software, redes, algoritmos e infraestructura de centros de datos. Todas estas mejoras combinadas presentía que iban a habilitar soluciones de IA a mayor escala y reducir los costos de cómputo. Lo último que pensaba Huang era que una entonces casi desconocida empresa de la China continental –DeepSeek– iba a realizar la primera demostración práctica de la hiperley.

Aunque los novedosos modelos de inteligencia artificial de DeepSeek han captado la atención global de los inversores solo hace unos días, ya en diciembre habían empezado a conocerse en los medios especializados. La empresa hizo público en esas fechas un papel científico en el que comunicaba que utilizando un clúster con solo 2.048 GPU Nvidia H800 durante dos meses –2,8 millones de horas de GPU– había conseguido un modelo equivalente a Llama 3 de Meta, entrenado en 16.384 GPU H100 en el transcurso de 54 días –30,8 millones de horas de GPU–. Sorprendía tanto más cuando el producto H800 de Nvidia es la versión adaptada para China de la placa H100, creada tras la primera ronda de restricciones de la Administración Biden aprobadas en octubre de 2022, con una velocidad de transferencia de datos entre sus componentes reducida a la mitad.

Debajo de la punta del iceberg que provocó el terremoto en Bolsa del 27 de enero se encuentran sin embargo detalles que, sin hacer menos admirable el logro de DeepSeek, lo contextualiza. En primer lugar, la venta de la Nvidia H800 fue prohibida en China tras la segunda regulación de restricciones sobre semiconductores adoptada en octubre de 2023, lo cual significa que las limitaciones a la importación están identificado cómo frenar los avances de China en inteligencia artificial, pero el país cuenta con un inventario acumulado que le va a permitir alcanzar estos hitos. Ya antes el gigante asiático había conseguido, por ejemplo, producir chips de 7 nm de modo limitado y experimental con el stock acumulado de máquinas de fabricación de ASML de tipo DUV, ahora también fuera de su alcance.

En segundo lugar, según la propia información de la compañía china, no se ha realizado con un uso estándar de las placas de H800 de Nvidia. Según la documentación disponible, la startup de Hangzhou ha realizado adaptaciones en el software de bajo nivel –muy cercano al hardware– para optimizar las comunicaciones dentro de las GPU, combinado con uso inteligente de protocolos de transferencias entre GPU para acelerarlos. El eventual ahorro en infraestructuras que ha provocado la caída de valores bursátiles generalizado no sería, por tanto, un simple plug-and-play al alcance de cualquiera.

En tercer lugar, todas las afirmaciones sobre tipo y cantidades de hardware de Nvidia utilizadas provienen de la propia DeepSeek. Algún experto ha recordado que DeepSeek operó el primer clúster de 10.000 A100 de Asia (antes de la prohibición de la venta de estas placas en 2022) y mantiene un clúster de 50.000 H800. Responsables de otras empresas del sector, como Scale AI, apuntan que incluso podría haber acumulado 50.000 H100 que no afloran por los controles de exportación existentes en EE UU.

Todo ello no quita que, ciertamente, DeepSeek ha conseguido desarrollar un modelo de IA cercano en capacidades a los más avanzados de OpenAI, que además es de código abierto y reutilizable por aquellos desarrolladores que lo deseen. De acuerdo con Reuters, hay expertos que estiman que China ha pasado de dieciocho meses a seis meses de retraso respecto de los modelos de IA de última generación desarrollados en Estados Unidos. Las consecuencias de este logro en el medio plazo probablemente sean distintas de las que inicialmente han previsto algunos: una continuación en la escalada del gasto en infraestructuras.

La naturaleza de código abierto de la aplicación china comoditiza los modelos IA y los democratiza. El desarrollo de este tipo de aplicaciones estará al alcance de un mayor número de empresas, que necesitarán de equipamiento sobre el que ejecutarse. De hecho, el valor en Bolsa de los dos principales proveedores de infraestructuras en la nube –Amazon y Microsoft– recuperaron y superaron su cotización previa a la tormenta del lunes al día siguiente. También Nvidia recuperó la capitalización por encima de los 3 billones de dólares que perdió por un día.

Otros hechos que inicialmente pasaron inadvertidos abonan la hipótesis que DeepSeek no va a suponer un frenazo de las inversiones en infraestructura. Por una parte, como hemos señalado, el modelo IA de la startup china era conocido desde finales de diciembre y, sin embargo, no frenó la puesta de largo del proyecto Stargate que va a suponer la inversión de 500.000 millones en cuatro años. Por otro lado, el mismo día que se anunció el megaproyecto de centros de datos estadounidenses el Banco de China anunció la reserva de 137.000 millones de dólares para la industria IA, entre otras finalidades para desarrollar infraestructuras de computación, también a pesar de ser conocidos los supuestos menores requisitos de DeepSeek.

En resumen, el logro de DeepSeek, aunque notable, no representa una amenaza inmediata para el dominio estadounidense en IA. Más bien, subraya la creciente competencia y la necesidad de una inversión continua en I+D en inteligencia artificial, así como métodos innovadores de combinar todos los factores que intervienen en un rendimiento óptimo de sus aplicaciones. El modelo de código abierto de DeepSeek puede incluso estimular la innovación y el crecimiento del mercado al hacer que la IA sea más accesible. En última instancia, el panorama de la IA sigue siendo dinámico y competitivo, y es probable que en el futuro haya más sorpresas. Bienvenidos a la era de la hiperley de Moore.

Emilio García García es exdirector de gabinete de la Secretaría de Estado de Telecomunicaciones e Infraestructuras Digitales.

Más información

Archivado En