Ir al contenido

Google Cloud refuerza su apuesta por la IA para ayudar a empresas y desarrolladores

Entre las novedades más importantes está la llegada de la séptima generación de Ironwood TPU y Axion VM, que dota de alta potencia al trabajo de este servicio de la compañía de Mountain View.

Google Cloud ha presentado un catálogo actualizado de soluciones para inteligencia artificial y computación en la nube. Las últimas evoluciones de Ironwood TPU y Axion VM, marcan el inicio de una nueva era donde el rendimiento, la eficiencia y la adaptabilidad son protagonistas para empresas de todo tipo, desde startups hasta compañías multinacionales.

El anuncio llega en pleno auge de la demanda en IA, donde no solo importa entrenar modelos avanzados, sino hacerlos interactuar con millones de usuarios en tiempo real gracias a sistemas cada vez más resistentes y flexibles. Con la séptima generaciónv de las nuevas herramientas, y la expansión de las instancias Axion basadas en arquitectura Arm, Google Cloud busca ofrecer ventajas estratégicas a clientes que apuestan por la innovación en este contexto cambiante.

Ironwood: infraestructura para IA de próxima generación

Este es el nuevo referente dentro de los procesadores especializados para inteligencia artificial de Google Cloud. Este chip, diseñado para tareas exigentes como el entrenamiento de modelos de gran escala, aprendizaje por refuerzo avanzado y la inferencia de alto volumen con baja latencia, estará disponible a nivel general en las próximas semanas.

Su potencial queda reflejado en cifras: Ironwood ofrece más de cuatro veces mayor rendimiento para procesos de entrenamiento e inferencia frente a la generación anterior, consolidándose como el componente más potente y eficiente en consumo energético. Esto permite ejecutar desde modelos generativos de lenguaje e imagen como Gemini, Veo e Imagen, hasta plataformas como Claude de Anthropic, que planea gestionar hasta un millón de TPUs Ironwood para escalar sus servicios. Empresas como Lightricks están validando la eficiencia y nuevas capacidades del chip, especialmente en la generación avanzada de imagen y vídeo.

Interconexión: rendimiento y memoria sin cuellos de botella

Uno de los avances clave de Ironwood es su capacidad para conectar hasta 9.216 chips en un único pod mediante la tecnología Inter-Chip Interconnect (ICI), logrando una velocidad de 9,6 Terabits por segundo. Este diseño elimina los embotellamientos tradicionales, posibilitando que miles de procesadores trabajen como una unidad coordinada, resolviendo tareas de IA de dimensiones que antes parecían inalcanzables. Por cierto, la memoria compartida HBM alcanza los 1,77 Petabytes, equivalente a almacenar más de 40.000 películas en alta definición o millones de libros.

Además, la tecnología Optical Circuit Switching (OCS) actúa como tejido dinámico entre los chips, garantizando la continuidad de los servicios al reconfigurar automáticamente el flujo de trabajo ante cualquier incidente. Así, los clientes disponen de máxima disponibilidad y resiliencia en sus aplicaciones críticas.

Axion: cálculo general eficiente con enfoque en costes

Google Cloud ha actualizado su línea de instancias Axion, CPUs Arm personalizadas pensadas para tareas versátiles y de alto volumen. Los nuevos N4A, actualmente en versión preview, ofrecen hasta el doble de relación precio-rendimiento respecto a las VMs x86 actuales -y hasta un 80% más de eficiencia energética-. A ellos se sumarán en breve C4A metal, su primera instancia bare-metal para retos de procesamiento específico, con arquitectura física dedicada y altas capacidades en memoria y almacenamiento. Opciones Axion hoy disponibles:

  • N4A (preview): hasta 64 vCPUs, 512GB de memoria DDR5, red de 50 Gbps, soporte para tipos de máquina personalizados y almacenamiento Hyperdisk equilibrado/alto rendimiento.
  • C4A metal (preview): hasta 96 vCPUs, 768GB de memoria DDR5, Hyperdisk y hasta 100Gbps de red, ideal para desarrollo nativo Arm, simular sistemas complejos o requisitos estrictos de licencias.
  • C4A: hasta 72 vCPUs, 576GB de memoria DDR5, red de 100Gbps de nivel 1, SSD Titanium con hasta 6TB de capacidad local y controles avanzados de mantenimiento y almacenamiento.

Los precios pueden variar según configuración, pero los usuarios en pruebas han comprobado ahorros de hasta un 60% en coste/rendimiento y reducciones de consumo por unidad vista en ejemplos como Vimeo o ZoomInfo. El ahorro se traduce en mayor escalabilidad, reducción del gasto energético y optimización de márgenes operativos.

Impacto en ecosistemas

El éxito de Google Cloud en el último trimestre se apoya en la infraestructura y el liderazgo de las TPUs, que se consolidan como motor de las aplicaciones de IA más innovadoras. El sistema AI Hypercomputer, que integra hardware, software y redes optimizadas, está logrando retornos superiores al 350% en tres años para sus clientes, con una caída del 28% en costes TI y equipos IT un 55% más eficientes.

La arquitectura interna de Ironwood permite extender sus capacidades conectando cientos de miles de TPUs en clústeres a demanda, lo que lleva la inferencia y entrenamiento de modelos a un nivel superior. La integración de directores de clúster en Google Kubernetes Engine, junto con mejoras en la plataforma MaxText y soporte ampliado en vLLM para alternar entre GPUs y TPUs, garantiza que los desarrolladores puedan gestionar cargas intensivas, experimentación y optimizaciones en aprendizaje supervisado o por refuerzo con flexibilidad y rapidez.

Por su parte, Axion ha demostrado ser el aliado perfecto para operaciones generales como preparación masiva de datos, gestión de aplicaciones o servidores, integrando eficiencia y capacidad de adaptación sin comprometer el rendimiento específico que requieren las aplicaciones inteligentes.

Disponibilidad y futuro de Google Cloud

Los usuarios interesados ya pueden registrarse para probar Ironwood, Axion N4A y próximamente C4A metal, accediendo a los beneficios de una plataforma diseñada para escalar en función de las necesidades del negocio, ya sea desplegando modelos de IA a gran escala o gestionando aplicaciones cotidianas con máxima eficiencia energética.

La clave de Google Cloud está en la combinación de procesadores altamente especializados y CPUs generales, con arquitectura abierta y soluciones integradas que permiten elegir la opción óptima para cada carga de trabajo. Esto garantiza que empresas y desarrolladores puedan afrontar los retos de la nueva era de inferencia y computación en la nube sin limitaciones técnicas ni costes excesivos.

Más información

Archivado En