[27/08/2024] IBM reveló detalles de la arquitectura del próximo procesador IBM Telum II e IBM Spyre Accelerator. Según lo comentado en el comunicado de prensa, las nuevas tecnologías están diseñadas para escalar significativamente la capacidad de procesamiento en los sistemas de mainframe IBM Z de próxima generación, lo que ayuda a acelerar el uso de modelos de IA tradicionales y modelos de IA de lenguaje grande en conjunto a través de un nuevo método de conjunto de IA.
"Con muchos proyectos de IA generativa que aprovechan los grandes modelos de lenguaje (LLM, por sus siglas en inglés) que pasan de la prueba de concepto a la producción, las demandas de soluciones energéticamente eficientes, seguras y escalables se han convertido en prioridades clave. Una investigación de Morgan Stanley publicada en agosto proyecta que la demanda de energía de la IA generativa se disparará un 75% anual durante los próximos años, lo que la pondría en camino de consumir tanta energía en el 2026 como España en el 2022. Muchos clientes de IBM indican que las decisiones arquitectónicas para soportar modelos de base de tamaño adecuado y enfoques híbridos por diseño para cargas de trabajo de IA son cada vez más importantes”, sostuvo Tina Tarquinio, vicepresidenta de gestión de productos de IBM Z y LinuxONE.
La ejecutiva indicó que las principales innovaciones presentadas incluyen:
- Procesador IBM Telum II: Diseñado para impulsar los sistemas IBM Z de próxima generación, el nuevo chip de IBM presenta una mayor frecuencia, capacidad de memoria, un crecimiento del 40% en caché y un núcleo acelerador de IA integrado, así como una unidad de procesamiento de datos (DPU, por sus siglas en inglés) conectada de manera coherente en comparación con el chip Telum de primera generación. Se espera que el nuevo procesador sea compatible con soluciones de cómputo empresarial para LLM, atendiendo las complejas necesidades de transacciones de la industria.
- Unidad de aceleración de E/S: Una unidad de procesamiento de datos (DPU) completamente nueva en el chip del procesador Telum II está diseñada para acelerar los complejos protocolos de E/S para redes y almacenamiento en el mainframe. La DPU simplifica las operaciones del sistema y puede mejorar el rendimiento de los componentes clave.
- Acelerador de IBM Spyre: Proporciona capacidad de cómputo de IA adicional para complementar el procesador Telum II. Trabajando juntos, los chips Telum II y Spyre forman una arquitectura escalable para admitir métodos de conjunto de modelado de IA, la práctica de combinar múltiples modelos de IA de aprendizaje automático o aprendizaje profundo con LLM de codificador. Al aprovechar las fortalezas de cada arquitectura de modelo, la IA de conjunto puede proporcionar resultados más precisos y sólidos en comparación con los modelos individuales. El chip IBM Spyre Accelerator, presentado en primicia en la conferencia Hot Chips 2024, se entregará como una opción complementaria. Cada chip acelerador se conecta a través de un adaptador PCIe de 75 vatios y se basa en la tecnología desarrollada en colaboración con IBM Research. Al igual que con otras tarjetas PCIe, Spyre Accelerator es escalable para adaptarse a las necesidades del cliente.
"El procesador Telum II y el acelerador Spyre están diseñados para ofrecer soluciones informáticas empresariales de alto rendimiento, seguras y más eficientes en el consumo de energía. Después de años de desarrollo, estas innovaciones se introducirán en nuestra plataforma IBM Z de próxima generación para que los clientes puedan aprovechar los LLM y la IA generativa a escala", anotó Tarquinio.
La ejecutiva agregó que el procesador Telum II y el IBM Spyre Accelerator serán fabricados por el socio de fabricación de larga data de IBM, Samsung Foundry, y se basarán en su nodo de proceso de 5nm de alto rendimiento y eficiencia energética. "Trabajando en conjunto, apoyarán una variedad de casos de uso avanzados impulsados por IA diseñados para desbloquear el valor comercial y crear nuevas ventajas competitivas. Con los métodos de conjunto de IA, los clientes pueden lograr resultados más rápidos y precisos en sus predicciones. La potencia de procesamiento combinada anunciada proporcionará una rampa de entrada para la aplicación de casos de uso de IA generativa”.
Especificaciones y métricas de rendimiento:
Sobre las especificaciones y métricas de rendimiento de los nuevos productos presentados, Tarquinio comentó lo siguiente:
Procesador Telum II: Con ocho núcleos de alto rendimiento que funcionan a 5,5GHz, con 36MB de caché L2 por núcleo y un aumento del 40% en la capacidad de caché en chip para un total de 360MB. "La caché virtual de nivel 4 de 2,88GB por cajón de procesador proporciona un aumento del 40% con respecto a la generación anterior. El acelerador de IA integrado permite la inferencia de IA en transacciones de baja latencia y alto rendimiento, por ejemplo, mejorando la detección de fraudes durante las transacciones financieras, y proporciona un aumento de cuatro veces en la capacidad de cómputo por chip con respecto a la generación anterior”, explicó la ejecutiva.
Agregó que, la nueva unidad de aceleración de E/S DPU está integrada en el chip Telum II. Está diseñado para mejorar el manejo de datos con un aumento del 50% en la densidad de E/S. "Este avance mejora la eficiencia general y la escalabilidad de IBM Z, lo que lo hace muy adecuado para manejar las cargas de trabajo de IA a gran escala y las aplicaciones intensivas en datos de las empresas actuales”, sostuvo Tarquinio.
Spyre Accelerator: Se presenta un acelerador de nivel empresarial especialmente diseñado que ofrece capacidades escalables para modelos complejos de IA y casos de uso de IA generativa. "Cuenta con hasta 1TB de memoria, diseñada para funcionar en conjunto en las ocho tarjetas de un cajón de E/S normal, para admitir cargas de trabajo de modelos de IA en todo el mainframe, mientras que está diseñada para no consumir más de 75W por tarjeta. Cada chip tendrá 32 núcleos de cómputo que admitirán los tipos de datos int4, int8, fp8 y fp16 para aplicaciones de IA de baja latencia y alto rendimiento”, finalizó Tarquinio.
Disponibilidad
El procesador Telum II será el procesador central que impulsará las plataformas IBM Z e IBM LinuxONE de próxima generación de IBM. Se espera que esté disponible para los clientes de IBM Z y LinuxONE en el 2025. También se espera que el IBM Spyre Accelerator, actualmente en versión preliminar tecnológica, esté disponible en el 2025.
Franca Cavassa, CTOPerú