[13/12/2024] IBM ha presentado una nueva investigación en tecnología óptica que podría mejorar la forma en que los centros de datos entrenan y ejecutan modelos de inteligencia artificial generativa. Según lo señalado en el comunicado de prensa, los investigadores han sido pioneros en un nuevo proceso para la óptica coempaquetada (CPO, por sus siglas en inglés), la siguiente generación de tecnología óptica, para permitir la conectividad dentro de los centros de datos a la velocidad de la luz a través de la óptica para complementar los actuales cables eléctricos de corto alcance. Al diseñar y ensamblar la primera guía de ondas óptica de polímero (PWG, por sus siglas en inglés) exitosa anunciada públicamente para impulsar esta tecnología, los investigadores de IBM han demostrado cómo la CPO redefinirá la forma en que la industria informática transmite los datos de gran ancho de banda entre chips, placas de circuitos y servidores.
"Hoy en día, la tecnología de fibra óptica transporta datos a altas velocidades a través de largas distancias, gestionando casi todo el tráfico comercial y de comunicaciones del mundo con luz en lugar de electricidad. Aunque los centros de datos utilizan fibra óptica para sus redes de comunicaciones externas, los racks en los centros de datos todavía ejecutan predominantemente las comunicaciones mediante cables eléctricos de cobre. Estos cables conectan aceleradores de GPU que pueden pasar más de la mitad de su tiempo inactivos, esperando datos de otros dispositivos en un gran proceso de entrenamiento distribuido que puede incurrir en gastos y energía significativos”, sostuvo Darío Gil, vicepresidente senior y director de investigación de IBM.
El ejecutivo comentó que los investigadores de IBM han demostrado una forma de llevar la velocidad y la capacidad de la óptica a los centros de datos. En un documento técnico, IBM presenta un nuevo módulo prototipo de CPO que puede permitir la conectividad óptica de alta velocidad. Esta tecnología podría aumentar significativamente el ancho de banda de las comunicaciones del centro de datos, minimizando el tiempo de inactividad de la GPU y acelerando radicalmente el procesamiento de la inteligencia artificial. Esta innovación en la investigación, como se describe, permitiría:
* Menores costos para escalar la inteligencia artificial generativa a través de una reducción de más de cinco veces en el consumo de energía en comparación con las interconexiones eléctricas de rango medio, al tiempo que se extiende la longitud de los cables de interconexión del centro de datos de uno a cientos de metros.
* Entrenamiento más rápido del modelo de inteligencia artificial, lo que permite a los desarrolladores entrenar un modelo de lenguaje grande (LLM) hasta cinco veces más rápido con una CPO que con el cableado eléctrico convencional. La CPO podría reducir el tiempo que lleva entrenar un LLM estándar de tres meses a tres semanas, y las ganancias en rendimiento aumentarían al usar modelos más grandes y más GPUs.
* Aumentó radicalmente la eficiencia energética para los centros de datos, ahorrando el equivalente de energía del consumo de energía anual de cinco mil hogares estadounidenses por modelo de inteligencia artificial entrenado.
"A medida que la inteligencia artificial generativa exige más energía y potencia de procesamiento, el centro de datos debe evolucionar, y la óptica coempaquetada puede hacer que estos centros de datos estén preparados para el futuro. Con este avance, los chips del mañana se comunicarán de manera muy similar a cómo los cables de fibra óptica transportan datos dentro y fuera de los centros de datos, marcando el comienzo de una nueva era de comunicaciones más rápidas y sostenibles que pueden manejar las cargas de trabajo de la inteligencia artificial del futuro”, indicó Gil.
Ancho de banda 80 veces más rápido que la comunicación actual de chip a chip
El ejecutivo explicó que, en los últimos años, los avances en la tecnología de chips han empaquetado densamente los transistores en un chip; la tecnología de chip de nodo de dos nanómetros de IBM puede contener más de 50 mil millones de transistores. "La tecnología CPO tiene como objetivo aumentar la densidad de la interconexión entre los aceleradores al permitir a los fabricantes de chips agregar vías ópticas que conectan los chips en un módulo electrónico más allá de los límites de las vías eléctricas actuales. El documento de IBM describe cómo estas nuevas estructuras ópticas de alta densidad de ancho de banda, junto con la transmisión de múltiples longitudes de onda por un canal óptico, tienen el potencial de aumentar el ancho de banda entre los chips hasta 80 veces en comparación con las conexiones eléctricas”.
Gil explicó que, la innovación de IBM, como se describe, permitiría a los fabricantes de chips agregar seis veces más fibras ópticas en el borde de un chip fotónico de silicio, llamado 'densidad en el borde', en comparación con la tecnología CPO actual. "Cada fibra, con aproximadamente tres veces el ancho de un cabello humano, podría tener una longitud que va desde algunos centímetros hasta cientos de metros y transmitir terabits de datos por segundo. El equipo de IBM ensambló un PWG de alta densidad con canales ópticos de 50 micrómetros de separación, acoplados adiabáticamente a guías de onda fotónicas de silicio, utilizando procesos de empaquetado de ensamblaje estándar”.
El documento indica además que estos módulos de CPO con PWG con 50 micrómetros de separación son los primeros en pasar todas las pruebas de estrés requeridas para la fabricación. Los componentes se someten a ambientes de alta humedad y temperaturas que oscilan entre -40° C y 125° C, así como a pruebas de durabilidad mecánica para confirmar que las interconexiones ópticas pueden doblarse sin romperse o perder datos. Además, los investigadores han demostrado la tecnología PWG con 18 micrómetros de separación. El apilamiento de cuatro PWG permitiría hasta 128 canales para la conectividad en ese espacio.
Según el ejecutivo, la tecnología CPO permite una nueva vía para satisfacer las crecientes demandas de rendimiento de la inteligencia artificial, y tiene el potencial de pasar las comunicaciones que se producen fuera del módulo de eléctricas a ópticas.
Los investigadores completaron el trabajo de diseño, modelado y simulación para CPO en Albany, Nueva York y ensamblaron prototipos y probaron módulos en las instalaciones de IBM en Bromont, Quebec.
Franca Cavassa, CTOPerú