[04/09/2024] Amazon Web Services anunció la disponibilidad general de AWS Parallel Computing Service, un nuevo servicio administrado que ayuda a los clientes a configurar y administrar fácilmente clústeres de computación de alto rendimiento (HPC) para que puedan ejecutar cargas de trabajo científicas y de ingeniería a prácticamente cualquier escala en AWS. Según lo señalado en el comunicado de prensa, el servicio facilita a los administradores de sistemas la creación de clústeres mediante instancias de Amazon Elastic Compute Cloud (Amazon EC2), redes de baja latencia y almacenamiento optimizado para cargas de trabajo de HPC.
"Con AWS Parallel Computing Service, los científicos e ingenieros pueden escalar rápidamente simulaciones para validar modelos y diseños, mientras que los administradores e integradores de sistemas pueden crear y mantener clústeres de HPC en AWS con Slurm, el administrador de cargas de trabajo de HPC de código abierto más popular. Este servicio acelera la innovación en áreas como el descubrimiento acelerado de fármacos, el descubrimiento de conocimientos genómicos, la creación de diseños de ingeniería, las aplicaciones meteorológicas y la creación de modelos científicos y de ingeniería”, sostuvo Ian Colle, director de computación avanzada y simulación de AWS.
El ejecutivo indicó que, con AWS Parallel Computing Service, los administradores de sistemas pueden utilizar herramientas conocidas, como la consola de administración de AWS, la CLI y el SDK, para implementar un entorno de Slurm administrado. "AWS Parallel Computing Service se basa en bases de código abierto que los clientes conocen y con las que tienen experiencia, y ofrece una experiencia de Slurm administrada con la confiabilidad y disponibilidad de AWS. AWS Parallel Computing Service reduce significativamente la carga operativa de la administración de un clúster y ofrece regularmente nuevas capacidades y correcciones a través de actualizaciones de servicios administrados con un tiempo de inactividad mínimo o nulo, lo que elimina la necesidad de aplicar parches manuales y reconstruir clústeres para recibir actualizaciones de características”.
Colle agregó que las API de alta disponibilidad también ayudan a los desarrolladores y a los ISV a crear soluciones HPC integrales sobre AWS, para que puedan centrarse en proporcionar características de valor añadido a sus usuarios y clientes, en lugar de preocuparse por la administración de la infraestructura. "AWS Parallel Computing Service permite a los clientes de todos los tamaños (por ejemplo, empresas emergentes, empresas o laboratorios nacionales) crear y administrar fácilmente clústeres de HPC con la escalabilidad, la fiabilidad y la seguridad de AWS. Esto significa que los científicos e ingenieros que utilizan Slurm pueden migrar fácilmente sus flujos de trabajo locales existentes a AWS sin tener que rediseñarlos, lo que brinda a los científicos e ingenieros acceso a una infraestructura en la nube que se escala automáticamente. Y los administradores que deseen desbloquear la capacidad o las limitaciones de capacidad para sus usuarios finales pueden poner en marcha clústeres en cuestión de minutos en lugar de meses, para ejecutar sus simulaciones y abordar los problemas más desafiantes del mundo”.
Para comenzar, anotó Colle, los administradores de sistemas utilizan la consola de administración de AWS para poner en marcha un clúster de Slurm de forma segura y ejecutar trabajos con solo unos pocos clics, en comparación con la orquestación manual actual. "Con la compatibilidad de CloudFormation próximamente, los clientes podrán crear e implementar clústeres de HPC utilizando infraestructura como código”.
Franca Cavassa, CTOPerú