El servicio en la nube de Amazon, AWS, busca democratizar el acceso al cómputo de alto rendimiento (HPC) con su nuevo producto gestionado, el AWS Parallel Computing Service. Este servicio permite a los clientes de AWS acceder a potentes servidores para cargas de trabajo intensivas sin necesidad de administradores de sistemas dedicados.
Según Ian Colle, director de computación avanzada y simulación en AWS, este acceso mejorado podría acelerar significativamente la innovación tecnológica y los descubrimientos científicos, que tradicionalmente dependen de los clústeres HPC. "Muchos trabajos existentes podrían beneficiarse de los recursos de cómputo de alto rendimiento, pero la percepción de que es solo para grandes empresas a menudo desalienta su exploración", explicó Colle.
Colle cree que esta percepción cambiará a medida que las empresas descubran la facilidad de usar clústeres HPC con el nuevo servicio, fomentando una mayor experimentación. "Estamos reduciendo la carga administrativa y eliminando la necesidad de inversiones de capital significativas en clústeres HPC. Ahora, todo lo que necesitas es una cuenta de AWS para realizar experimentos y evaluar cómo escalar cargas de trabajo", añadió.
Ofertas del Servicio
AWS Parallel Computing permite a los usuarios configurar y administrar grupos de instancias de Amazon Elastic Compute Cloud. El servicio utiliza el gestor de cargas de trabajo HPC de código abierto Slurm para facilitar el mantenimiento del clúster, aliviando la necesidad de administradores de sistemas dedicados. Anteriormente, AWS proporcionaba acceso a clústeres HPC, pero los usuarios debían gestionar sus propios recursos administrativos. Ahora, los clientes que buscan escalar cargas de trabajo científicas e ingenieriles pueden aprovechar herramientas familiares en AWS, incluyendo la Consola de Gestión y kits de desarrollo de software. La integración de Slurm permite a los usuarios migrar flujos de trabajo existentes al clúster HPC de AWS sin necesidad de reestructuración. Las empresas también pueden conectar fácilmente cualquier API.
Colle enfatizó que la oferta de AWS simplifica la administración del clúster, permitiendo a los clientes delegar completamente la gestión de Slurm al servicio.
Disponibilidad
El servicio está disponible inicialmente en varias regiones de AWS, incluyendo Ohio, Virginia del Norte y Oregón en Estados Unidos; Frankfurt, Estocolmo e Irlanda en Europa; y Sídney, Singapur y Tokio en Asia-Pacífico. Algunos clientes de AWS, incluidos empresas como Marvel Fusion, con sede en Alemania, han tenido acceso anticipado para mostrar la variedad de casos de uso de los clústeres HPC. Marvel Fusion utiliza el servicio para investigar sobre energía ilimitada y sin emisiones, mientras que la empresa australiana Ronin lo aprovecha para simulaciones HPC en la nube.
Aumento de la Demanda de Clústeres HPC
La demanda de clústeres HPC ha aumentado a medida que las empresas dependen cada vez más del poder computacional para entrenar grandes modelos de lenguaje y otros fundamentos de inteligencia artificial. Las redes HPC son ahora esenciales no solo para cálculos significativos como el descubrimiento de fármacos, sino también para diversas cargas de trabajo de IA.
Tradicionalmente, solo los grandes laboratorios gubernamentales y corporaciones tenían acceso a supercomputadoras, con fabricantes de hardware como AMD, Intel, Nvidia e IBM compitiendo por crear sistemas más rápidos para estos clientes. Sin embargo, el creciente interés de empresas diversas ha acelerado el desarrollo de ofertas de "HPC como servicio" por parte de proveedores de nube como AWS, Google, Microsoft Azure y Penguin Computing on Demand.
El analista de Gartner, Tony Harvey, señala que aunque HPC como servicio no es nuevo, los casos de uso en evolución están impulsando a más empresas a buscar acceso a supercomputadoras. "Es probable que veamos una competencia creciente en este espacio a medida que surjan más ofertas, especialmente dado que el uso de HPC ahora va más allá de solo la IA", afirmó Harvey.
Agregó que democratizar el acceso a recursos HPC reduce los tiempos de espera para supercomputadoras de alto rendimiento, como la unidad Hewlett Packard Frontier en Tennessee, que puede tener listas de espera de meses. "Esto permite a nuevos usuarios acceder a estos recursos, maximizando el valor del tiempo para investigadores y profesionales comprometidos en experimentación y modelado predictivo", concluyó Harvey.