O serviço de nuvem da Amazon, AWS, visa democratizar o acesso à computação de alto desempenho (HPC) com seu novo produto gerenciado, o AWS Parallel Computing Service. Este serviço permite que os clientes da AWS acessem servidores computacionais poderosos para grandes cargas de trabalho intensivas em processamento, sem a necessidade de administradores de sistemas dedicados.
Segundo Ian Colle, diretor de computação avançada e simulação na AWS, esse acesso aprimorado pode acelerar significativamente a inovação tecnológica e as descobertas científicas, que tradicionalmente dependem de clusters HPC. "Muitas cargas de trabalho existentes poderiam se beneficiar de recursos de computação de alto desempenho, mas a percepção de que é uma exclusividade de grandes empresas muitas vezes desencoraja a exploração," explicou Colle.
Colle acredita que essa percepção mudará à medida que as empresas descobrirem a facilidade de uso dos clusters HPC com o novo serviço, promovendo uma maior experimentação. "Estamos reduzindo a carga administrativa e eliminando a necessidade de investimento substancial em clusters HPC. Agora, tudo o que você precisa é de uma conta AWS para realizar experimentos e avaliar como as cargas de trabalho podem escalar," acrescentou.
Ofertas do Serviço
O AWS Parallel Computing permite que os usuários configurem e gerenciem grupos de instâncias do Amazon Elastic Compute Cloud. O serviço utiliza o gerenciador de carga de trabalho HPC de código aberto Slurm para facilitar a manutenção do cluster, eliminando a necessidade de administradores de sistemas dedicados.
Anteriormente, a AWS oferecia acesso a clusters HPC, mas os usuários precisavam gerenciar seus próprios recursos administrativos. Agora, clientes que buscam escalar cargas de trabalho científicas e de engenharia podem utilizar ferramentas familiares na AWS, incluindo o Console de Gerenciamento e kits de desenvolvimento de software. A integração do Slurm permite que os usuários migrem fluxos de trabalho existentes para o cluster HPC da AWS de forma seamless, sem a necessidade de reestruturação. As empresas também conseguem conectar facilmente quaisquer APIs.
Colle destacou que a oferta da AWS simplifica a administração do cluster, permitindo que os clientes transfiram completamente a gestão do Slurm para o serviço.
Disponibilidade
O serviço está disponível inicialmente em várias regiões da AWS, incluindo Ohio, Virgínia do Norte e Oregon nos Estados Unidos; Frankfurt, Estocolmo e Irlanda na Europa; e Sydney, Cingapura e Tóquio na Ásia-Pacífico. Alguns clientes da AWS, como a Marvel Fusion, sediada na Alemanha, tiveram acesso antecipado para demonstrar a variedade de casos de uso para clusters HPC. A Marvel Fusion utiliza o serviço para pesquisas sobre energia limpa e ilimitada, enquanto a empresa australiana Ronin aproveita-o para simulações HPC na nuvem.
Crescimento da Demanda por Clusters HPC
A demanda por clusters HPC aumentou à medida que as empresas dependem cada vez mais do poder computacional para treinar grandes modelos de linguagem e outras fundações de IA. As redes HPC são agora essenciais não apenas para cálculos significativos, como a descoberta de medicamentos, mas também para diversas cargas de trabalho de IA.
Tradicionalmente, apenas grandes laboratórios governamentais e corporações tinham acesso a supercomputadores, com fabricantes de hardware como AMD, Intel, Nvidia e IBM competindo para criar sistemas mais rápidos para esses clientes. Contudo, o aumento do interesse por parte de diversas empresas acelerou o crescimento das ofertas de "HPC como serviço" de provedores de nuvem como AWS, Google, Microsoft Azure e Penguin Computing on Demand.
O analista da Gartner, Tony Harvey, observa que, embora o HPC como serviço não seja uma novidade, casos de uso em evolução estão levando mais empresas a buscar acesso a supercomputadores. "É provável que vejamos uma competição crescente nesse espaço à medida que mais ofertas surgem, especialmente já que o uso de HPC agora vai além da IA," disse Harvey.
Ele acrescentou que democratizar o acesso a recursos HPC reduz os tempos de espera para supercomputadores de alto desempenho, como o Hewlett Packard Frontier em Tennessee, que podem ter listas de espera de meses. "Isso permite que novos usuários acessem esses recursos, maximizando o valor do tempo para pesquisadores e profissionais envolvidos em experimentação e modelagem preditiva," concluiu Harvey.