Fazer overclock em data center? O resfriamento por imersão pode otimizar servidores

O líquido fervente leva embora o calor gerado por servidores de computador em um datacenter da Microsoft.

A Microsoft é o primeiro provedor de nuvem a executar resfriamento por imersão de duas fases em um ambiente de produção.

 

As empresas de data center há muito tempo usam a combinação de CPUs para overclock e refrigeração a água para extrair o máximo de desempenho dos PCs. Essa mesma abordagem pode criar plataformas de computação em nuvem mais poderosas?

 

Uma nova pesquisa da Microsoft sugere que sim. A empresa está testando o uso de processadores com overclock executados em tanques de resfriamento de imersão e diz que a combinação permite que os servidores tenham um desempenho superior.

 

“Com base em nossos testes, descobrimos que, para alguns chipsets, o desempenho pode aumentar em 20% por meio do uso de refrigeração líquida”, disse Christian Belady, distinto engenheiro e vice-presidente do grupo de desenvolvimento avançado de datacenter da Microsoft. “Isso demonstra como o resfriamento a líquido pode ser usado não apenas para apoiar nossas metas de sustentabilidade para reduzir e, eventualmente, eliminar a água usada para resfriamento em datacenters, mas também gerar mais chips de desempenho operando em temperaturas mais altas de refrigeração para cargas de trabalho de IA e ML avançadas.”

 

Esses tipos de melhorias de desempenho podem ser significativos quando aplicados em escala de nuvem e permitem novas abordagens de como os data centers são construídos e operados

 

“Devido às eficiências de energia e resfriamento que o resfriamento a líquido nos proporciona, ele abre um novo potencial para o design de rack de data center”, disse Belady.

 

A pesquisa foi compartilhada como parte da atualização da Microsoft em suas iniciativas de sustentabilidade, incluindo um plano para reduzir o uso de água em seu data center em 95% até 2024. O aumento do uso de refrigeração líquida é um componente importante desse esforço, pois permite um design sem água. A Microsoft também começará a operar data centers mais aquecidos, aumentando o ponto de ajuste para as salas de servidores para reduzir - e possivelmente eliminar - a dependência da empresa de resfriamento evaporativo com uso intensivo de água.

 

Overclocking: mais potência, mas também mais calor

 

No overclocking, as CPUs funcionam com um clock maior do que o projetado - na verdade, forçando o computador a funcionar mais rápido do que deveria. O overclock aumenta o desempenho, mas também faz com que os componentes gerem mais calor.

 

“O resfriamento líquido pode ser usado não apenas para apoiar nossos objetivos de sustentabilidade, mas também para gerar chips de melhor desempenho operando em temperaturas mais altas do refrigerante para cargas de trabalho avançadas de IA e ML.”

Christian Belady, Microsoft

 

É aí que entra o resfriamento por imersão. Na imersão de duas fases, os servidores são submersos em um fluido refrigerante que ferve à medida que os chips geram calor, removendo o calor à medida que muda de líquido para vapor. O vapor então se condensa em líquido para reutilização, tudo sem uma bomba. O resfriamento por imersão pode fornecer eficiência de energia excepcional porque usa tanques selados que não exigem pisos elevados ou resfriamento de ar no nível da sala encontrados na maioria dos data centers comerciais.

 

Temos monitorado a adoção do resfriamento a líquido pela Microsoft, e a empresa está sinalizando que o resfriamento por imersão de duas fases terá um papel muito maior em projetos de dados futuros.

 

“O resfriamento líquido abre caminho para servidores mais densamente compactados em espaços menores, o que significa maior capacidade por metro quadrado em um datacenter - ou a capacidade de criar datacenters menores em locais mais estratégicos no futuro, disse Belady. “Isso aumenta os benefícios do design de resfriamento sem água.”

 

Em março, a Microsoft revelou que estava testando a tecnologia de resfriamento usada em instalações de mineração de bitcoin, nas quais os servidores são mergulhados em tanques de fluido de resfriamento para gerenciar densidades de calor crescentes. Em abril, colocou um único rack de 48 servidores usando resfriamento por imersão de duas fases em produção em seu data center em Quincy, Washington.

 

Mais resfriamento por imersão no futuro?

 

A Microsoft ainda não está construindo data centers inteiros de tanques de imersão, mas diz que está pronta para expandir seu uso.

 

“Nosso plano é dimensionar essa implantação para vários tanques para entender como dimensionar o resfriamento por imersão em líquido e manter a confiabilidade dos serviços”, disse a empresa. “Dependendo do resultado, iremos desenvolver uma versão mais otimizada desta tecnologia em outros datacenters.”

 

A Microsoft não é a primeira empresa a conectar os ganhos de imersão e desempenho, já que isso tem sido um motivador na adoção da imersão na mineração de criptomoedas. A Riot Blockchain diz que sua pesquisa descobriu que o uso de imersão com chips ASIC pode aumentar sua taxa de hash em 25 por cento, com potencial para ganhos maiores. Esta semana, a Riot iniciou a construção de 200 megawatts de capacidade de resfriamento por imersão em um novo centro de hashing em Rockdale, Texas.

 

“Prevemos observar um aumento na taxa de hash e na produtividade da empresa até 2022, sem ter que depender exclusivamente da compra de ASICs adicionais”, disse Jason Lee, CEO da Riot.

 

A nuvem Azure da Microsoft e os aplicativos do Office exigem uma confiabilidade muito maior do que a mineração de bitcoin, que pode ser interrompida sem colocar empresas globais offline. Uma das principais motivações da Microsoft é fortalecer sua nuvem para uma adoção crescente de inteligência artificial (IA) e outros aplicativos de alta densidade, que representam desafios para o design e gerenciamento do data center.

 

Novo hardware poderoso para cargas de trabalho de IA está agregando mais poder de computação em cada peça do equipamento, aumentando a densidade de energia - a quantidade de eletricidade usada pelos servidores e armazenamento em um rack ou gabinete - e o calor que o acompanha.

 

O hardware de IA também pode criar alto “fluxo”, no qual o uso de energia em um rack aumenta rapidamente à medida que o hardware começa uma nova carga de trabalho, o que pode ser difícil de gerenciar com o resfriamento a ar tradicional. Vários provedores de serviços se concentraram em soluções refrigeradas a ar otimizadas para cargas de trabalho de alta densidade, mas conforme as densidades aumentam de 25 a 30 kW por rack, os usuários recorrem cada vez mais ao resfriamento a líquido para gerenciar essas cargas de trabalho.

 

Belady diz que o resfriamento a líquido representa "uma função importante para gerenciar a densidade".

 

“Isso abre caminho para data centers de maior densidade e mais eficientes no consumo de energia”, disse Belady. “Estamos apenas no início dessa curva de densidade. Estamos muito otimistas com a tecnologia.”


Strong

5178 ブログ 投稿

コメント