A primeira GPU Ampere da Nvidia foi projetada para data centers e IA, não para o seu PC

Ainda não há novas GPUs para jogos de PC

A Nvidia está revelando sua arquitetura de GPU Ampere de próxima geração hoje. A primeira GPU a usar Ampere será a nova A100 da Nvidia, construída para computação científica, gráficos em nuvem e análise de dados. Embora tenha havido muitos rumores sobre os planos Ampere da Nvidia para placas GeForce “RTX 3080”, o A100 será usado principalmente em data centers.

 

O impulso mais recente de data center da Nvidia ocorre em meio a uma pandemia e a um grande aumento na demanda por computação em nuvem. Descrevendo a situação do coronavírus como "terrivelmente trágica", o CEO da Nvidia, Jensen Huang, observou que "o uso de serviços em nuvem vai aumentar", em uma coletiva de imprensa com a presença do The Verge. “ Essas dinâmicas são realmente muito boas para nosso negócio de data center ... Minha expectativa é que o Ampere terá um desempenho extraordinariamente bom. É a nossa melhor GPU de data center já feita e capitaliza quase uma década de experiência em data center. ”

 

O A100 possui mais de 54 bilhões de transistores, tornando-o o maior processador de 7 nm do mundo. “Isso está quase nos limites teóricos do que é possível na fabricação de semicondutores hoje”, explica Huang . “ O maior dado que o mundo já fez e o maior número de transistores em um motor de computação que o mundo já fez.”

 

O sistema DGX A100 promete 5 petaflops de desempenho, graças a esses oito A100s, e eles estão sendo combinados usando a versão de terceira geração do NVLink da Nvidia. Combinar essas oito GPUs significa que há 320 GB de memória de GPU com 12,4 TB / s de largura de banda de memória. A Nvidia também está incluindo 15 TB de armazenamento interno Gen4 NVMe para alimentar as tarefas de treinamento de IA. Os pesquisadores e cientistas que usam os sistemas DGX A100 serão capazes até mesmo de dividir as cargas de trabalho em até 56 instâncias, distribuindo tarefas menores nas poderosas GPUs.

 

A recente aquisição da Mellanox pela Nvidia por US $ 6,9 bilhões, um fornecedor de rede de servidores, também está entrando em cena, já que o DGX A100 inclui nove interfaces de rede de 200 Gb / s para um total de 3,6 Tb / s por segundo de largura de banda bidirecional. Conforme os data centers modernos se adaptam a cargas de trabalho cada vez mais diversas, a tecnologia da Mellanox se provará cada vez mais importante para a Nvidia. Huang descreve o Mellanox como o importante “tecido de conexão” na próxima geração de data centers.

 

“Se você der uma olhada na maneira como os data centers modernos são arquitetados, verá que as cargas de trabalho que eles precisam realizar são mais diversificadas do que nunca”, explica Huang. “Nossa abordagem daqui para frente não é apenas focar no servidor em si, mas pensar em todo o data center como uma unidade de computação. Daqui para frente, acredito que o mundo vai pensar em data centers como uma unidade de computação e nós vamos pensar em computação em escala de data center. Não mais apenas computadores pessoais ou servidores, mas estaremos operando na escala de data center. ”

 

Os sistemas DGX A100 da Nvidia já começaram a ser enviados, com algumas das primeiras aplicações, incluindo pesquisas para COVID-19 conduzidas no Laboratório Nacional de Argonne dos EUA.

 

“Estamos usando os supercomputadores mais poderosos da América na luta contra o COVID-19, executando modelos de IA e simulações na tecnologia mais recente disponível, como o Nvidia DGX A100”, disse Rick Stevens, diretor de laboratório associado para Computação, Meio Ambiente e Ciências da Vida em Argonne. “O poder de computação dos novos sistemas DGX A100 chegando a Argonne ajudará os pesquisadores a explorar tratamentos e vacinas e estudar a propagação do vírus, permitindo aos cientistas realizarem anos de trabalho acelerado por IA em meses ou dias.”

 

A Nvidia diz que Microsoft, Amazon, Google, Dell, Alibaba e muitos outros grandes provedores de serviços em nuvem também estão planejando incorporar as GPUs A100 em suas próprias ofertas. “A adoção e o entusiasmo pelo Ampere de todos os hiperscalers e fabricantes de computadores em todo o mundo é realmente sem precedentes”, disse Huang. “Este é o lançamento mais rápido de uma nova arquitetura de data center que já tivemos e é compreensível.”

 

Muito parecido com o sistema de cluster DGX A100 maior, a Nvidia também permite que cada GPU A100 individual seja particionada em até sete instâncias independentes para tarefas de computação menores. Esses sistemas não serão baratos, no entanto. O DGX A100 da Nvidia vem com grandes promessas de desempenho, mas os sistemas começam em $ 199.000 para uma combinação de oito desses chips A100.

 

Não está claro como a Nvidia agora irá progredir Ampere diretamente em GPUs para consumidores ainda. A Nvidia apresentou sua arquitetura Volta, com processadores de inteligência artificial dedicados (núcleos tensores), da mesma forma que a Ampere de hoje. Mas Volta não passou a impulsionar a linha de produtos de consumo GeForce da Nvidia. Em vez disso, a Nvidia lançou um Titan V de $ 2.999 com Volta (que chamou de “a GPU para PC mais poderosa já criada”) focado em IA e processamento de simulação científica, não em jogos ou tarefas criativas.

 

Apesar dos rumores de que Volta alimentando futuras placas GeForce, a Nvidia apresentou sua arquitetura Turing em 2018, que combinava seus núcleos tensores dedicados com novos recursos de rastreamento de raios. Turing passou a usar placas de potência como a RTX 2080 em vez de Volta, poucas semanas depois de Huang dizer que a próxima linha de placas de vídeo não seria lançada "por muito tempo". A Nvidia até mesmo retirou os núcleos RT e Tensor para placas com Turing como a GTX 1660 Ti.

 

Os novos cartões “RTX 3080” podem estar a apenas alguns meses de distância, mas ainda não sabemos ao certo se eles usarão essa nova arquitetura Ampere. “Há uma grande sobreposição na arquitetura, sem dúvida”, sugeriu Huang. “A configuração, o dimensionamento dos diferentes elementos do chip é muito diferente.”

 

A Nvidia usa memória HBM para suas GPUs de data center, e isso não é algo que a empresa usa para GPUs de jogos de PC de consumo. As GPUs do data center também se concentram muito mais em tarefas de IA e computação do que em gráficos. “Estaremos muito mais inclinados para os gráficos e menos para o ponto flutuante de dupla precisão”, acrescenta Huang.

 

As especulações sobre os planos Ampere da Nvidia intensificaram-se recentemente, e com o PlayStation 5 e Xbox Series X definidos para serem lançados com soluções de GPU com tecnologia AMD ainda este ano, a Nvidia certamente precisará ter algo novo para oferecer aos jogadores de PC ainda este ano.

 

 

O Avance Network é uma comunidade fácil de usar que fornece segurança de primeira e não requer muito conhecimento técnico. Com uma conta, você pode proteger sua comunicação e seus dispositivos. O Avance Network não mantém registros de seus dados; portanto, você pode ter certeza de que tudo o que sai do seu dispositivo chega ao outro lado sem inspeção.


Strong

5178 Blog bài viết

Bình luận