Por dentro da infraestrutura de computação em nuvem da Amazon

Conforme a computação em nuvem emergiu como o novo paradigma para a computação em escala, a Amazon se estabeleceu firmemente como o jogador dominante.

Depois de criar efetivamente o mercado de nuvem pública com o lançamento da Amazon Web Services em 2006, o varejista transformou a AWS em um negócio de US $ 6 bilhões por ano.

 

Ao longo do caminho, a infraestrutura da Amazon se tornou crítica para o tempo de atividade de mais de 1 milhão de clientes. É por isso que uma interrupção na Amazon pode criar ondas em sites populares como Netflix, Reddit, Tinder e IMdB, que foi o caso no domingo, quando a Amazon teve problemas em um data center na Virgínia.

 

Nesta semana, veremos a poderosa infraestrutura em nuvem da Amazon, incluindo como ela constrói seus data centers e onde eles vivem (e por quê).

 

A Amazon opera pelo menos 30 data centers em sua rede global, com outros 10 a 15 na prancheta. A Amazon não divulga o escopo completo de sua infraestrutura, mas estimativas de terceiros fixam sua rede de data center nos EUA em cerca de 600 megawatts de capacidade de TI.

 

Os principais analistas veem a Amazon como o ator dominante na nuvem pública. “A AWS é a esmagadora líder em participação de mercado (computação em nuvem), com mais de cinco vezes a capacidade de computação em uso do que o total agregado dos outros 14 provedores”, escreve a empresa de pesquisa de TI Gartner em sua avaliação do cenário de nuvem.

 

Levantando o véu do sigilo ... Um pouco

 

A Amazon tem sido historicamente sigilosa sobre suas operações de data center, divulgando muito menos sobre sua infraestrutura do que outros líderes de computação em hiperescala, como Google, Facebook e Microsoft. Isso começou a mudar nos últimos anos, conforme os executivos da Amazon Werner Vogels e James Hamilton se abriram sobre as operações do data center da empresa em eventos para a comunidade de desenvolvedores.

 

[Mergulhe fundo no mundo da tecnologia e cadastre-se no Avance Network a verdadeira comunidade criptografada!]

 

“Houve alguns pedidos de clientes nos pedindo para falar um pouco sobre o layout físico de nossos data centers”, disse Werner Vogels, VP e Chief Technology Office da Amazon, em uma apresentação no AWS Summit Tel Aviv em julho. “Nunca falamos muito sobre isso. Então, queríamos levantar o sigilo em torno de nossa rede e data centers. ”

 

Um objetivo principal dessas sessões é ajudar os desenvolvedores a entender a filosofia da Amazon sobre redundância e tempo de atividade. A empresa organiza sua infraestrutura em 11 regiões, cada uma contendo um cluster de data centers. Cada região contém várias zonas de disponibilidade, oferecendo aos clientes a opção de espelhar ou fazer backup dos principais ativos de TI para evitar tempo de inatividade. O “efeito cascata” de interrupções sempre que a AWS tem problemas indica que esse recurso permanece subutilizado.

 

A escala impulsiona o investimento na plataforma

 

Em seu trimestre mais recente, a receita da Amazon Web Services estava crescendo a uma taxa anual de 81%. Isso pode não se traduzir diretamente em uma taxa semelhante de crescimento da infraestrutura, mas uma coisa é certa: a Amazon está adicionando servidores, armazenamento e novos data centers em um ritmo insano.

 

“Todos os dias, a Amazon adiciona capacidade de servidor nova suficiente para suportar toda a infraestrutura global da Amazon quando ela era uma empresa com receita anual de US $ 7 bilhões”, disse James Hamilton, Engenheiro Distinto da Amazon, que descreveu a infraestrutura AWS na conferência Re: Invent no outono passado . “Há muita escala. Esse volume nos permite reinvestir profundamente na plataforma e continuar inovando. ”

 

A estratégia de data center da Amazon está incessantemente focada na redução de custos, de acordo com Vogels, que observou que a empresa reduziu os preços 49 vezes desde o lançamento da Amazon Web Services em 2006.

 

Fazemos muitas inovações em infraestrutura em nossos data centers para reduzir os custos”, disse Vogels. “Vemos isso como um negócio de alto volume e baixa margem, e estamos mais do que felizes em manter as margens onde estão. E então, se tivermos uma base de custo mais baixa, devolveremos o dinheiro para você.

 

Uma decisão importante no planejamento e implantação da capacidade da nuvem é o tamanho do data center a ser construído. A grande escala da Amazon oferece vantagens em custos e operações. Hamilton disse que a maioria dos data centers da Amazon abrigam entre 50.000 e 80.000 servidores, com uma capacidade de energia de 25 a 30 megawatts.

 

“Em nossa opinião, esse é o número certo e optamos por construir esse número por um longo tempo”, disse Hamilton. “Podemos construir maiores. A questão é que as vantagens iniciais de escala são enormes, mas há um ponto em que essas vantagens diminuem. Um data center realmente grande é apenas um pouco menos caro por rack do que um data center de médio porte. ”

 

Quão grande é muito grande?

 

À medida que os data centers ficam maiores, eles representam um risco maior como um componente da rede da empresa.

 

“É indesejável ter data centers maiores do que isso devido ao que chamamos de 'raio de explosão'”, disse Vogels, observando o termo da indústria para avaliar o risco com base em um único evento regional destrutivo. “Um data center ainda é uma unidade de falha. Quanto maiores você construiu seus data centers, maior o impacto que tal falha poderia ter. Gostamos muito de manter o tamanho dos data centers em menos de 100.000 servidores por data center. ”

 

Então, quantos servidores a Amazon Web Services executa? As descrições de Hamilton e Vogels sugerem que o número é de pelo menos 1,5 milhão. Descobrir o limite superior da faixa é mais difícil, mas pode chegar a 5,6 milhões, de acordo com cálculos de Timothy Prickett Morgan na plataforma.  ”Werner Vogels da Amazon: gostamos de manter o tamanho dos data centers para menos de 100.000 servidores ”citação

 

A Amazon aluga prédios de vários fornecedores atacadistas de data center, incluindo Digital Realty Trust e Corporate Office Properties Trust. No passado, a empresa normalmente alugava propriedades existentes, como depósitos e, em seguida, renovava-as para uso em data centers. Nos últimos anos, a Amazon começou a se concentrar em novas construções, que fornecem um “greenfield” que pode ser customizado para suportar todos os elementos de seus projetos, da grade ao servidor. Em Oregon, a Amazon usou componentes pré-fabricados de data center “modulares” para acelerar sua expansão.

 

Um elemento interessante da abordagem da Amazon para o desenvolvimento do data center é que ela tem a capacidade de projetar e construir suas próprias subestações de energia. A especialização é impulsionada pela necessidade de velocidade, ao invés de gerenciamento de custos.

 

“Você economiza um pouco”, disse Hamilton. “O que é útil é que podemos construí-los muito mais rapidamente. Nossa taxa de crescimento não é uma taxa normal para empresas de serviços públicos. Fizemos isso porque era necessário. Mas é legal podermos fazer isso. ”

 

Servidores e armazenamento personalizados

 

Nos primeiros dias de sua plataforma em nuvem, a Amazon comprou seus servidores de fornecedores líderes. Um de seus principais fornecedores foi a Rackable Systems, uma das primeiras empresas em projetos inovadores de servidor em escala de nuvem. A Amazon comprou US $ 86 milhões em servidores da Rackable em 2008, ante US $ 56 milhões um ano antes.

 

Mas à medida que suas operações cresceram, a Amazon seguiu o exemplo do Google e começou a criar hardware personalizado para seus data centers. Isso permite que a Amazon ajuste seus servidores, armazenamento e equipamento de rede para obter o melhor retorno de seu investimento, oferecendo maior controle sobre desempenho e custo.

 

“Sim, nós construímos nossos próprios servidores”, disse Vogels. “Poderíamos comprar na prateleira, mas eles são muito caros e de uso geral. Portanto, estamos criando armazenamento e servidores personalizados para lidar com essas cargas de trabalho. Trabalhamos em conjunto com a Intel para disponibilizar processadores domésticos que funcionem com taxas de clock muito mais altas. Isso nos permite construir tipos de servidor personalizados para suportar cargas de trabalho muito específicas. ”

 

A Amazon oferece vários tipos de instância EC2 com esses chips personalizados, uma versão aprimorada do processador Xeon E5 baseada na arquitetura Haswell da Intel e tecnologia de processo de 22 nanômetros. Diferentes configurações oferecem otimizações para aplicativos intensivos de computação e memória de aplicativos intensivos de IOPS.

 

“Nós sabemos como construir servidores com uma determinada especificação e, como consequência, os processadores podem ser mais exigentes.” disse Hamilton.

 

A AWS usa projetos de software e hardware próprios para sua rede, que talvez seja o componente mais desafiador de sua infraestrutura. Vogels disse que os servidores ainda respondem pela maior parte dos gastos com data centers, mas enquanto os servidores e o armazenamento estão ficando mais baratos, o custo da rede aumentou.

 

A velocidade da luz vs a nuvem

 

O “fator velocidade da luz” na rede desempenha um papel significativo na forma como a Amazon projeta sua infraestrutura.

 

“A maneira como a maioria dos clientes trabalha é que um aplicativo é executado em um único data center e você trabalha o máximo que pode para tornar o data center o mais confiável possível e, no final, você percebe que cerca de três noves (99,9% de tempo de atividade ) é tudo o que você vai conseguir ”, disse Hamilton. “Assim que você obtém um aplicativo de alta confiabilidade, você o executa em dois data centers. Normalmente eles estão muito separados, então a viagem de volta é muito longa. É uma excelente proteção contra um problema raro. ”

 

“Construir desenvolvimento distribuído em vários data centers, especialmente se eles estiverem geograficamente mais distantes, se torna muito difícil”, disse Vogels.

 

A resposta foi Zonas de disponibilidade: clusters de centros de dados em uma região que permitem aos clientes executar instâncias em vários locais isolados para evitar um único ponto de falha. Se os clientes distribuírem instâncias e dados em várias Zonas de disponibilidade (AZs) e uma instância falhar, o aplicativo pode ser projetado para que uma instância em outra Zona de disponibilidade possa lidar com as solicitações. Cada região tem entre duas e seis zonas de disponibilidade.

 

A Amazon inicialmente disse pouco sobre o layout físico dos AZs, deixando alguns clientes pensando se eles poderiam ser diferentes data halls dentro da mesma instalação. Desde então, a empresa esclareceu que cada zona de disponibilidade reside em um prédio diferente.

 

“É um data center diferente”, disse Hamilton. “Não queremos ficar sem AZs, então adicionamos data centers.”

 

Para fazer isso funcionar, as zonas de disponibilidade precisam ser isoladas umas das outras, mas próximas o suficiente para conexões de rede de baixa latência. A Amazon diz que suas zonas têm normalmente 1 a 2 milissegundos de intervalo, em comparação com os 70 milissegundos necessários para mover o tráfego de Nova York para Los Angeles.

 

“Decidimos colocar AZs relativamente próximos uns dos outros”, disse Vogels. “No entanto, eles precisam estar em uma zona de inundação diferente e em uma área geográfica diferente, conectados a redes de energia diferentes, para ter certeza de que estão realmente isolados um do outro.”

 

 

O Avance Network é uma comunidade fácil de usar que fornece segurança de primeira e não requer muito conhecimento técnico. Com uma conta, você pode proteger sua comunicação e seus dispositivos. O Avance Network não mantém registros de seus dados; portanto, você pode ter certeza de que tudo o que sai do seu dispositivo chega ao outro lado sem inspeção.


Strong

5178 بلاگ پوسٹس

تبصرے