Sua infraestrutura pode lidar com um aumento na escala da Black Friday? Aqui está o que esperar.

A infraestrutura online deve ser capaz de lidar com uma quantidade sem precedentes de tráfego durante a Black Friday e outros picos de tráfego em grande escala.

Aqui estão nossas melhores práticas, o que você pode esperar e como se preparar.

 

O porque

 

É uma suposição justa que mais tráfego significa mais valor para o seu negócio. Isso, por sua vez, geralmente se manifesta em mais receita. Isso é particularmente verdadeiro para provedores de SaaS - e por causa disso, lidar com eventos como a Black Friday é o que chamamos de “um bom problema”.

 

O caso de uso é muito comum em provedores de SaaS que hospedam serviços onde podem ocorrer picos de tráfego imprevistos. Essas ondas são bastante comuns, e o que são e como lidar com elas são o foco principal deste blog.

 

 

Eventos como a Black Friday, transmissões esportivas ao vivo e ofertas por tempo limitado atraem um público significativo que - se você tiver sorte - coloca uma pressão real em sua plataforma.

 

Embora a Gravity tenha lidado com esses casos por muito tempo (e pode dizer que não há uma boa receita para lidar com eles), criamos nossas melhores práticas para preparar e manter nossa infraestrutura para poder atender recomendações personalizadas ininterruptamente, apesar do tráfego incomum padrões.

 

Como

 

Em um mundo perfeito, você teria poder de processamento ilimitado. No entanto, por mais que queiramos, não vivemos em um mundo perfeito - e independentemente da configuração da sua arquitetura, esse nunca será o caso.

 

Como seu provedor de infraestrutura, trabalha continuamente para encontrar um ponto ideal para aumentar e diminuir nossa infraestrutura antes, durante e depois desses eventos. (E, curiosamente, o problema descrito neste artigo foi o problema original que levou ao nascimento dos hipercalculantes).

 

Então, como tentamos encontrar esse ponto ideal?

 

Aquecer. Analisar. Otimize. Analise novamente. Otimize. Monitor. Mantenha-o em funcionamento. Diminuir gradativamente. Analisar. Volte para a configuração com crescimento orgânico.

 

Warmup significa dedicar e iniciar instâncias para ter mais poder de processamento e deve ser feito antes do evento. Se o aquecimento não terminar no início do evento, pode haver alguns problemas sérios.

 

E quanto ao escalonamento automático?

 

O escalonamento automático pode lidar com padrões de tráfego típicos em que o sistema tem algum tempo para ajustar os recursos atribuídos. Com o escalonamento automático, uma otimização significativa de custos pode ser feita se usada corretamente.

 

Por exemplo, os padrões de tráfego típicos para diferentes setores incluem horário nobre à noite para provedores de streaming e picos matinais na publicação. Mesmo esse padrão segue os padrões de sono do público.

 

Como os padrões de tráfego regulares têm picos menores, eles podem ser descritos com um gráfico “semelhante a sinusite”.

 

Vamos comparar isso com um pico de tráfego da Black Friday:

 

 

Lidar com esse pico com escalonamento automático geralmente não é possível, pois iniciar novas instâncias, aquecer caches e transferir configurações e conjuntos de dados para as novas instâncias simplesmente não pode ser feito a tempo de acompanhar a taxa de um grande aumento de tráfego.

 

O Efeito Avalanche

 

Em uma arquitetura de microsserviço, diferentes componentes (serviços) são conectados uns aos outros e a cooperação desses serviços pode servir a funções complexas.

 

Essa ideia vem da vida real. Quando você pede um hambúrguer, os componentes vêm de áreas diferentes: alguém fazia a plantação, outro processava para fazer farinha de trigo, outra pessoa o enviava para um lugar onde alguém assava um pão com ele. Há uma arquitetura de microsserviço muito extensa por trás de uma lanchonete.

 

Agora, vamos imaginar que nosso restaurante possa servir 300 hambúrgueres por dia (o que significa preparar 300 peças de carne, 300 pães, 900 fatias de picles e assim por diante). Podemos dizer que leva menos tempo para preparar alguns picles, em comparação a cozinhar um pedaço de carne e depois preparar 1 fatia de picles. Dessa forma, a vazão do sistema será o tempo consumido pelo processo de menor custo - que neste caso será o cozimento da carne.

 

O efeito avalanche entra em ação quando você tem um horário de pico e tenta servir mais hambúrgueres em um determinado período de tempo do que consegue preparar todos os ingredientes. O resultado serão filas enormes na frente, as pessoas estão esperando muito tempo e, eventualmente, sairão para comer em outro lugar.

 

Degradação Graciosa

 

A degradação harmoniosa é um método eficaz para manter sua plataforma funcionando ao lidar com picos de tráfego sem precedentes (e, portanto, também evitar o efeito de avalanche). A ideia é remover gradual e temporariamente (automática ou manualmente) recursos e funcionalidades ao vivo para facilitar a carga nos back-ends (aplicativos de computação, clusters de banco de dados, pesquisa de documentos, etc).

 

Um exemplo simples é quando você fornece cinco itens em resposta a uma solicitação de pesquisa em vez de 10 itens. Essa saída menor tira uma carga maior do backend da consulta de pesquisa e faz com que o usuário interaja para receber os resultados adicionais da pesquisa, se assim escolher.

 

A degradação graciosa na vida real significaria que seu restaurante servirá apenas carne cozida média, pois leva menos tempo e alivia um pouco a pressão do “backend” (os cozinheiros). O próximo nível seria hambúrgueres vegetarianos com praticamente nenhum tempo de cozimento. Como você pode ver, a degradação elegante economiza espaço - no entanto, também existem limites aqui.

 

O quê

 

Vamos explorar por que é importante trabalhar com eventos ocasionais (como promoções em grande escala da Black Friday) e qual é o valor do negócio. O gráfico a seguir é uma visualização dos quatro resultados possíveis de um evento, como a Black Friday:

 

 

Eu sei que parece um pouco caótico - mas me escute.

 

É fato que promoções como a Black Friday podem atrair mais clientes. Se for feito da maneira certa, novos clientes se tornarão clientes de longo prazo. Quanto mais clientes você atende com conteúdo atraente, mais efeito o evento terá.

 

Conforme mostrado no gráfico acima, pode haver pelo menos quatro resultados no final do dia:

 

Operação perfeita - você se saiu tão bem quanto poderia ter previsto, atendeu a um público amplo e aumentou sua linha de base em longo prazo. Como o nome pode sugerir, este é o resultado mais ideal.

 

Graceful Degradation - você conseguiu servir a toda a multidão, mas algumas degradações da qualidade do serviço pretendidas foram emitidas para poder atendê-los. A qualidade do serviço era, portanto, globalmente inferior. Nossa linha de base ainda estará elevada, mas abaixo do nível “perfeito”.

 

Falha temporária - você travava toda vez que havia tráfego intenso, mas após cada travamento, era possível recuperar o sistema. Houve ainda mais períodos de serviço de qualidade inferior neste resultado. Por causa disso, houve menos conversões do que a média neste dia e o efeito de longo prazo atinge um pouco abaixo de sua linha de base.

 

Blecaute prolongado - você caiu quando a primeira tempestade o atingiu e não conseguiu se recuperar totalmente. Por causa disso, seu serviço ficou inativo na maior parte do dia. Os usuários atraídos tentarão outros serviços porque você não conseguiu atendê-los. Embora esse cenário não seja o ideal, os usuários estão cientes de que a Black Friday pode causar falhas nos serviços e não necessariamente se desligar devido a uma falha na Black Friday. Devido a isso, sua linha de base permanece como estava e não cai mais.

 

Para aqueles que estão apenas começando no caminho da Black Friday, é completamente normal começar no “Long Blackout”. Bom planejamento, otimização contínua e equipes e fornecedores responsivos são a chave para o sucesso da Black Friday. Continue trabalhando em direção a uma “operação perfeita” e lembre-se - a jornada pode não ser necessariamente fácil, mas, a longo prazo, eventos como a Black Friday definitivamente valem seu tempo e investimentos.

 

 

O Avance Network é uma comunidade fácil de usar que fornece segurança de primeira e não requer muito conhecimento técnico. Com uma conta, você pode proteger sua comunicação e seus dispositivos. O Avance Network não mantém registros de seus dados; portanto, você pode ter certeza de que tudo o que sai do seu dispositivo chega ao outro lado sem inspeção.


Strong

5178 Blog Mensajes

Comentarios