Tempo de atividade: redes e software desempenham um papel crescente nas interrupções do data center

Problemas de rede e software estão surgindo como duas das causas mais comuns de interrupções em data centers, enquanto os problemas de energia estão se tornando menos problemáticos, de acordo com novos dados da Análise Anual de Interrupções do Uptime Institute.

Essa tendência não é surpreendente, dado o papel crescente dos aplicativos de computação em nuvem e SaaS (software como serviço), que cada vez mais usam arquiteturas que podem contornar falhas físicas de componentes elétricos como sistemas UPS, interruptores de transferência e geradores. Para ter certeza, os problemas da cadeia de energia ainda têm um grande impacto no tempo de inatividade, como visto em vários incidentes que chamaram a atenção no início de 2021.

 

“No geral, as causas das interrupções estão mudando”, disse Andy Lawrence, diretor executivo de pesquisa do Uptime Institute. “Os problemas de configuração de software e TI estão se tornando mais comuns, enquanto os problemas de energia agora são menos prováveis ​​de causar uma grande interrupção dos serviços de TI.”

 

Os serviços online foram mais importantes do que nunca em 2020, à medida que a pandemia de COVID-19 e as práticas de distanciamento social impulsionaram o trabalho e a aprendizagem remotos. Isso significava que as interrupções no serviço eram sentidas de maneira mais ampla e geravam uma maior audiência.

 

“Embora tenha havido interrupções significativas que afetam o comércio financeiro, serviços governamentais, internet e telecomunicações, as interrupções que chegaram às manchetes em 2020 geralmente eram sobre o impacto para consumidores e trabalhadores em casa, com interrupções em aplicativos como Microsoft Exchange e Teams, Zoom, fitness rastreadores e similares ”, observou o Uptime.

 

Interrupções geram mais preocupação, mais custos

 

O custo das interrupções do data center vai além das manchetes e das reclamações dos usuários nas redes sociais. Mais da metade dos entrevistados que relataram uma interrupção no Uptime nos últimos três anos estimaram seu custo em mais de US $ 100.000, e quase um terço relatou custos de US $ 1 milhão ou mais.

 

“A resiliência permanece perto do topo das prioridades de gerenciamento ao fornecer serviços de negócios”, disse Lawrence. “O fato é que as interrupções continuam comuns e justificam o aumento da preocupação e do investimento em preveni-las. Por causa da interrupção e dos altos custos que resultam da interrupção dos serviços de TI, identificar e analisar as causas raiz das falhas é uma etapa crítica para evitar problemas mais caros. ”

 

Algumas das descobertas da pesquisa Uptime de 2020 incluem:

 

Quase metade (44%) dos operadores de data center pesquisados ​​acreditam que a preocupação com a resiliência do data center / TI de missão crítica aumentou nos últimos doze meses.

Interrupções sérias e graves são menos comuns (um em cada seis relatou ter ocorrido uma nos últimos três anos), mas podem ter resultados catastróficos para as partes interessadas. Vigilância e investimento são necessários.

Mais da metade (56%) de todas as organizações que usam um serviço de dados de terceiros experimentaram uma interrupção moderada ou séria do serviço de TI nos últimos três anos, ela própria causada pelo provedor.

 

À medida que a arquitetura muda, o mesmo acontece com os culpados das interrupções

 

O foco no desempenho do serviço de terceiros acompanha a mudança contínua de data centers locais para o uso de instalações de colocation e plataformas de nuvem, o que tem um impacto positivo no tempo de atividade, mas também amplifica quaisquer falhas nas redes e automação de software que impulsionam o modelo de entrega na nuvem.

 

“Este aumento nas interrupções causadas por sistemas de TI e problemas de rede é devido à ampla mudança nos últimos anos de serviços de TI em silos executados em equipamentos especializados e dedicados para uma arquitetura na qual mais funções de TI são executadas em sistemas de TI padrão, muitas vezes distribuídos ou replicados entre muitos sites ”, afirma o Uptime em seu relatório de interrupção. “À medida que mais organizações mudam para TI distribuída e baseada em nuvem (impulsionadas por um desejo de maior agilidade e automação), a infraestrutura subjacente do data center está se tornando menos um foco ou um único ponto de falha.

 

“Isso não significa, no entanto, que haja algum caso, pelo menos no momento, para tirar a ênfase da resiliência no nível do local ou investir menos”, acrescentou o Uptime. “As falhas no nível do site invariavelmente causam problemas graves, independentemente de as arquiteturas de resiliência distribuídas serem implantadas.”

 

Como o criador do Tier System, que há muito é usado como referência para projetos de confiabilidade, a Uptime tem um interesse contínuo na redundância de equipamentos, um foco importante para as classificações de tier. Como os eventos recentes mostraram, o equipamento de energia continua a ser fundamental para o tempo de atividade.

 

Em março, um data center da OVH em Estrasburgo, França, foi destruído por um incêndio . Embora nenhuma análise final tenha sido fornecida, as primeiras indicações apontam para unidades UPS como a provável origem do incidente.

 

Este mês, um gerador de emergência pegou fogo em um data center WebNX em Ogden, Utah, causando o desligamento total do data center e longas interrupções para os clientes.

 

 

O Avance Network é uma comunidade fácil de usar que fornece segurança de primeira e não requer muito conhecimento técnico. Com uma conta, você pode proteger sua comunicação e seus dispositivos. O Avance Network não mantém registros de seus dados; portanto, você pode ter certeza de que tudo o que sai do seu dispositivo chega ao outro lado sem inspeção.


Strong

5136 Blog Postagens

Comentários