POST_07_BLOG03_BLOG

ALTA DISPONIBILIDADE: o que é e como você pode alcançá-la

De quantos “noves” é a meta de disponibilidade dos serviços de rede de sua empresa? Embora idealize-se que provedores de serviços críticos mantenham seus esforços para garantir 100% de tempo de atividade, não é razoável esperar que isso seja matematicamente possível.  Eventos de downtime acontecem pelas razões mais diversas, todos nós já tentamos acessar um site que estava fora do ar e os sistemas da sua empresa possivelmente já ficaram inacessíveis por um tempo em algum momento.

Um padrão de disponibilidade bastante difundido é o de 99,999% ou “cinco noves” que seria a porcentagem de tempo que um componente de rede ou serviço deveria estar acessível. Isso corresponde a cerca de cinco minutos e 15 segundos de tempo de inatividade por ano. Mas, as necessidades de tempo de atividade variam para cada serviço e empresa.  Sob uma perspectiva de negócios, tudo se resume à quantidade de risco que uma empresa está preparada para suportar versus o custo. Com a demanda por infraestruturas confiáveis e consistentes e o uso de sistemas críticos que precisam operar continuamente, sem intervenções, as organizações precisam tentar garantir que a probabilidade de uma interrupção seja o mais próximo possível de zero. Para assegurar o alto nível de desempenho operacional, todos os componentes do sistema devem funcionar perfeitamente. Softwares, hardwares, fluxo de rede, infraestrutura de armazenamento e backup de dados devem estar altamente disponíveis. Mas o que exatamente significa alta disponibilidade?

Disponibilidade, no contexto computacional, refere-se ao período de tempo em que recursos de um sistema estão acessíveis, bem como ao tempo necessário para um sistema responder a uma solicitação feita por um usuário. Quando um sistema não está funcionando regularmente, a disponibilidade dos recursos é afetada. Neste sentido, a alta disponibilidade (high availability – HA) é a capacidade de um sistema operar continuamente sem falhar por um determinado período de tempo. Em geral, quanto mais crítico for um serviço para os processos de uma organização, mais forte deverá ser o compromisso dela para assegurar um alto nível de desempenho operacional.

Por que a alta disponibilidade é importante?

A alta disponibilidade é pensada para garantir que um sistema atenda a um grau de desempenho operacional acordado, respeitando os níveis de serviços que a organização fornece aos clientes. Neste sentido, a alta disponibilidade é importante quando deseja-se que todas as partes da infraestrutura computacional estejam totalmente operacionais, especialmente quando os sistemas devem ser capazes de se recuperar rapidamente de qualquer tipo de falha para minimizar as interrupções para o usuário final. Sistemas de controle militar, sistemas industriais e de saúde são sistemas que demandam maiores esforços ​​para resolver todos os eventos de tempo de inatividade com base no nível de gravidade e impacto causado. Esses setores costumam sofrer sanções severas quando não atingem os “cinco noves” desejáveis de disponibilidade.

Práticas recomendadas de alta disponibilidade incluem (ainda que não bastem):

  • Implementar e manter sistemas que detectam as falhas tão logo elas ocorram.

  • Extinguir pontos únicos de falha que causaria algum impacto mais grave no sistema em caso de mal funcionamento.

  • Assegurar que todos os sistemas e dados tenham backup para uma recuperação rápida e fácil (para empresas sem planos reais de recuperação de desastres ou backup em vigor, uma interrupção impacta na sua capacidade de negociação, em perda de vendas e receita e certamente em danos à reputação).

  • Monitorar incansavelmente o funcionamento dos servidores que fornecem os dados solicitados, as aplicações que os canaliza e a base de dados que organiza as informações para garantir que estejam íntegros.

Para alcançar alta disponibilidade, cada solicitação que é feita ao sistema deve ser tratada por pelo menos um serviço em funcionamento.  Para torná-la possível, algumas estratégias podem ser adotadas:

  1. Evite que servidores fiquem sobrecarregados, mantendo aplicativos em execução em vários servidores;

  2. Espalhe geograficamente os servidores físicos e mantenha neles peças diferentes do quebra-cabeça que compõem os bancos de dados e as informações de sua empresa.

  3. Tenha pelo menos um servidor de backup a alguns quilômetros de distância e dê preferência aos backups automatizados que independem de fatores humanos para salvar e proteger arquivos em suas várias versões.

Em resumo, para evitar os pontos únicos de falha ( SPOFs), que podem ser qualquer componente que faça com que todo o sistema pare de funcionar se falhar, o segredo é a redundância de hardware, dados, softwares e aplicativos. Dessa forma, se um servidor encontrar um erro crítico, o serviço muda automaticamente para um servidor secundário e os usuários finais não sentem. 

Referências: 

https://www.kaspersky.com.br/blog/panorama-ciberameacas-brasil-2021-pesquisa/18020/

https://www.cnnbrasil.com.br/business/risco-para-empresas-com-ataques-ciberneticos-supera-o-de-pandemia-diz-pesquisa/

https://www.istoedinheiro.com.br/cibercrimes-terao-impacto-de-mais-de-us-1-trilhao-na-economia-global-em-2020/

Compartilhar este Post

Logotipo Tecnews.net

Tecnews.NET

A Tecnews possui infraestrutura para suportar as mais variadas situações adversas sem que a prestação do serviço seja impactada, gerando confiança e disponibilidade para seus clientes

Categorias

Gerenciamento Antivírus

Preencha os campos abaixo. Em breve entraremos em contato.

Plano TecMail Zimbra

Preencha os campos abaixo. Em breve entraremos em contato.