Por Kate Fulkert
Estar sempre preparado para o inesperado é essencial para o gestor do data center. A profunda dependência das empresas e países de sua infraestrutura digital – sejam data centers on-premises ou na nuvem – faz com que disrupções causem prejuízos reais. Um estudo do instituto de pesquisas Datacore de 2018 com 1200 gestores de data centers dos EUA mostra que, dependendo do tamanho da empresa, o downtime pode custar entre US$ 10 mil por hora (segmento SMB) e US$ 5 milhões por hora (mercado enterprise).
O mesmo documento revela que apenas 2% desse universo consegue recuperar o ambiente em menos de 1 hora. 54% desse universo afirma que levou mais de 8 horas para colocar todos os sistemas em funcionamento depois de uma falha. Um relatório da FEMA, a agência federal de recuperação de desastres dos EUA, vai mais longe em sua análise sobre as penalidades sofridas por empresas que não contam com um plano de recuperação de desastres. Após um desastre, entre 40 e 60% das pequenas empresas saem do mercado – esse dado refere-se a todo tipo de ação inesperada, de incêndios a downtime de data centers.
É nesse contexto que entra em cena um plano de recuperação de desastres e continuidade dos negócios que elimine uma das causas comuns na indisponibilidades do data center: o erro humano.
Uma checklist bem pensada reduz o risco de erros e esquecimentos no meio de um desastre e garante que uma organização esteja preparada para qualquer eventualidade.
1) Avaliação de risco: Esse deve ser o primeiro passo para uma organização desenvolver um plano de recuperação de desastres. Que tipo de ameaças são relevantes para a sua região? Enchentes, tornados, incêndios e terremotos são exemplos de desastres naturais que demandam planejamento. Outro ponto a ser examinado: algumas das instalações estão localizadas próximas a áreas que tornem a exposição à radiação, lixo tóxico ou explosivos algo a ser incluído no planejamento?
2) Plano de evacuação: A segurança humana sempre vem em primeiro lugar. É essencial ter um plano para evacuar todo o pessoal que esteja em uma situação de risco provável. Isto deve incluir um plano detalhado de comunicação com os colaboradores para confirmar a sua segurança.
3) Torne o data center à prova de intempéries: Se a ameaça for uma enchente ou alguma outra coisa relacionada ao clima, tome as medidas necessárias para tornar sua instalação mais robusta. Prenda ou armazene itens soltos e certifique-se de que os servidores estejam seguros em seus racks. Limpe calhas, grelhas e bueiros. Tenha a certeza de que as portas possam ser vedadas contra ventanias e temporais. A água é inimiga do data center, então, faça tudo o que for preciso para garantir que não entre água nas salas dos servidores.
4) Faça o backup dos dados: Vários data centers conduzem backups de rotina uma vez por semana. Se você souber que haverá alguma intempérie à vista, aumente a frequência desses backups. Nem sempre podemos saber quando um desastre acontecerá, então, as organizações deveriam considerar a prática de fazer backups diários. Pense sobre o local onde o backup de dados está sendo armazenado. O backup deve ser feito e armazenado fora do site, mas certifique-se de que sua localização seja segura e protegida contra eventuais desastres.
5) Verifique o gerador: Esse equipamento requer manutenção e conservação para garantir que funcione como esperado quando for necessário. Ele está cheio de combustível limpo? A linha de combustível e o filtro de ar estão sem contaminantes? Teste o gerador regularmente e antes de qualquer evento previsto de intempérie. Lembre-se, quando ocorre um desastre, os combustíveis se tornam um item de extrema importância e a sua organização não será a única precisando que ele seja entregue.
6) Comunique-se com as concessionárias: Considere o impacto no seu ambiente da perda de energia, água, telefone ou internet. Entre em contato com as concessionárias para estabelecer planos de contingência.
7) Equipes de emergência: Caso haja um desastre expressivo, os colaboradores locais podem estar impossibilitados de trabalhar. Considere trazer equipes de emergência e estabelecer o local de backup para crises próximo ao data center para garantir que você tenha pessoal no site.
8) Entre em contato com fornecedores: Faça uma lista de fornecedores e priorize aqueles com os quais você precisará entrar em contato no caso de uma emergência.
9) Confie na sua equipe: Reúna todos os envolvidos – TI, Facilities, RH, Comunicação, Jurídico, Logística, Segurança da Informação – e tenha certeza de que todos entendem as suas responsabilidades durante a crise.
10) Confirme as coberturas dos seguros: Isto começa com o seguro predial, mas uma cobertura adicional sobre a infraestrutura ou para a continuidade dos negócios pode ser obtida. Se o data center estiver fora por uma semana, um seguro para continuidade dos negócios pode compensar a organização pelas receitas perdidas.
11) Lembre-se do edge: Atualmente, o data center principal é apenas uma parte em uma rede distribuída. Várias organizações gerenciam diversos sites de edge. Esses sites são agora mais críticos do que nunca e precisam ser levados em consideração no planejamento para desastres. Em diversos casos, o data center central pode estar seguro em relação a determinado evento, mas um ou mais sites de edge podem estar em risco. Tenha um plano para estas instalações e para todos os colaboradores nestes sites.
12) Preste atenção na nuvem: Apenas porque alguma parte do seu data center e aplicações estão alojados na nuvem, isto não significa que estejam sempre protegidos contra eventos de emergência. Esses servidores na nuvem estão em um data center em algum lugar, e você deve saber como o seu provedor de nuvem gerenciará um possível desastre. Qual a periodicidade com que eles fazem backup de dados? Eles têm sites redundantes?
13) Leve em conta os oportunistas: Hackers veem os desastres naturais ou eventos similares como uma oportunidade para acessar as redes quando a atenção está voltada para outra coisa. Certifique-se de que suas equipes de segurança da informação e segurança física estejam preparadas para malfeitores.
O checklist de recuperação de desastres é algo vivo, que deve ser transformado toda vez que acontecerem atualizações na lógica de negócios, mudanças na infraestrutura crítica e no time de profissionais. A gestão do plano de recuperação de desastres pode ser feita com o time interno do data center ou em conjunto com fornecedores externos de serviços, profissionais reconhecidos por sua expertise nessa disciplina. Estratégias como estas contribuem para a continuidade dos processos do data center, da empresa e do país.
*Kate Fulkert é Gerente de Recuperação de Desastres e Continuidade dos Negócios na Vertiv.