Cloud Computing: é possível ter alta disponibilidade?

Alta disponibilidade com cloud computing parece ser um desafio para as empresas. Se há algo que tira o sono dos CIOs, e com razão, é como manter os sistemas de missão crítica da empresa estáveis, seguros e disponíveis. Falhas ocasionadas por problemas físicos nos equipamentos, por quedas de link ou por travamento ou bugs dos sistemas causam paradas nos processos afetando diretamente os negócios.

Ao planejar o uso da infraestrutura em nuvem, dois dos principais fatores que precisam ser considerados são a latência e o custo. Por exemplo, se a aplicação é sensível ao tempo de resposta, ou seja, necessita de baixa latência, então o data center escolhido deve estar próximo ao usuário. Já se houver a necessidade de armazenamento de grandes lotes de dados, o mais sensato é analisar o melhor preço, mesmo que o data center esteja distante.

Então recai sobre o gestor de TI a responsabilidade para que o sistema não pare. Mas como manter todos os sistemas e processos rodando e sem estourar o orçamento?

1.      Alta Disponibilidade em Cloud Computing

Pense no tempo, energia e custo altíssimo a serem investidos na estruturação de ambientes resilientes e em mecanismos de replicação e de contingenciamento dentro de casa para manter as aplicações no ar e longe dos riscos de falhas lógicas ou físicas. Trabalhando 24 horas por dia e 7 dias por semana, sistemas em cloud computing já incluem redundância e gerenciamento como premissa básica. Mesmo que ocorram problemas, os sistemas continuam no ar, sem grandes mobilizações de tempo, recursos e mão de obra.

Ao contar com uma plataforma de computação em nuvem de provedores o índice de latência, ou seja, o tempo de acesso aos sistemas e dados e a sua disponibilidade são garantidos por SLA (acordo de nível de serviço). A alta disponibilidade significa que qualquer componente ou sistema pode ser retirado de serviço seja por defeito, manutenção, reparo ou substituição sem que haja impacto para os processos de TI dos ambientes críticos do datacenter.

É primordial saber qual a necessidade de disponibilidade das aplicações que rodarão em nuvem para evitar interrupções e descontinuidade de negócios. Isso deve ser levado em consideração no planejamento da migração e uso do cloud computing. Algumas aplicações, como sistemas bancários ou E-commerces, por exemplo, têm maiores picos de processamento em dias e horários específicos. Aplicações como essas, além de disponibilidade quase em full time, exigem capacidade para atender esses aumentos na demanda. A nuvem permite que empresas não parem processos por conta de sobrecargas, e acrescentem ou diminuam recursos conforme a demanda. Após definir o nível de disponibilidade desejado, o próximo passo é implementar as devidas redundâncias de infraestrutura e serviços.

2.      Alta Disponibilidade: Replicação de Dados e Recuperação de Desastres

A replicação para recuperação de desastres (Disaster Recovery and Virtual Data Replication Software) é recomendada para as empresas de qualquer tamanho porque se os dados e sistemas não forem retomados rapidamente após um incidente os impactos podem ser catastróficos para os negócios.

A replicação virtual em um ambiente em cloud computing garante e permite que os usuários recuperem apenas um subconjunto ou todos os dados, documentos e aplicativos com um Tempo de Recuperação (RTO) muito mais rápido. Os backups externos de máquinas virtuais (VMs) e seus dados formam parte fundamental de uma solução de cloud computing pois são a última linha de defesa na proteção dos seus sistemas de missão crítica em caso de desastre. Ao ter uma cópia dos dados mantidos fora da empresa, não importa o que aconteça, sempre será possível recuperá-los.

O backup na nuvem também elimina os custos com transporte manual ou serviços de arquivamento. Além disso, com um backup físico pode-se levar muitos dias aguardando envios de fita ou restauração dos dados enquanto na nuvem, o RTO é bem menor.

As empresas exigem cada vez mais economia de custos e eficiência no uso de recursos de TI, mas com o volume de informações gerados cada vez maior, a taxa de crescimento de armazenamento também continua a aumentar ano a ano, o que está se tornando um grande desafio para os gestores de TI para atender às necessidades do negócio com menor custo. Outro grande desafio é que o ambiente de armazenamento físico usado para replicação e contingenciamento requer uma área de reserva significativa que desperdiça espaço em ambas as matrizes de armazenamento, consumindo muito mais recursos do que o armazenamento feito em máquinas virtuais (VMs).

O arsenal de contingenciamento das plataformas em nuvem contribui para assegurar o tempo de atividade e para proteger os servidores e a rede. Mas não é necessário migrar todos os seus sistemas de missão crítica para a nuvem. De fato, apenas replicar estes dados e sistemas online na nuvem permite um tempo de recuperação extremamente rápido por um preço menor do que investir em infraestrutura de contingenciamento ou, mesmo, do que migrar essas cargas de trabalho (workload) totalmente para um ambiente de cloud computing. Com a redução do impacto causado por falhas, a empresa consegue manter um grau de disponibilidade maior e um nível de performance mais amplo continuamente.

3.      Investindo na Continuidade do Negócio

A continuidade do negócio mediante a ocorrência de falhas operacionais ou sistêmicas começa pela redundância da parte física. Itens como disponibilidade de energia, discos e servidores podem falhar em qualquer data center, mesmo quando ele pertence a um provedor em nuvem. Por isso, fornecedores de cloud computing tem mais de uma opção de data center disponível para ativação de recursos. Seus servidores ficam em locais estratégicos e com esses benefícios que, para eles, são recursos básicos. Para contar com a disponibilidade do funcionamento virtual, às vezes, é preciso fazer mais do que separar servidores em data centers diferentes. É necessário utilizar balanceamento de carga, distribuição correta da arquitetura e a replicação de dados. Um bom fornecedor de nuvem fornece recursos que facilitam essas implementações.

Para aplicações que jamais devem parar ou falhar, é preciso pensar na redundância relacionada também às regiões. No caso de um problema numa grande área, não basta ter redundância de data center. É preciso manter os dados em num local não afetado. Para determinar a necessidade de disponibilidade da aplicação, podemos imaginar, por exemplo, um negócio com abrangência nacional, mas com sua infraestrutura inteira somente no Sul do país. Qual é o impacto para a empresa caso aconteça um problema sério de conectividade nessa região? Se o negócio deve funcionar sem interrupções, é bom pensar na questão de redundância em locais diferentes. Um recurso que ajuda a distribuir dados em regiões distintas sem prejudicar a latência, é o sistema CDN (Content Delivery Network), que são servidores distribuídos em vários data centers pelo mundo. O sistema faz cópias do conteúdo em seus servidores, então disponibiliza ao usuário de acordo com a região onde ele está.

Executar sistemas em ambientes diferentes oferece maior disponibilidade, porém requer maior investimento. Uma opção ainda mais segura para atuar com fornecedores de nuvem distintos, sem sobrecarregar a equipe ou desperdiçar investimentos, é contar com o modelo chamado multicloud. Isso torna as aplicações ainda mais resistentes a falhas de grande amplitude. Quando se trata de disponibilidade do serviço, há uma série de itens a serem observados e levados em consideração. O segredo está na escolha adequada do fornecedor de serviço para se chegar à solução com a melhor relação custo-benefício.

4.      Principais Pontos da Alta Disponibilidade

Um dos objetivos de alta disponibilidade é eliminar pontos únicos de falha na infraestrutura de TI. Um único ponto de falha é um componente tecnológico que pode causar uma interrupção do serviço se não estiver disponível.

· Planejamento

O primeiro ponto que os profissionais de TI devem considerar ao se falar em alta disponibilidade de servidores é o planejamento. Uma rede ou um sistema pode ser dividido em diversas partes que se comunicam e que precisam estar funcionando para que o todo seja operacional.

Somente com um bom planejamento de alta disponibilidade de servidores é possível ter controle sobre os recursos necessários para garantir a continuidade dos negócios. Monitoramento, backups, redundância, processamento de failover, armazenamento de dados e acesso são alguns pontos a serem considerados no planejamento;

· Backup

O backup é uma política de segurança de dados fundamental em uma empresa. Não há como ficar tranquilo quanto à alta disponibilidade de servidores se o backup não está em dia. As informações são ativos estratégicos, de grande relevância, que devem estar sempre disponíveis para que a empresa não perca uma oportunidade de negócio.

backup automático, por exemplo, faz parte da rotina de muitas empresas que se preocupam com a continuidade de seus serviços. Ele é, assim, extremamente importante para manter a alta disponibilidade de servidores;

· Servidor Standby

Em uma empresa, é comum que a infraestrutura de TI contenha diversos servidores, como Banco de Dados, Firewall, Arquivos e E-mail. O servidor standby é um servidor vazio, que, caso um dos servidores principais falhe, servirá para formatação e reinstalação do sistema operacional do servidor principal.

Ele contribui para minimizar o tempo de recuperação do servidor, aumentando a disponibilidade. Aliás, quando existe servidor stanbyreplicado, que é aquele que possui o mesmo sistema operacional do principal e que também armazena seus dados, esse tempo é ainda menor. A alta disponibilidade de servidores neste caso é realmente efetiva;

· Redundância

Um bom plano de redundância é fundamental para a continuidade dos negócios. A redundância atinge softwares e hardwares, e é a forma de um componente entrar em funcionamento em caso de falha de outro. Quanto maior a redundância, menor a probabilidade de interrupção no serviço.

Por exemplo, se um sistema empresarial deixar de funcionar, a redundância garante que um segundo ou terceiro sistema o substitua de forma automática e imediata. A alta disponibilidade de servidores é, portanto, diretamente relacionada à redundância;

· Cluster

Clusters são sistemas de hardware acessíveis, de custo mínimo e altamente escaláveis. Os clusters de alta disponibilidade são os sistemas que permanecem ativos por longo período de tempo, com plena condição de uso. Além disso, podem detectar erros e se proteger de possíveis falhas.

Eles permitem agregar vários computadores ou servidores. Isso quer dizer que eles trabalham juntos e, apesar de diversos, são considerados como um único sistema.

Para garantir a alta disponibilidade de servidores, a equipe de TI deve se atentar aos 05 pontos chave que manterão os negócios funcionando. Sabe-se, porém, que muitas empresas, especialmente as pequenas, não possuem recursos para ter profissionais de TI de prontidão em seu negócio.

Nesses casos, não se pode negligenciar o valor da alta disponibilidade de servidores. O ideal seria contar com o auxílio de uma consultoria de TI confiável para avaliar a infraestrutura e orientar os ajustes necessários, como a infra.

 

Fonte: Channel 360°

 

Autor: Lenildo Morais, Gerente de Projetos da Ustore