Com o avanço da tecnologia, é praticamente impossível encontrar empresas que não dependam do bom funcionamento do ambiente operacional para o sucesso do seu negócio.
Falhas em sistemas podem causar diversos danos, principalmente quando afetam o consumidor. Por isso, cada vez mais, é comum ver organizações adotando a redundância em TI.
A redundância em TI é essencial para a alta disponibilidade de sistemas, redes e dados. Com a repetição de componentes críticos para o funcionamento de um serviço, a confiabilidade dele é aprimorada, pois caso aconteça uma falha que possa desabilitar o sistema primário, um sistema secundário assume a responsabilidade.
O objetivo da redundância em TI é garantir a utilização ininterrupta de serviços e evitar a perda de dados. Isso é feito com fontes de energia alternativas, múltiplos locais de armazenamento de dados e outros dispositivos redundantes.
Neste artigo vamos explicar melhor a redundância em TI, qual é a sua importância para a alta disponibilidade e como implementar e utilizá-la para assegurar a continuidade de serviços no ambiente operacional. Boa leitura!
O que é redundância em TI?
Em sua tradução, o termo “Redundância” significa um “discurso que se baseia na utilização de diferentes palavras para expressar um mesmo pensamento ou ideia” — de acordo com o Dicionário Online de Português.
Porém, o termo é usado em TI com outro propósito. Ele indica a duplicação de componentes críticos, aumentando a confiabilidade e segurança de um sistema, bem como sua disponibilidade.
Os componentes que podem receber essa proteção são normalmente relacionados a dados, como os backups. Porém, seu uso também pode ser interessante em clusters.
Os clusters são aglomerados de dispositivos ou computadores conectados. Eles podem ser entendidos como um sistema único, por meio de diversos aspectos, uma vez que desempenham as mesmas tarefas de forma sequencial ou paralela. Para que isso aconteça, é necessário que hajam nós, termos que indicam os softwares que alocam as tarefas.
Dessa forma, com o uso da redundância, são construídos clusters de alta disponibilidade. Nesse modelo, quando um nó falha, a tarefa é enviada para outro nó (ou dispositivo), mantendo o sistema funcionando de forma ininterrupta.
Para ficar mais claro, vamos entender um exemplo: imagine um ambiente operacional com um único servidor web. Em um momento de falha, todo o ambiente é paralisado, certo? Agora, imagine que é adicionado um servidor web idêntico à infraestrutura, junto a um dispositivo balanceador de carga.
Nessa nova situação, os dois servidores recebem o tráfego de forma igualmente distribuída. Porém, em momentos de falha em um deles, o dispositivo redireciona o seu tráfego para o servidor que continua funcionando. Dessa forma, a operação se mantém normal, permitindo que o erro seja reparado sem custos para a organização.
A redundância pode ser aplicada a diversos componentes de um sistema com o objetivo de garantir que sua disponibilidade seja mantida em momentos de problemas que levariam a pausa do funcionamento.
Quais as diferentes formas de deixar um sistema redundante?
Um sistema pode ser redundante em diversos dos seus componentes. Para isso, basta que ele tenha pelo menos dois recursos diferentes integrados e capazes de se substituírem. As formas mais comuns de redundância em TI são nas fontes de energia, nas redes, na memória RAM e nos dados. Confira, a seguir!
Fontes de energia
A redundância em fontes de energia consiste, na maior parte das vezes, em nobreaks e baterias que podem garantir a continuidade do trabalho em um local mesmo se houver indisponibilidade ou intermitência na rede elétrica.
Além disso, também é interessante investir em geradores de energia que vão assumir todas as cargas do sistema até o restabelecimento e a estabilização da rede elétrica pública, incluindo a recarga das baterias que foram acionadas quando houve a queda do serviço.
Redes
Já a redundância de rede envolve a repetição de equipamentos modulares de fornecimento de rede e, pelo menos, duas conexões diferentes com a internet. A ideia é garantir a conexão mesmo no caso de falha de um componente ou serviço.
Logo, se o provedor de internet de uma empresa que oferece serviços online sofre alguma falha, ele precisa de uma opção alternativa para continuar operando, o que pode ser, por exemplo, uma conexão com outro provedor.
Em alguns casos, é interessante que essa conexão secundária ou terciária seja sem fio, para situações em que o problema é físico, como a queda de um poste na região em que passam todos os cabos de provedoras.
Memória RAM
A redundância também pode ser usada na memória RAM dos dispositivos da empresa, garantindo que, quando um problema surge em um de seus componentes, os demais deem conta do recado.
Um ponto importante é entender que a velocidade do dispositivo pode ser impactada, caso o total de memória disponível para as operações não seja alta, sobrecarregando as atividades.
Dados
Por fim, a redundância nos dados é feita com técnicas e equipamentos que vão garantir que eles sobrevivam a qualquer tipo de desastre e estejam sempre disponíveis. Para isso, é importante que a empresa tenha uma política de backups consistente e, pelo menos, dois locais de armazenamento diferentes.
Uma boa política de backups é aquela que faz cópias de segurança dos dados em intervalos curtos que possam ser medidos em horas. Dessa forma, se algum tipo de falha afeta os sistemas principais de uma empresa, boa parte do trabalho ainda pode ser recuperada nos backups.
Como existe a possibilidade dos dados corrompidos ou malwares prejudicarem um backup, é muito recomendável que existam também cópias de datas um pouco mais antigas, que possam ser acessadas nesses casos.
Em relação aos locais de armazenamento, é extremamente recomendável que eles sejam distantes o bastante para garantir a segurança dos dados em catástrofes naturais: mesmo se a cidade em que um data center está instalado for devastada por uma inundação, os dados sobreviverão em outro local geograficamente afastado.
Outra técnica aqui é contar com, pelo menos, um backup armazenado na nuvem, o que garante disponibilidade e segurança de dados maior do que data centers físicos.
Quais falhas podem ocorrer?
Falamos que a redundância ajuda a driblar momentos de falha que podem comprometer os resultados da empresa, mas quais são essas falhas? Colocamos abaixo as principais delas!
Falha de Hardware
Essa falha ocorre quando componentes físicos da infraestrutura apresentam problemas — como fontes de alimentação e discos rígidos. Para lidar com elas, é indicado o uso de elementos redundantes que são tolerantes à falhas, como fontes de alimentação e discos redundantes.
Falha de Software
Essa falha ocorre de forma interna, ou seja, nos sistemas operacionais. Para lidar com ela, é indicado o uso da redundância operacional ou pela utilização de clusters.
Falha Humana
A falha humana também pode impactar negativamente na disponibilidade de sistemas no ambiente operacional.
Para lidar com o problema, é indicado o uso de treinamentos e preparo do time, visando garantir melhores resultados para a equipe. O uso da ITIL (Information Technology Infrastructure Library) também é recomendado.
Desastres físicos
Desastres físicos, como enchentes, curtos e até mesmo a queda de um avião no prédio onde está seu datacenter local, não são suportados apenas pela redundância. Para lidar com isso, é necessário buscar a contingência, entendida como uma redundância externa, ou seja, localizada em locais remotos.
Dessa forma, caso algo aconteça com seu servidor principal, os dados e a operação se mantêm salvos em outro ambiente, distante do problema.
Qual a relação de redundância e resiliência?
As camadas de redundância não são o único investimento que uma empresa deve fazer para alcançar a alta disponibilidade de seu ambiente operacional. Para isso, é necessário olhar também para a resiliência.
Isso acontece porque, mesmo com diversas camadas de redundância, as falhas ainda podem ocorrer e não há medidas que corrijam esse problema sem uma estratégia de resiliência.
Outro fator importante são as chamadas “tempestades perfeitas”, que derrubam todo o sistema, inviabilizando o uso das camadas.
A estratégia de resiliência prepara o time para lidar com esses problemas e recuperar a infraestrutura o quanto antes. Ela pode ser separada em três frentes: segurança da informação e governança de dados, continuidade e recuperação de desastres e gerenciamento dos serviços de TI.
Qual sua importância?
A tecnologia da informação é cada vez mais importante para a geração de valor em negócios. Muitas empresas dependem da disponibilidade dos seus sistemas para garantir sua operação e praticamente qualquer tipo de negócio hoje armazena valor significativo em seus dados.
Exemplo disso são os bancos e as instituições financeiras, que hoje trabalham em um ambiente operacional totalmente informatizado. Se algum tipo de falha derruba o sistema desse tipo de empresa, o trabalho é paralisado e, mesmo quando a interrupção dura alguns minutos, os prejuízos são imensos.
Outro tipo de risco que causa danos financeiros imediatos e gigantescos é a perda de dados. Se uma empresa perde seus dispositivos de armazenamento físico por uma catástrofe natural — como incêndio, descarga elétrica ou alagamento —, pode perder o trabalho e pesquisa de décadas, o que muitas vezes causa estragos irreversíveis na sua geração de valor.
Para evitar esse tipo de prejuízo, toda empresa tem um plano de continuidade em negócios e recuperação de desastres de TI na manga — ou, pelo menos, deveria ter. Uma parte fundamental desse plano é a redundância, que é a repetição de componentes críticos para assegurar a operação contínua e proteger os dados de uma organização.
Quando existem muitas camadas de redundância, as chances de indisponibilidade são drasticamente reduzidas, pois no caso de falha de um componente, já existe outro preparado para assumir seu papel no ambiente operacional.
Apenas um cenário de “tempestade perfeita” poderia derrubar o sistema e, quanto maior for o investimento em redundância, mais improvável é a ocorrência dessa combinação de falhas.
Quais seus benefícios para a empresa?
A alta disponibilidade gerada pela redundância em TI no ambiente operacional traz diversos benefícios para as empresas. Colocamos abaixo os principais deles. Continue lendo para conferir!
Evita perda de dados
O primeiro benefício gerado pela redundância é a possibilidade de evitar perda de dados da organização, principalmente informações confidenciais e importantes para a tomada de decisão. Em momentos de falha em sistemas, é comum que eles sejam apagados ou modificados, porém, com os backups realizados, a informação real fica segura.
Impede paralisações de sistemas
Outro benefício importante é que a redundância impede a paralisação dos sistemas e processo da empresa. Dessa forma, em momentos de problemas e falhas, os resultados e desempenho geral não são impactados.
Quando não há essa segurança e os sistemas são paralisados, os funcionários ficam sem ter o que fazer até o problema ser resolvido, o que gera custos.
Os clientes também são prejudicados, uma vez que, quando o sistema que falha é o de venda ou de interação com a empresa, eles não podem realizar suas atividades — como pagamentos ou transferências em aplicativos bancários, por exemplo.
Reduz gastos e prejuízos
Os momentos de paralisação deixam os funcionários sem poder realizar suas funções, o que gera custos para a organização. Quando isso é frequente, o impacto é ainda maior, uma vez que os colaboradores ficam frustrados com a falta de infraestrutura para seu trabalho, o que reduz sua produtividade e satisfação com a empresa.
Os prejuízos também acontecem no contato com os clientes. As paralisações impedem vendas ou que os consumidores realizem interações com a marca — como quando eles querem usar um sistema da empresa para fazer consultas, por exemplo.
Caso isso seja recorrente, há o mesmo efeito de insatisfação, o que faz eles procurarem por outras organizações.
Aumenta a competitividade do negócio
Por fim, adotar a redundância em TI no ambiente operacional ajuda a construir processos e sistemas mais eficientes, o que evita problemas que comprometem as entregas da empresa, insatisfação dos clientes e baixa produtividade. Todos esses ganhos geram mais competitividade para o negócio.
Como implementar a redundância no ambiente operacional?
Não é difícil implementar a redundância em empresas. Ela é uma responsabilidade da equipe de TI, que geralmente investirá uma parte significativa dos seus recursos para garantir a alta disponibilidade de sistemas e dados.
Idealmente, a redundância deve fazer parte de uma estratégia de continuidade de serviços e recuperação de desastres, que incluirá também outros elementos como o mapeamento de riscos e a elaboração de respostas rápidas para eles.
Com um mapeamento de riscos bem construído, é possível também entender até quando vale a pena investir em redundância, já que a duplicação de alguns serviços pode ser onerosa para a organização e, em alguns casos, pode ser mais interessante assumir um risco do que acrescentar uma nova camada de redundância.
É seguro dizer que quase sempre vai valer a pena investir em redundância na TI, especialmente em relação aos dados. Os prejuízos causados pela indisponibilidade de serviços ou pela perda permanente de dados podem ser devastadores para uma empresa, comprometendo inclusive a sua continuidade no mercado.
Agora que você já sabe o que é a redundância em TI e a sua importância para o ambiente operacional, entenda como modernizar os processos da empresa e ter melhores resultados!