Intelligent Routing Blog


O custo da inatividade de rede para Provedores de Serviços

10/25/2012

Uma rede operacional é um recurso estratégico de negócios. Ela carrega mensagens diárias e dados de missão crítica, e facilita a comunicação entre pessoas e processos empresariais. É, provavelmente, invisível para muitas pessoas na empresa, que a percebem como um utilitário, como a água ou a electricidade. E, assim como com essas utilidades, sua essencialidade torna-se aparente quando ela não está lá. De acordo com um estudo anterior realizado pela Infonetics Research, em média, 3,6 por cento da receita anual de grandes empresas é perdida devido ao tempo de inatividade.

O que acontece quando a rede não está disponível? Uma interrupção na rede pode ter um impacto significativo sobre a imagem de uma empresa e seus clientes. Os funcionários não podem ter acesso a e-mails, telefones ou aplicações de negócios. Do mesmo modo, os processos de negócios não são atualizados e os clientes podem começar a procurar outro lugar para a informação que procuram ou para o produto ou serviço que eles precisam adquirir.

Um estudo recente sobre os tomadores de decisão de tecnologia mostra como é importante investigar os fatores que causam inatividade de rede. O Strategy Group realizou uma pesquisa que incluiu 173 entrevistados do banco de dados da empresa Ziff Davis. Eles eram todos gerente ou níveis superiores trabalhando em organizações com mais de 100 funcionários. Este grupo demonstrou a crescente falta de tolerância para o tempo de inatividade da rede. Quase 1/3 (32 por cento) disseram que tinham tolerância zero, e a resposta média do grupo foi de apenas 1,8 horas. É perfeitamente compreensível, uma vez que a perda média estimada causada pela deficiência da rede é cerca de US$ 3 milhões por dia, com 10 por cento dos entrevistados dando uma estimativa de mais de US$ 10 milhões em danos e perda de receita por dia.

As consequências negativas de uma interrupção de rede não são apenas financeiras. Danos da imagem corporativa eram a maior preocupação dos entrevistados (69 por cento), com a perda de clientes logo atrás (47 por cento). Tendo em conta estas potenciais consequências, não é de estranhar que 70 por cento do orçamento médio de TI seja direcionado para manter as coisas funcionando e apenas 30 por cento para as atividades estratégicas e inovadoras. No geral, o grupo queria ver essa mudança ao longo dos próximos 12-18 meses, movendo-se em direção a uma divisão 60/40.

Quase metade do grupo (46 por cento) tinha uma abordagem reativa para o monitoramento de rede e solução de problemas. É interessante notar que as empresas com uma abordagem proativa ou estratégica gastam uma porcentagem menor do seu orçamento apenas para manter as coisas funcionando (de 60 a 65 por cento), em comparação com aquelas com uma abordagem reativa ou caótica (de 75 a 80 por cento). A taxa mais baixa pode indicar um ciclo virtuoso de benefícios, como as empresas que trabalham de forma proativa continuam a inovar e melhorar suas operações de TI e superar os seus concorrentes reativos.

Equipes de operações enfrentam muitos desafios quando eles tentam aumentar a disponibilidade da rede. Interrupções atribuídas ao equipamento de rede geralmente se enquadram em uma das três categorias: eventos planejados de manutenção, erros de sistema, ou fatores humanos. Fornecedores de rede geralmente se concentram nos dois primeiros, mas o último, o fator humano, é o maior contribuinte, responsável por 50 a 80 por cento das interrupções de rede.

Procurar alguém para culpar é uma resposta natural às interrupções causadas pelo erro humano, mas, infelizmente, isso não ajuda a melhorar a disponibilidade da rede. Em sistemas complexos, como redes de computadores modernos, o erro humano é mais um sintoma da complexidade do que uma causa específica.

O desempenho das redes IP depende de uma grande variedade de condições dinâmicas. Mudanças de tréfego, falhas de equipamentos, manutenção planejada e mudanças de topologia em outras partes da Internet, tudo pode diminuir o desempenho. Para manter o bom desempenho, os operadores de rede devem reconfigurar continuamente seus processos de roteamento. Operadores implantam BGP para controlar o fluxo de tráfego para Sistemas Autônomos vizinhos (Ases), bem como a forma como o tráfego percorre suas redes. No entanto, embora a seleção da rota BGP seja controlada indiretamente por políticas configuráveis e influenciada por interações complexas com protocolos de roteamento intra-domínio, os operadores não podem prever como uma determinada configuração BGP se comportaria na prática.

Quando surgem os problemas de desempenho ou condições da mudança de rede, os operadores são forçados a ajustarem a configuração dos roteadores para fornecerem baixa latência, alto rendimento e alta confiabilidade. Por exemplo, um operador pode ajustar a configuração para responder ao congestionamento da rede ou falhas de equipamentos ou para se preparar para a manutenção planejada. Contudo, a complexidade dos protocolos, o grande número de parâmetros ajustáveis e o tamanho da rede tornam extremamente difíceis para os operadores refletirem sobre os efeitos das suas ações. Estas limitações levam a erros humanos na configuração BGP. Portanto, a abordagem comum de "fuçar e rezar" não é mais aceitável em um ambiente onde os usuários têm altas expectativas de desempenho e confiabilidade. Consequentemente, soluções únicas com base no encaminhamento mais inteligente, devem ser implantadas. Sistemas de otimização de roteamento, como a IRP Noction permitem a automatização de roteamento BGP na tomada de decisão. A plataforma IRP utiliza inovações em Roteamento Inteligente para minimizar a ocorrência de erros humanos e aumentar o desempenho geral da rede.

‹  Back to the list