Estratégia para NOC’s – Suportando o Crescimento da TI

Introdução

Nas últimas décadas vivemos e assistimos à um crescimento vertiginoso na demanda por recursos de TI. Infraestruturas de VOIP, Dados, Soluções para os mais diversos setores das empresas e para as mais diversas demandas, têm colocado a TI no holofote em grande parte das organizações.

Com o suporte ao usuário, não aconteceu diferente. Este também cresceu e irá continuar crescendo. Pessoas nas organizações estão cada vez mais conectadas, os processos de TI deixam de correr apenas no ambiente interno para se estender a todo lugar e a todo colaborador, seja através de dispositivos móveis corporativos ou via políticas BOYD.

Com o crescimento desta demanda, aparece também um crescimento considerável do número de soluções que às atendem. ERP’s e sistemas de correio são meras commodities que por si só já não atendem a todo o negócio. Surgem então as intranets, os sites corporativos, os serviços na nuvem, a aplicação transportada para a plataforma mobile, incontáveis aplicativos para diversas finalidades, enfim.   Se cada serviço tem com um propósito diferente, todos possuem uma característica em comum; demandam qualidade em sua prestação. Precisam estar disponíveis, precisam ter uma boa performance, precisam do usuário satisfeito com a disponibilidade e com a performance deste serviço.

Empresas de qualquer indústria, passam a respirar TI, e com isso, cresce na gestão desta o desafio de monitoria e controle. À rede está cada vez mais conectada, com links diversos tipos, conexões com variados prestadores de serviços, todas para serem monitoradas. Há ainda o SLA a cumprir e SLA a se exigir o cumprimento. O desafio é imenso, manter-se dentro do budget, é o desafio. Para isso, reunimos a seguir algumas estratégias que, se bem implementadas, permitirão que nosso NOC esteja preparado para esse crescimento.

2c5b2e7

Integração e Simplificação

Há em grande parte das organizações uma fauna muito numerosa de sistemas, ativos e soluções para fazer a gestão da TI. Neste aspecto, padronizar é palavra chave para tornar a administração do NOC mais fácil e intuitiva.

Quem administra um NOC, precisa ter visibilidade. Para quem opera, os processos precisam estar transparentes e ter um fácil entendimento e alcance. Quanto maior o ganho de visibilidade, maior o entendimento da infraestrutura e sua organização, maior a capacidade de antever problemas, endereçar incidentes, reagir a incidentes e encaminhar e aplicar correções. Vejamos algumas boas práticas.

Manter um Inventário

Construir um processo de inventário consistente e completo é o ponto de partida para a gestão do NOC. Para ganhar visão do ambiente, o inventário irá aparecer como peça chave. Ele irá ajudar a ter um melhor entendimento do ambiente a ser administrado. Irá permitir que se saiba de maneira precisa quais equipamentos eu tenho, modelos, fabricantes, fornecedores, qual quantidade, quais os sistemas rodando em cada um, o OS ou o firmware, e até mesmo quais são as aplicações que possui em cada um. Pontos que facilitarão a análise para a tomada de qualquer decisão, do planejamento à execução e gestão.

Uma vez que se o papel de cada ativo, suas especificações, demandas, provedores, torna-se mais fácil a organização do NOC, a definição de prioridades, capacitação de pessoal, definição de papéis, entre outros.

Centralizar as Soluções NMS (Network Management System)

Ao se integrar as ferramentas e seus processos dentro do ambiente de NOC, e simplificar a consulta à informação, ganha-se em:

  • Capacidade de Análise
  • Habilidade de se antecipar a problemas
  • Visão da Rede
  • Redução do tempo de resposta e do tempo de reparo (MTTR)

É muito comum encontrarmos várias ferramentas de gestão operando simultaneamente, uma para monitoração de disponibilidade, outra de performance de links, outra de aplicações, outra de conformidade e Segurança, outra para inventário, entre muitas outras mais.

O ideal é que consigamos centralizar o máximo de verificações na menor quantidade de ferramentas possível. Soluções com função específica e papel secundário, possuem o risco maior de serem esquecidas e de ficarem desatualizadas e fora de contexto, algo que deve ser evitado.

Neste ponto é comum que tenhamos inúmeras ferramentas, inúmeros dashboards, tentando unir a topologia, topologia, status, performance, inventário, histórico de eventos, tudo em um só lugar, fazendo com que a atenção do analista fique dividida entre essa incontável quantidade de fontes. O analista precisa ter uma visão completa do escopo gerenciado. Neste ponto, quanto menor for o número de interfaces, o número de aplicações, o número de telas, mais fácil será o entendimento da situação corrente e o da operação.

Documentar

Para que o NOC esteja sempre pronto para suportar crescimento, o hábito de documentar é imprescindível e deve estar nas veias de toda a estrutura. De inventário à processos, passando pela topologia do ambiente, a documentação dará visão adequada que sustentará o planejamento e a monitoração e fornecerá informações para outras áreas, servindo de base para o entendimento e para a resolução de problemas. Dados de uma pesquisa recente com profissionais de TI de EUA e Canadá revelaram que 33% dos administradores de TI entrevistados, nunca documentaram ou raramente atualizam sua documentação.

Ter Visibilidade

Consolidar a visão da infraestrutura é necessário para fazer visível o que é relevante para atividade do analista e o que é necessário para as pautar decisões que precisam ser tomadas. Neste aspecto não existe receita exata, o que existe é a busca por um ponto de equilíbrio, entre o que precisa ser visto em primeiro plano e o que pode ser consultado de maneira complementar. Neste aspecto é imprescindível que já tenha sido mapeado o que é importante do que é crítico e o que é informação de apoio/redundante.

Para auxiliar nesta visão, dashboards customizáveis permitem que usuários adaptem a solução de gestão à tarefas especificas (ex: Missão Crítica), de modo à refletir a estrutura da operação e permitindo encontrar soluções de maneira mais rápida.

Exemplos de práticas não recomendadas são fáceis de serem notadas em ambientes de NOC. Dashboards lindos, contemplando toda a topologia da empresa desenhada no LCD à um custo médio de 200 watts/hora por monitor, mas sem efetividade em levar a informação do que é crítico à quem acompanha a monitoração.  Dashboards eficazes devem trazer à tona problemas, mostram serviços impactados, aplicações e dispositivos off-line. Ainda se possível devem apontar ações que precisam ser tomadas, falhas que precisam ser corrigidas, tendências que necessitam ser analisadas. Quaisquer outras informações nos dashboards que não atuem no ganho de tempo para resolução de incidentes, podem ser consideradas cosméticas, já que não aumentam a performance e por vezes podem vir a comprometer a eficiência da operação.

Mais grave ainda é o risco da informação útil à operação, terminar sendo escondida em meio a informações de menor relevância, transformando nossos Dashboards em verdadeiros jogos de 7 erros. A expectativa natural de qualquer elemento na rede monitorada é estar UP, e a dos dashboards, e exibir o que não atende à esta condição, não ao contrário.

Construir Baselines e alarmar de acordo

A construção de baselines é a acessória à documentação. É através destes baselines que ganhamos entendimento do comportamento da nossa infraestrutura, mais particularmente de cada dispositivo. Na medida que temos a média de utilização média e oscilações esperadas para cada métrica, torna-se mais fácil apontar o que é ou não é um comportamento normal nos ativos da nossa infraestrutura.

Os baselines permitem que o NOC trabalhe de maneira proativa e dão subsídio para a configuração precisa de alarmes monitorando cada métrica. Uma vez que há o conhecimento do comportamento padrão dos sistemas críticos, e que existe uma política de para atualização dessas informações, torna-se possível, portanto aumentar a pró atividade do NOC e sua capacidade de antever problemas maiores, até mesmo antes que estes ocorram.

Automatizar onde possível

Muitos vêm o NOC apenas como fonte de Monitoração dos sistemas de TI e Telecom, mas ele pode ir muito além. Dotado das tecnologias corretas, podemos implementar certas automações que podem atuar na detecção e correção do problema.

O NOC não deve nunca ser confundido com service desk ou com helpdesk, mas não há como negar que atuando de forma central e sendo o primeiro a detectar e o primeiro a entrar em contato com o problema, ele está mais próximo do de entregar a solução do que qualquer outra estrutura na TI. Logo, quanto mais eficiente for o processo de automação em que o NOC se baseia, menor poderá ser o tempo de indisponibilidade do ativo ou serviço afetado.

Automatizar a Análise e Detecção de Problemas

Muitos dos incidentes, alguns em cenários mais complexos, não são detectados a partir da análise de um simples contador. As vezes é necessário um conjunto de fatores, de eventos e de informações diferentes para que haja o entendimento pelo NMS de que existe o problema. A leitura e o entendimento desse conjunto de fatores é algo que, se automatizado, pode indicar com precisão a natureza do incidente enfrentado e abre caminho para subsequentes automações.

Independente de qual seja o NMS, este apenas entenderá como falhas aquelas que ele esteja programado para encontrar. Ou seja, os possíveis problemas precisam estar previstos para que haja a automação da ação, seja ação de notificação, seja ação de correção. A partir da a coleta dos contadores, syslogs e traps SNMP, é possível que a solução de automação seja configurada de modo a validar a ocorrência do problema.

Relatórios de SLA

Como sabemos experiência dos os seus usuários possuem com os serviços que administramos e monitoramos está sujeita a oscilações. Essa coisa viva que chamamos de TI, sofre com a ação de agentes de todas as camadas, dentre eles a concessionária da energia elétrica, os provedores de serviços e telecom, soluções na nuvem ou mesmo pela ação do usuário, para não citar os erros de projeto e bugs em sistemas.

O Gestor do NOC precisa estar seguro de que está preparado para endereçar todas essas demandas, tendo sempre a informação sobre o que aconteceu, próximos passos e visão da correção. Tudo sempre disponível para compartilhar com seus clientes, internos e externos. Ele precisa estar pronto para dar respostas satisfatórias, deixando seus clientes tranquilos de que a solução está a caminho e dentro do tempo aceitável. Entregar o serviço dentro da especificação e do prazo é crucial para qualquer negócio.

Como se toda essa preparação não fosse o bastante, o gestor precisa estar munido de informações precisas, compiladas e que permitam que ele faça outra tarefa que é essencial, que é a apresentação de resultados da operação e desvios quanto ao SLA. O A geração destas informações, pode se tornar uma tarefa trabalhosa, consumindo tempo valioso. Neste momento, para evitar este cenário, faz-se importante que tais informações possam ser extraídas com facilidade, de preferência já no formato em que será usada, a partir de relatórios inteligentes que consigam de maneira simples e precisa, entregar a informação necessária, como disponibilidade dos serviços, chamados sem solução, estatísticas referentes à performance, efetividade, falhas, entre outros.

A Gestão da expectativa do cliente é algo complexo que normalmente demanda tempo e estratégia. Cada cliente e cada operação, demandam uma negociação distinta, com informações customizadas para cada qual. Neste aspecto, poder contar com uma solução que entregue a gestores e clientes uma visão consolidada e uniforme da performance, daqueles pontos pré-determinados, colabora para que as negociações e ajustes sejam feitas de modo transparente, padronizado e de maneira a aumentar a confiança do cliente na operação.

Comunicação entre a operação e o cliente

Disponibilizar para o seu cliente informações relevantes e organizada sobre a operação e rede fará com que ele tenha mais confiança e veja transparência na sua relação com a operação. Para materializar essa comunicação, o Portal é com certeza a maneira mais fácil, efetiva e simples de entregar informações de maneira completa, com abrangência e profundidade.

Através do portal, um cliente poderia consultar informações dos seus ativos, da sua topologia, do status da sua rede, da operação, informações de histórico, de tendências, das tratativas para os incidentes, entre muitos outros.

O portal tem o poder de quebrar a barreira que impede o cliente de saber mais de você, sobre a sua operação e os resultados do trabalho realizado ou do serviço entregue.

Com um portal inteligente, planejado para atender o cliente, este poderá encontrar um retrato fidedigno do status e resultado do trabalho exercido pela operação, que garante a sustentação dos seus negócios.

customwidget

O Objetivo de melhor nossos processos em todos esses aspectos que vimos, é poder crescer de maneira segura, mais confiante.

A definição, a Adoção e implantação de políticas e estratégias adequadas à nossa operação, é necessária e é algo que não pode ser deixado em segundo plano. Implementar ferramentas que nos deem essa visão e que facilitem essa gestão farão, junto da nossa estratégia, com que o nosso NOC se torne o pilar onde o crescimento da nossa empresa se apoiará com solidez e Confiança.

Quer conhecer mais sobre o assunto ou conhecer o OpManager a melhor solução de NMS do mercado? Entre em contato com o time da ACSoftware, seu parceiro ManageEngine no Brasil.

Deixe um comentário

Blog ACSoftware - ManageEngine