Arquitetando o Monitoramento – 4. Alertas

Cada rede tem uma linha de base que descreve o que é normal na rede, tanto quanto o desempenho e e o comportamento da rede com problemas. A linha de base para cada rede é diferente um do outro. Quando os valores referentes a uma alteração do parâmetro de um valor de linha de base estabelecida, tem o potencial de se tornar um problema que pode afetar o tempo de funcionamento da rede. Em tais cenários, alertando com base no desvio do valor médio pode ajudar com a detecção precoce e resolução de problemas, que por sua vez contribui para o bom funcionamento da rede com menos ou nenhum tempo de inatividade. Alertas ajudam os administradores a encontrar o que possivelmente pode dar errado na rede em relação ao desempenho e segurança. Existem várias opções com base no qual um alerta pode ser gerado. Aqui estão alguns termos associados com alertas:

Triggers:

Trigger refere-se ao caso em que provoca um alerta a ser gerado. Um evento aqui pode referir-se a alteração no estado de um node ou de um valor relacionado com o node, desvio significativo do valor de um parâmetro, que cruza o  threshold  e o parâmetro, e assim por diante.

Thresholds, Contador de Repetições, e Atrasos:

A maioria dos alertas são definidos para ser gerado com base em threshold. Quando o valor de referência relacionado com um parâmetro de rede é cruzado, uma violação de threshold ocorre e este pode ser configurado para disparar um alerta. Os alertas também podem ser configurados para alertar quando o thresholds forem violados com base na contagem de repetições e tempo (eg.2 vezes em 10 minutos).

Reset:

Um alerta é gerado com base em uma violação de threshold, e será redefinido quando o valor do parâmetro que disparou retornar ao seu valor inicial.

Supressão e  Duplicação:

Certas violações de thresholds são esperados ainda que ultrapassem um valor limite. Em tais casos, os alertas são suprimidos. Em outros casos, o mesmo acontecimento pode fazer com que uma violação de thresholds possa ocorrer em vários eventos, que por sua vez vai provocar múltiplos alertas.

Acknowledging Alertas

Quando um alerta se torna ativo, então você pode reconhecê-lo. Depois que um alerta é reconhecido, ações de alerta nos níveis mais elevados de escalação são interrompidos e o tempo que foi reconhecido e a conta que reconheceu é  gravado. Você também pode adicionar notas que outros usuários possam ler.

Dependendo da sua organização, reconhecendo um alerta pode ter diferentes propósitos fora de cancelar mais notificações. Os efeitos mais comuns são para fornecer uma trilha de auditoria ou para evitar que várias pessoas trabalhem no mesmo problema.

Unacknowledge

O alerta deixa de ser reconhecido, continua enviando notificações e  volta a lista de alertas não reconhecidos.

Unmanage

Alertas criados para dispositivos que estão sob manutenção pode ser evitados,  basta mover o dispositivo para o estado Unmanage .

Capturar

Continue acompanhando nossa série de posts e se torne um expert na monitoração de redes!

Gostaria de mais informações sobre nossas ferramentas como o OpManager , ou tem alguma dúvida? Entre em contato conosco a equipe ACSoftware.
Fone (11) 4063 1007 – Vendas (11) 4063 9639

Sem Respostas

Deixe um comentário