Diagnosticar por que o servidor caiu

Diagnosticar por que o servidor caiu

Eu tenho alguns aplicativos da web Asp.Net executando um VPS do Windows Server 2008 R2. Usamos este VPS há anos. Desde os últimos meses, nossos aplicativos ficaram inativos por 30 a 45 minutos. Isso não acontece periodicamente e não acontece na mesma hora do dia. Isso deve ter acontecido talvez 4 ou 5 vezes nos últimos 2 meses. Nossas análises não relatam um grande número de usuários online simultaneamente. Tivemos mais usuários online e não tivemos problemas.

Durante o tempo de inatividade, não podemos fazer RDP no VPS. O monitoramento de novas relíquias mostra zero atividade em qualquer frente. Depois que o VPS estiver online novamente, os aplicativos funcionarão normalmente. Mesmo depois que o VPS estiver online novamente, o nwe relic não mostra nenhuma nova entrada para esse período. O visualizador de eventos também não mostra entradas durante o período de inatividade. Temos as entradas habituais nos logs de Sistema/Segurança/Aplicativos, quase uma por minuto, até o início do tempo de inatividade. E a próxima entrada começa após o término do tempo de inatividade.

Parece quase que durante esse período nosso VPS foi adormecido. Verifiquei o visualizador de eventos em busca de eventos com IDs 6005.6008.6009.6013.1072.1074.1076. Li em vários posts na Internet que esses IDs de eventos podem ajudar a identificar desligamentos/reinicializações planejados/inesperados. Não encontrei nenhum para esse intervalo de tempo.

O que mais posso fazer para identificar por que isso está acontecendo e evitar que aconteça?

EDITAR

Esta instância de tempo de inatividade ocorreu devido à reinicialização do servidor físico pelo host. Em relação aos tempos de inatividade anteriores, o anfitrião afirma não ter estado envolvido. Vamos ver. No momento, estou marcando a postagem de @Greg como resposta aceita, pois isso era algo que eu não havia pensado em fazer até agora.

Responder1

O que mais você pode fazer? Habilite o monitoramento/pulsação do ASP.Net Heath em intervalos de um minuto. Se não houver pulsação, provavelmente algo externo ao Windows/IIS/ASP.Net.

Parece mais provável que seu provedor de serviços tenha causado a interrupção do que um defeito no sistema operacional, o que provavelmente teria impacto zero se você usasse vários servidores em vários hosts/redes.

Se você não tiver nenhuma métrica, medição ou acordo de disponibilidade, não terá muita sorte ao tentar fazer engenharia reversa de uma resposta, fazendo com que o sistema operacional do cliente resolva problemas dos hosts ou da rede do provedor VPS.

Infelizmente, mover aplicativos para a “nuvem” não pode consertar arquiteturas quebradas ou disfuncionais ou habilidades de contratação.

Responder2

Entre em contato com seu provedor de vps. Pode ser falha de hardware, problema de rede ou qualquer outra coisa. A perda de conectividade remota sugere que o problema está fora do seu aplicativo e provavelmente fora do sistema operacional. Seu fornecedor deve ser capaz de ajudá-lo a diagnosticar os problemas.... Caso contrário, acho que você ainda terá uma resposta sobre o que fazer com seus problemas de confiabilidade.

informação relacionada