
Eu tenho um servidor Linux que começou a agir de forma um pouco estranha ...
Em primeiro lugar, a caixa está muito subutilizada. É um servidor de banco de dados, com carga muito baixa. Vou colocar o vmstat abaixo e no topo...
- Estou executando o centos 5.4
- Este servidor está funcionando bem há semanas
- Está protegido por firewall, é improvável que tenha sido hackeado (o chkrootkit concorda).
- A carga é muito baixa.
- Estou em um switch Gigabit com o servidor.
- Não estou tendo esse problema com nenhum outro servidor.
- Tenho o syslog remoto configurado em outra caixa e não indica nenhum erro correspondente.
Então, quando eu ssh(putty) para a caixa, se eu não fizer isso há algum tempo, o putty imediatamente gera um erro de 'redefinição de conexão de rede'.
Aleatoriamente, isso simplesmente me expulsa (ou a rede cai)
um fluxo constante de pings mostra agora interrupção.
--- vdbsrv1 ping statistics ---
80620 packets transmitted, 80619 received, 0% packet loss, time 23838ms
rtt min/avg/max/mdev = 0.234/0.273/1.741/0.043 ms, ipg/ewma 0.295/0.297 ms
As consultas SQL ("Selecione 1") na caixa levam cerca de 5 segundos, embora o SQL esteja relatando algo como um tempo de execução de 0,04 segundo, então os outros 4,96 segundos são um mistério
Alguém tem alguma ideia?
top - 11:49:28 up 12 days, 17:05, 4 users, load average: 0.00, 0.03, 0.01
Tasks: 150 total, 1 running, 149 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.2%us, 0.0%sy, 0.0%ni, 99.3%id, 0.5%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 8174028k total, 8074924k used, 99104k free, 4558300k buffers
Swap: 19464184k total, 4k used, 19464180k free, 2306952k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1 root 15 0 10348 692 576 S 0.0 0.0 0:02.13 init
root@dbsrv1# vmstat
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 4 98980 4558300 2306992 0 0 1 13 3 2 0 0 99 0 0
Responder1
Você precisa fazer pelo menos algumas coisas para depurar isso:
Usando um cliente CLI ssh em vez de putty, execute um 'ssh -v' no servidor. Veja se você tem algum problema e quais erros a sessão ssh reporta.
Usando wireshark ou tcpdump, obtenha uma captura de pacotes da sessão. Você provavelmente está recebendo um RST.
Pela consulta de David, você tentou acessar o servidor de outro cliente? Caso contrário, talvez o cliente esteja tendo um problema de rede.
Se você estiver passando pelo firewall, o firewall terá seus próprios tempos limite de sessão, como Kyle sugeriu acima - a configuração 'keepalive' é uma boa solução alternativa para isso, se for o problema. Se o problema ocorrer com novas sessões, um pcap será a maneira mais conveniente de solucionar o problema.
Responder2
Não tenho certeza se entendi totalmente:
"Então, quando eu ssh (putty) na caixa, se eu não fizer isso há algum tempo, o putty imediatamente gera um erro de 'redefinição de conexão de rede'."
Então, se você não estiver logado e iniciar um novo login, será expulso imediatamente?
Se não for esse o caso, o tempo limite expirará se você estiver inativo. Você poderia simplesmente definir o keepalive no PuTTY.
Você também pode procurar /var/log
os logs ssh e ver se há alguma informação lá.
Responder3
Esse foi estranho...
O servidor web era um clone de outro servidor web do servidor VMware.
O original foi encerrado. Copiado para o novo servidor. Nova máquina trazida com novo nome dado novo IP Máquina antiga trazida de volta.
O problema neste cenário é que o endereço MAC era o mesmo em ambos, o que resultava em um comportamento de rede muito estranho.