O servidor trava durante o streaming de vídeo, suspeitando de falha de hardware

O servidor trava durante o streaming de vídeo, suspeitando de falha de hardware

A configuração é a seguinte:

Placa-mãe Core 2 Duo E6750 P5G41T-M (Intel 535 (sda) Seagate 888 GB (sdb)) IBM M1015 HBA (2-2 TB WD RED, 2-4 TB WD RED)

Outra noite, estava assistindo a um vídeo com o VLC através do Samba e ele congelou, rapidamente mudou para olhares (monitor de sistema baseado em ncurses) e me deu avisos de carga, acho que a carga estava acima de 2 por cerca de 5 minutos. Os arquivos de vídeo em questão estão localizados na unidade Seagate. Nunca aconteceu comigo antes, mas já aconteceu cerca de 5 vezes de forma aleatória. Verificar os registros só leva a mais perguntas.

Syslog.1

Então, cerca de meia hora depois, meu streaming de vídeo do samba congelou novamente, desta vez com erros de cpuiowait.

Syslog.2

Tentando descobrir o que são ata3.00 e 3.01 (devido a problemas de formatação neste site, vou apenas colar):

pastebin.com/HNVB4cja

Devo presumir que o ID exclusivo 3 (ata3) é host2, que é sda e sdb, ou estou fazendo errado? Se for uma falha de hardware, posso ver que é o Seagate, ele tem uma contagem de setores realocados muito alta e já faz algum tempo, mas o SSD da Intel é novo e não consigo ver essa porcaria já. Poderia ser um problema na placa-mãe, já que parece estar afetando apenas as unidades conectadas ao MB? Embora...

Saída do dmesg | grep em pastebin.com/bfheLQTB

Como esse parece ser um problema intermitente que eu nem teria notado se os vídeos transmitidos pelo samba não tivessem começado a congelar, não tenho certeza de qual é o problema. Se o erro estivesse vinculado diretamente a uma unidade, eu poderia identificá-lo, mas parece estar vinculado a duas unidades, levando-me a pensar na placa-mãe, alguém tem alguma idéia?

Responder1

Parece haver algum tipo de limite de recursos. que seu navegador alcançará. Acabei de fazer um top para obter o ID do processo do seu navegador e alterá-lo para -1. Depois que fiz isso, ele parou de travar. Se o seu PID era tipo 18737

sudo renice -n -1 -p 18737

Não tive tempo de descobrir como modificar os limites do usuário, mas tenho certeza de que é uma configuração fácil em algum lugar. caso contrário, você terá que fazer isso toda vez que reiniciar.

informação relacionada