Status do FreeBSD VMware e CAM: Erro de status SCSI

Status do FreeBSD VMware e CAM: Erro de status SCSI

Estou executando um FreeBSD 10.1-RELEASE-p19 em um VPS (VMware).

Meu ISP está passando por um rápido crescimento de dados, e essas mensagens espontâneas começaram a aparecer em nossos logs há uma semana.

Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): SCSI status: Busy
Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): Retrying command
Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): WRITE(10). CDB: 2a 00 03 f9 6c 22 00 00 40 00
Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): CAM status: SCSI Status Error

Às vezes, o servidor perde totalmente o contato com o armazenamento e entra em pânico e reinicia. Isso geralmente ocorre a cada hora par, provavelmente por um trabalho de rotina (migração/backup).

Até que meu ISP adicione mais sistema de armazenamento, o que diminuirá a carga no armazenamento, eu realmente quero tentar fazer alguma coisa.

Eu encontrei isso, mas não tenho certeza de como corrigir/usar as informações: https://svnweb.freebsd.org/base?view=revision&revision=278111

Também encontrei isso ( vfs.unmapped_buf_allowed=0), mas não tenho certeza se isso pode estar relacionado. https://www.freebsd.org/releases/10.1R/errata.html#open-issues

camcontrol tags da0 -v

(pass1:mpt0:0:0:0): dev_openings  127
(pass1:mpt0:0:0:0): dev_active    0
(pass1:mpt0:0:0:0): devq_openings 127
(pass1:mpt0:0:0:0): devq_queued   0
(pass1:mpt0:0:0:0): held          -1
(pass1:mpt0:0:0:0): mintags       2
(pass1:mpt0:0:0:0): maxtags       255

gstatinformações quando ocorrem erros: insira a descrição da imagem aqui

Quaisquer pensamentos, sugestões, ideias seriam realmente muito apreciadas.

Obrigado!

Responder1

Se você estiver usando VMWare, portanto o mpt(4) é puramente virtual, sugiro alterá-lo para algo mais simples, como ICH10.

Caso contrário, sugiro que você brinque camcontrol tags, aumentando ou diminuindo o comprimento da fila.

Se você optar por reprovisionar discos usando outro driver, observe que a alteração do controlador SAS -> SATA pode resultar em alteração de nomenclatura do dispositivo, provavelmente /dev/daXse tornará /dev/adaX, portanto, a menos que você esteja usando zfs ou montando seus discos por meio de rótulos de disco, você terá que editar /etc/fstab.

Quanto à sua gstatsaída - há claramente algo errado com ela, provavelmente devido à natureza do suporte ao ambiente virtual no FreeBSD. 600% de carga é um absurdo. Eu sugiro que você relate isso no Bugzilla do FreeBSD.

PS O conselho para alterar o tipo de controlador de provisionamento de disco ainda permanece. PPS Ou. Ou eu tentaria aumentar o comprimento da fila do mpt(4) para 128 ou até 64.

informação relacionada