Все очень просто: в этом сервере в качестве основного диска используется SSD, а в качестве хранилища — RAID-массив (mdadm).
Время от времени возникают проблемы с записью в массив: скорость записи падает до такой степени, что его становится невозможно использовать.
Я только что закончил тестирование скорости, и копирование файла размером 1 ГБ с SSD на RAID-массив заняло почти час:
root@office:/tmp# rsync -vhr --progress test.img /mnt/raid/
sending incremental file list
test.img
1.07G 100% 301.99kB/s 0:57:52 (xfer#1, to-check=0/1)
sent 1.07G bytes received 31 bytes 309.25K bytes/sec
total size is 1.07G speedup is 1.0
RAID-массив, похоже, в порядке:
root@office:/tmp# cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sdb[0] sdd[3] sdc[1]
5860270080 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
unused devices: <none>
и syslog ничего не упоминает.
Куда еще мне следует обратиться для устранения этой неполадки?
P.S. Около месяца назад нам пришлось заменить коммутатор после грозы. Эта проблема началась примерно тогда же. Я не могу сказать, то ли это неисправная материнская плата, то ли контроллер, то ли что-то еще сломалось. Я бы предпочел найти неопровержимые доказательства, прежде чем советовать клиенту начать замену оборудования...
решение1
Оказалось, что была работа cron, выполняющая синхронизацию; каждые 60 секунд. Она производила так много зомби-процессов, что замедляла RAID-массив до минимума. Мораль истории: проверьте свои cron-задания.