
У меня есть FreeBSD с RAID, на котором запущено 3 жестких диска. Мне дали задание следить за его RAID - если жесткий диск выйдет из строя или возникнут какие-то проблемы, мне нужно знать.
Итак, первое, что я сейчас делаю, это пытаюсь понять, как работает SmartCTL... Команды, которые я использовал до сих пор, следующие:
smartctl --scan -j - To scan my devices and generated a JSON Structured list.
smartctl -i /dev/device_name - To list informations about a single device
smartctl -a /dev/your-device - More information like errors and etc (I think i can use this in some way to grep only errors sections...)
Есть ли еще какие-либо параметры SmartCTL, которые проверяют, доступны ли диски для записи, работоспособны ли они и имеют ли их состояние работоспособности?
Основная цель этого понимания — использовать в основном SmartCTL для генерации данных, которые будут использоваться в шаблоне pfSense RAID Monitoring с низкоуровневым обнаружением для программного обеспечения Zabbix Monitoring...
Любая помощь будет оценена по достоинству.
решение1
smartctl --isDiskOK /dev/sda
Хорошо, так вот, отвечая на этот вопрос, насколько мне известно, нет никакого подхода, который вы могли бы использовать.
Ближайший к этому smartctl может привести вас к отчету о количестве перераспределенных секторов. Я не буду объяснять подробно, но по сути, когда диски начинают выходить из строя, трудночитаемые/записываемые сектора будут перемещены в запасной сектор. Если происходит больше перераспределений, это означает, что диск близок к полной смерти.
- Zabbix может использовать следующий пользовательский параметр:
$ sudo cat /etc/zabbix/zabbix_agent2.d/userparameter_hdd.reallocated.sectors.conf
# get current HDD reallocated sectors count && needs sudoers
UserParameter=hdd.reallocated.sectors[*],sudo smartctl -a /dev/$1|grep Reallocated_Sector_Ct|awk '{print $$10}'
разрешить пользователю zabbix выполнять smartctl через sudoers:
$ sudo grep zabbix /etc/sudoers.d/*
/etc/sudoers.d/zabbix:zabbix ALL=NOPASSWD:/usr/sbin/hddtemp, /usr/sbin/smartctl, /usr/bin/fping
назначьте шаблон контролируемому узлу + перезапустите zabbix_agent для загрузки конфигурации — ваш элемент должен заполниться перераспределенным количеством секторов
Выгода.. :)
в любом случае шаблон zabbix также доступен на моем GitHubhttps://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf
наслаждаться.