Как получить статус жесткого диска из RAID с помощью SmartCTL для целей мониторинга?

Как получить статус жесткого диска из RAID с помощью SmartCTL для целей мониторинга?

У меня есть FreeBSD с RAID, на котором запущено 3 жестких диска. Мне дали задание следить за его RAID - если жесткий диск выйдет из строя или возникнут какие-то проблемы, мне нужно знать.

Итак, первое, что я сейчас делаю, это пытаюсь понять, как работает SmartCTL... Команды, которые я использовал до сих пор, следующие:

smartctl --scan -j - To scan my devices and generated a JSON Structured list.
smartctl -i /dev/device_name - To list informations about a single device
smartctl -a /dev/your-device - More information like errors and etc (I think i can use this in some way to grep only errors sections...)

Есть ли еще какие-либо параметры SmartCTL, которые проверяют, доступны ли диски для записи, работоспособны ли они и имеют ли их состояние работоспособности?

Основная цель этого понимания — использовать в основном SmartCTL для генерации данных, которые будут использоваться в шаблоне pfSense RAID Monitoring с низкоуровневым обнаружением для программного обеспечения Zabbix Monitoring...

Любая помощь будет оценена по достоинству.

решение1

smartctl --isDiskOK /dev/sdaХорошо, так вот, отвечая на этот вопрос, насколько мне известно, нет никакого подхода, который вы могли бы использовать.

Ближайший к этому smartctl может привести вас к отчету о количестве перераспределенных секторов. Я не буду объяснять подробно, но по сути, когда диски начинают выходить из строя, трудночитаемые/записываемые сектора будут перемещены в запасной сектор. Если происходит больше перераспределений, это означает, что диск близок к полной смерти.

  1. Zabbix может использовать следующий пользовательский параметр:
$ sudo cat /etc/zabbix/zabbix_agent2.d/userparameter_hdd.reallocated.sectors.conf
# get current HDD reallocated sectors count && needs sudoers
UserParameter=hdd.reallocated.sectors[*],sudo smartctl -a /dev/$1|grep Reallocated_Sector_Ct|awk '{print $$10}'
  1. создайте шаблон zabbix со следующим элементом: введите описание изображения здесь

  2. разрешить пользователю zabbix выполнять smartctl через sudoers:

$ sudo grep zabbix /etc/sudoers.d/*
/etc/sudoers.d/zabbix:zabbix  ALL=NOPASSWD:/usr/sbin/hddtemp, /usr/sbin/smartctl, /usr/bin/fping
  1. назначьте шаблон контролируемому узлу + перезапустите zabbix_agent для загрузки конфигурации — ваш элемент должен заполниться перераспределенным количеством секторов

  2. Выгода.. :)

в любом случае шаблон zabbix также доступен на моем GitHubhttps://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf

наслаждаться.

Связанный контент