
Tengo un FreeBSD con RAID con 3 discos duros. Me dieron el desafío de monitorear su RAID. Si un disco duro falla o presenta algún problema, necesito saberlo.
Entonces, lo primero que estoy haciendo ahora es tratar de entender cómo funciona SmartCTL... Los comandos que utilicé hasta ahora son:
smartctl --scan -j - To scan my devices and generated a JSON Structured list.
smartctl -i /dev/device_name - To list informations about a single device
smartctl -a /dev/your-device - More information like errors and etc (I think i can use this in some way to grep only errors sections...)
¿Existe algún otro parámetro de SmartCTL que verifique si los discos se pueden escribir, si están activos y si su estado de salud es correcto?
El objetivo principal de este entendimiento es utilizar principalmente SmartCTL para generar datos que se utilizarán en una plantilla de monitoreo RAID pfSense con descubrimiento de bajo nivel para el software de monitoreo Zabbix...
Cualquier ayuda se agradece.
Respuesta1
smartctl --isDiskOK /dev/sda
Bien, para responder: hasta donde yo sé, no hay ningún enfoque que puedas adoptar.
Lo más cercano a lo que smartctl puede llevarlo es el informe del recuento de sectores reasignados. No voy a explicarlo en detalle, pero esencialmente cuando los discos comienzan a fallar, los sectores difíciles de leer/escribir se reubicarán en un sector de repuesto. Si se producen más reasignaciones, significa que el impulso está más cerca de morir por completo.
- Zabbix puede aprovechar el siguiente parámetro de usuario:
$ sudo cat /etc/zabbix/zabbix_agent2.d/userparameter_hdd.reallocated.sectors.conf
# get current HDD reallocated sectors count && needs sudoers
UserParameter=hdd.reallocated.sectors[*],sudo smartctl -a /dev/$1|grep Reallocated_Sector_Ct|awk '{print $$10}'
permitir al usuario zabbix ejecutar smartctl mediante sudoers:
$ sudo grep zabbix /etc/sudoers.d/*
/etc/sudoers.d/zabbix:zabbix ALL=NOPASSWD:/usr/sbin/hddtemp, /usr/sbin/smartctl, /usr/bin/fping
asigne una plantilla al host monitoreado + reinicie zabbix_agent para cargar la configuración: su elemento debe completarse con el recuento de sectores reasignados
Ganancia.. :)
De todos modos, la plantilla zabbix también está disponible en mi GitHub.https://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf
disfrutar.