¿Cómo obtener el estado del disco duro desde RAID con SmartCTL para fines de monitoreo?

¿Cómo obtener el estado del disco duro desde RAID con SmartCTL para fines de monitoreo?

Tengo un FreeBSD con RAID con 3 discos duros. Me dieron el desafío de monitorear su RAID. Si un disco duro falla o presenta algún problema, necesito saberlo.

Entonces, lo primero que estoy haciendo ahora es tratar de entender cómo funciona SmartCTL... Los comandos que utilicé hasta ahora son:

smartctl --scan -j - To scan my devices and generated a JSON Structured list.
smartctl -i /dev/device_name - To list informations about a single device
smartctl -a /dev/your-device - More information like errors and etc (I think i can use this in some way to grep only errors sections...)

¿Existe algún otro parámetro de SmartCTL que verifique si los discos se pueden escribir, si están activos y si su estado de salud es correcto?

El objetivo principal de este entendimiento es utilizar principalmente SmartCTL para generar datos que se utilizarán en una plantilla de monitoreo RAID pfSense con descubrimiento de bajo nivel para el software de monitoreo Zabbix...

Cualquier ayuda se agradece.

Respuesta1

smartctl --isDiskOK /dev/sdaBien, para responder: hasta donde yo sé, no hay ningún enfoque que puedas adoptar.

Lo más cercano a lo que smartctl puede llevarlo es el informe del recuento de sectores reasignados. No voy a explicarlo en detalle, pero esencialmente cuando los discos comienzan a fallar, los sectores difíciles de leer/escribir se reubicarán en un sector de repuesto. Si se producen más reasignaciones, significa que el impulso está más cerca de morir por completo.

  1. Zabbix puede aprovechar el siguiente parámetro de usuario:
$ sudo cat /etc/zabbix/zabbix_agent2.d/userparameter_hdd.reallocated.sectors.conf
# get current HDD reallocated sectors count && needs sudoers
UserParameter=hdd.reallocated.sectors[*],sudo smartctl -a /dev/$1|grep Reallocated_Sector_Ct|awk '{print $$10}'
  1. cree la plantilla zabbix con el siguiente elemento: ingrese la descripción de la imagen aquí

  2. permitir al usuario zabbix ejecutar smartctl mediante sudoers:

$ sudo grep zabbix /etc/sudoers.d/*
/etc/sudoers.d/zabbix:zabbix  ALL=NOPASSWD:/usr/sbin/hddtemp, /usr/sbin/smartctl, /usr/bin/fping
  1. asigne una plantilla al host monitoreado + reinicie zabbix_agent para cargar la configuración: su elemento debe completarse con el recuento de sectores reasignados

  2. Ganancia.. :)

De todos modos, la plantilla zabbix también está disponible en mi GitHub.https://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf

disfrutar.

información relacionada