如何檢查 smartd 和 mdadm 是否正常運作?

如何檢查 smartd 和 mdadm 是否正常運作?

我在 debian 上有一個 raid 系統:

Disk /dev/sda: 320.1 GB,...
   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1        2432    19535008+  fd  Linux raid autodetect
/dev/sda2            2433        2918     3903795   fd  Linux raid autodetect
/dev/sda3            2919       38913   289129837+  fd  Linux raid autodetect

Disk /dev/sdb: 320.1 GB, ...
   Device Boot      Start         End      Blocks   Id  System
/dev/sdb1   *           1        2432    19535008+  fd  Linux raid autodetect
/dev/sdb2            2433        2918     3903795   fd  Linux raid autodetect
/dev/sdb3            2919       38913   289129837+  fd  Linux raid autodetect

# df -h 
/dev/md0               19G   12G  6,0G  66% /      type ext3 (rw)
/dev/md2              272G  245G   25G  91% /var   type ext3 (rw)

我想檢查一切是否運行正常並進行配置,因此如果發生任何錯誤我會收到一封電子郵件。


我的唯一一行/etc/smartd.conf是:

DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner

會掃描那 2 個 raid 設備嗎?

在我的中/etc/cron.d/mdadm有這樣一行:
57 0 * * 0 root if [ -x /usr/share/mdadm/checkarray ] && [ $(date +\%d) -le 7 ]; then /usr/share/mdadm/checkarray --cron --all --idle --quiet; fi

其中/usr/share/mdadm/checkarray說:它啟動對 MD 陣列冗餘資訊的檢查運行

答案1

如果您想監控硬碟的可靠性,請安裝smartmontools軟體包,該軟體包提供實用程式來檢查硬碟的磁碟效能下降和故障,使用大多數現代ATA 和SCSI 硬碟中內建的自我監控、分析和報告技術系統( SMART)。

該軟體包包含smartctl可用於從命令列檢查硬碟的工具和smartd守護程序,該守護程序以指定的時間間隔檢查硬碟並將警告/錯誤記錄到系統日誌中,還可以將警告和錯誤發送到指定的電子郵件地址。

若要啟用守護程序,您必須取消start_smart文件中該行的註解/etc/default/smartmontools。然後,您必須在檔案中定義/etc/smartd.conf要監視哪些硬碟並啟動服務smartmontools(檢查聰明人man smartd.conf有關詳細說明,此外,此文件中有很多範例):

/dev/sda  -m [email protected] -M exec /usr/share/smartmontools/smartd-runner
/dev/sdb  -m [email protected] -M exec /usr/share/smartmontools/smartd-runner

您可以使用mdadm工具監控您的 md 設備。如果您想接收帶有警報的電子郵件,請在文件中定義郵件收件人/etc/mdadm.conf(詳細資訊請參見手動 mdadm.conf男人mdadm):

MAILADDR [email protected]

然後,透過 cron 此命令安排時間(安排時間由您決定):

mdadm --monitor --scan -1

相關內容