Как игнорировать определенную ошибку SMART

Question 1

вам нужно изменить конфигурацию /etc/smartd.conf

добавьте аргументы к вашей настройке:

-t -I 197

Игнорирует атрибут 197 — Ожидающие сектора

как это (пример):

/dev/ad0 -H -l error -l selftest -t -I 197

Answer

вам нужно изменить конфигурацию /etc/smartd.conf

добавьте аргументы к вашей настройке:

-t -I 197

Игнорирует атрибут 197 — Ожидающие сектора

как это (пример):

/dev/ad0 -H -l error -l selftest -t -I 197

Question 2

Самый простой способ остановить сообщение без замены диска — заставить диск либо пометить сектора как хорошие, либо плохие вместо «возможно, возможно плохие», что и означает «ожидание». Вы можете сделать это, принудительно выполнив полное чтение диска:

sudo dd if=/dev/sdb of=/dev/null bs=64K conv=noerror

Это позволит прочитать каждый сектор диска и проигнорировать ошибки, заставив диск повторно проверить каждый ожидающий сектор и сообщить, действительно ли сектора плохие или нет.

Обратите внимание, что хотя это очистит текущие 11 ожидающих секторов, это можетобнаружить новые потенциально плохие секторав процессе (что приводит к ненулевому количеству ожидающих секторов). Запустите это снова, пока не останется больше ожидающих секторов.

Answer

Самый простой способ остановить сообщение без замены диска — заставить диск либо пометить сектора как хорошие, либо плохие вместо «возможно, возможно плохие», что и означает «ожидание». Вы можете сделать это, принудительно выполнив полное чтение диска:

sudo dd if=/dev/sdb of=/dev/null bs=64K conv=noerror

Это позволит прочитать каждый сектор диска и проигнорировать ошибки, заставив диск повторно проверить каждый ожидающий сектор и сообщить, действительно ли сектора плохие или нет.

Обратите внимание, что хотя это очистит текущие 11 ожидающих секторов, это можетобнаружить новые потенциально плохие секторав процессе (что приводит к ненулевому количеству ожидающих секторов). Запустите это снова, пока не останется больше ожидающих секторов.

Question 3

Хм... Я не знаю, как можно перенастроить smartd, но я знаю, что можно заставить OMD[1] игнорировать некоторые ошибки SMART (я однажды сделал это со стабилизированным перераспределенным счетчиком секторов). Возможно, это также вариант для вас, если вы хотите отслеживать больше параметров вашего ящика, чем просто показания SMART.

Answer

Хм... Я не знаю, как можно перенастроить smartd, но я знаю, что можно заставить OMD[1] игнорировать некоторые ошибки SMART (я однажды сделал это со стабилизированным перераспределенным счетчиком секторов). Возможно, это также вариант для вас, если вы хотите отслеживать больше параметров вашего ящика, чем просто показания SMART.

Question 4

Известно, что некоторые диски возвращают эту ошибку ошибочно, например, SSD-накопители Crucial серии MX500. Одним из решений является настройка пользовательского файла базы данных диска, /etc/smart_drivedb.hсодержащего следующее (мне пришлось отредактировать его, чтобы он соответствовал номеру моей прошивки):

  { "Crucial/Micron MX500 SSDs",
    "CT(250|500|1000|2000)MX500SSD[14]", // tested with CT500MX500SSD1/M3CR023
    "M3CR032", // Firmware with bogus attribute 197
    "This firmware returns bogus raw values in attribute 197",
  //"-v 1,raw48,Raw_Read_Error_Rate "
    "-v 5,raw48,Reallocate_NAND_Blk_Cnt "
  //"-v 9,raw24(raw8),Power_On_Hours "
  //"-v 12,raw48,Power_Cycle_Count "
    "-v 171,raw48,Program_Fail_Count "
    "-v 172,raw48,Erase_Fail_Count "
    "-v 173,raw48,Ave_Block-Erase_Count "
    "-v 174,raw48,Unexpect_Power_Loss_Ct "
    "-v 180,raw48,Unused_Reserve_NAND_Blk "
    "-v 183,raw48,SATA_Interfac_Downshift "
    "-v 184,raw48,Error_Correction_Count "
  //"-v 187,raw48,Reported_Uncorrect "
  //"-v 194,tempminmax,Temperature_Celsius "
  //"-v 196,raw16(raw16),Reallocated_Event_Count "
    "-v 197,raw48,Bogus_Current_Pend_Sect " // Randomly flips 0 <> 1
  //"-v 198,raw48,Offline_Uncorrectable "
  //"-v 199,raw48,UDMA_CRC_Error_Count "
    "-v 202,raw48,Percent_Lifetime_Remain "
    "-v 206,raw48,Write_Error_Rate "
    "-v 210,raw48,Success_RAIN_Recov_Cnt "
    "-v 246,raw48,Total_LBAs_Written "
    "-v 247,raw48,Host_Program_Page_Count "
    "-v 248,raw48,FTL_Program_Page_Count"
  }

После создания файла запустите service smartd restartобновление службы smartd. Затем вы увидите, grep smartd /var/log/syslogчто она включена для диска.

Источник:Билет в службу поддержки Smartmontools

Answer

Известно, что некоторые диски возвращают эту ошибку ошибочно, например, SSD-накопители Crucial серии MX500. Одним из решений является настройка пользовательского файла базы данных диска, /etc/smart_drivedb.hсодержащего следующее (мне пришлось отредактировать его, чтобы он соответствовал номеру моей прошивки):

  { "Crucial/Micron MX500 SSDs",
    "CT(250|500|1000|2000)MX500SSD[14]", // tested with CT500MX500SSD1/M3CR023
    "M3CR032", // Firmware with bogus attribute 197
    "This firmware returns bogus raw values in attribute 197",
  //"-v 1,raw48,Raw_Read_Error_Rate "
    "-v 5,raw48,Reallocate_NAND_Blk_Cnt "
  //"-v 9,raw24(raw8),Power_On_Hours "
  //"-v 12,raw48,Power_Cycle_Count "
    "-v 171,raw48,Program_Fail_Count "
    "-v 172,raw48,Erase_Fail_Count "
    "-v 173,raw48,Ave_Block-Erase_Count "
    "-v 174,raw48,Unexpect_Power_Loss_Ct "
    "-v 180,raw48,Unused_Reserve_NAND_Blk "
    "-v 183,raw48,SATA_Interfac_Downshift "
    "-v 184,raw48,Error_Correction_Count "
  //"-v 187,raw48,Reported_Uncorrect "
  //"-v 194,tempminmax,Temperature_Celsius "
  //"-v 196,raw16(raw16),Reallocated_Event_Count "
    "-v 197,raw48,Bogus_Current_Pend_Sect " // Randomly flips 0 <> 1
  //"-v 198,raw48,Offline_Uncorrectable "
  //"-v 199,raw48,UDMA_CRC_Error_Count "
    "-v 202,raw48,Percent_Lifetime_Remain "
    "-v 206,raw48,Write_Error_Rate "
    "-v 210,raw48,Success_RAIN_Recov_Cnt "
    "-v 246,raw48,Total_LBAs_Written "
    "-v 247,raw48,Host_Program_Page_Count "
    "-v 248,raw48,FTL_Program_Page_Count"
  }

После создания файла запустите service smartd restartобновление службы smartd. Затем вы увидите, grep smartd /var/log/syslogчто она включена для диска.

Источник:Билет в службу поддержки Smartmontools

Как игнорировать определенную ошибку SMART

решение1

решение2

решение3

решение4

Связанный контент