smartd は本当にこのドライブが熱すぎると報告しているのでしょうか?

smartd は本当にこのドライブが熱すぎると報告しているのでしょうか?

「SMART 使用属性: 194 Temperature_Celsius が 146 から 150 に変更されました」。これは CentOS 6.6 上です。

これは一体何を意味しているのでしょうか? ドライブは本当に熱いのでしょうか、それともソフトウェアのバグでしょうか? ドライブは eSATA 2TB ドライブで、触ると冷たく感じます。また、地下にあるサーバーは華氏 70 度です。

# smartctl -A /dev/sdb
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   134   134   054    Pre-fail  Offline      -       89
  3 Spin_Up_Time            0x0007   123   123   024    Pre-fail  Always       -       507 (Average 505)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       89
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   135   135   020    Pre-fail  Offline      -       26
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       29541
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       71
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       205
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       205
**194 Temperature_Celsius     0x0002   150   150   000    Old_age   Always       -       40 (Min/Max 20/49)**
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       9

答え1

これは単なる SMART 属性値です。通常の単位での温度ではありません。(ドライブによって何が熱いかそうでないかは異なりますが、255 (非常に寒い) から 0 (非常に暑い) の間の数値に近いです)

ドライブの温度を確認したい場合はsmartctl -A /dev/sdx

次のような表が表示されます。

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   107   097   000    Old_age   Always       -       45

RAW_VALUEあなたが探しているのはこれです...(私のドライブは45°Cとかなり熱くなります)

VALUEは属性値であり、これが下回るとTHRESH、ドライブは交換を要求する準備が整います。(温度のように、すべての属性にしきい値があるわけではありません)

何がホットで何がそうでないかに関しては、それは本当にドライブ次第です。ドライブの故障率に関するGoogleのレポートによると、40°C前後のドライブの故障率は最も低い(少なくともGoogleと2007年では)とのことです。別の論文(今は見つからない)では、高温はハードドライブにとって問題ではないと書かれていたのを覚えています。急激で頻繁な温度変化はディスクの故障を早める可能性があります。したがって、ドライブの温度がかなり安定している限り(次のようなものを使用して監視できます)、ムニン)であれば、問題ないはずです。

smartd属性の変更を報告しています。何か問題があるという意味ではありません。

関連情報