
カーネル ログには、次の EDAC エラーのインスタンスが多数表示されます。
EDAC MC0: 1 CE ie31200 CE on unknown memory (csrow:3 channel:1 page:0x0 offset:0x0 grain:1 syndrome:0x1c)
問題は...csrow #3
私のシステムには存在しないことです (出力は見やすさを考慮して切り捨てられています):
$ ls -l /sys/devices/system/edac/mc/mc0
drwxr-xr-x 3 root root 0 May 19 10:53 csrow0
drwxr-xr-x 3 root root 0 May 19 10:53 csrow1
どうしてそうなるのでしょうか?実はメモリデバイスに障害がありますか? どれが障害なのかをどうやって特定できますか?
役立つ可能性のある詳細情報:
$ cat /sys/devices/system/edac/mc/mc0/ce_count
1069
$ cat /sys/devices/system/edac/mc/mc0/csrow?/ce_count
0
0
$ sudo edac-util -v
mc0: 0 Uncorrected Errors with no DIMM info
mc0: 0 Corrected Errors with no DIMM info
mc0: csrow0: 0 Uncorrected Errors
mc0: csrow0: mc#0csrow#0channel#0: 0 Corrected Errors
mc0: csrow0: mc#0csrow#0channel#1: 0 Corrected Errors
mc0: csrow1: 0 Uncorrected Errors
mc0: csrow1: mc#0csrow#1channel#0: 0 Corrected Errors
mc0: csrow1: mc#0csrow#1channel#1: 0 Corrected Errors
edac-util: No errors to report.
- OS: ArchLinux / 5.17.8-arch1-1 #1 SMP プリエンプト
- CPU: Xeon E-2124
- マザーボード: SuperMicro X11SCH-LN4F
ありがとう