
HP サーバー (DL360-G7) があり、その上で Centos7 + cPanel を実行しています。/var/log/message に次のエラーが表示されます:
EDAC MC0: 5450 CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0
サーバーの RAM とメモリ スロットを変更しましたが、まだエラーが存在します:
EDAC MC0: 25509 CE error on CPU#0Channel#0_DIMM#0 (channel:0 slot:0
このコマンドを実行すると:
grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count
次の出力が表示されます:
/sys/devices/system/edac/mc/mc0/csrow0/ch0_ce_count:5067071
/sys/devices/system/edac/mc/mc1/csrow0/ch0_ce_count:0
ILO パネルにエラーはありません。
どうしたの?
答え1
上記のログから、エラーは修正可能なエラーであることがわかります。(チャネル:1 スロット:0 およびチャネル:0 スロット:0) は、2 つのチャネルに問題がある (修正可能な問題) ことを意味します。チャネルはメモリ コントローラ チャネルであり、DIMM のグループとの通信を担当します。各チャネルには独自の独立した制御 (コマンド) およびデータ バスがあり、独立して使用することも、他のチャネルとグループ化することもできます。このページを確認してください。https://www.kernel.org/doc/html/latest/driver-api/edac.html?highlight=edac#edac サブシステムで使用されるメインコンセプトカウントが高すぎる場合は、DIMM を交換して、マザーボードのハードウェア エラーをチェックすることをお勧めします。DIMM の問題ではなく、ボード自体に問題がある場合もあります。CE エラーの数が少ない場合は無視できます。