
私のシステム (16GB RAM、6 コア、RAID0 PCIe SSD) で大量のディスク IO を実行すると、システムが停止し、最終的にはクラッシュします。通常の日常的なディスク IO は問題ありませんが、データベースの再インデックスなどの長時間の読み取り/書き込みが問題となります。
調査の結果、次のような dmesg 出力が明らかになりました。
[...] ata2: exception Emask 0x10 SAct 0x0 SErr 0x90202 action 0xe frozen
[...] ata1: SError: { RecovComm Persist PHYRdyChg 10B8B }
[...] ata1: hard resetting link
[...] ata4: irq_stat 0x00400000, PHY RDY changed
また、システムに接続されたさまざまな SATA デバイスのログも大量に記録されます。ディスク IO が大量に発生すると、その他の入力 (マウスの移動など) によってシステムが 5 ~ 30 秒間停止します。
エラーが複数のデバイスで発生しており、他のデバイスからの入力を与えたり、ディスク以外の割り込みを引き起こしたりするとシステムが不安定になるので、マザーボードが原因だと想定します。温度は正常で、memcheck はパスします。クラッシュはカーネル クラッシュやスイッチオフではなく、完全なソフト ロックアップです。
これは妥当なことでしょうか? 他に確認できることはありますか?
編集: Fedora20、870A-UD3 ボード上のホーム サーバー、Intel 910 pcie SSD + OCZ vertex + Intel X25
編集2: ワークステーションはホームオフィスにあり、Postgresql でデータを処理しているような事務的な作業を行っています。すべて非常に退屈で、もう一度クローズ投票するほどの価値はありません。
答え1
これは、システム ボード、ケーブル、または電源装置の問題である可能性があります。SATA ドライブ、OCZ、および Intel X25 がマザーボードに接続されている場合は、これらが原因である可能性があります。Intel 910 が影響を受けているという兆候はありません。
答え2
不良な SATA ケーブル。このエラーは何度か発生しています。https://bbs.archlinux.org/viewtopic.php?id=129401