Proliant ML310e Gen8 スマートアレイの SSD の障害予測問題

Proliant ML310e Gen8 スマートアレイの SSD の障害予測問題

これはこれに関連した質問です:

ProLiant Gen8 サーバーのサードパーティ SSD ソリューション

ただし、質問や回答ではカバーされていません。

私は Proliant ML310e Gen8 サーバーのシステム ドライブとして OCZ 120 GB SSD を SATA ポート 6 に接続しています。そのポート (マザーボード上) を SSD 用に使用するには、SATA コントローラーを SMART Array コントローラーに設定する必要があります。これにより、HDD ドライブの RAID セット用に 4 つのベイすべてが使用可能になります。

これまでのところ順調です。システム ドライブに Win Server 2008 R2 もインストールしましたが、すべて正常に動作しています。

しかし、SMART アレイをチェックすると、「ドライブ 0 (SSD) の障害が予測されます」と表示されます。SSD の実際の SMART 設定をチェックして検証したところ、ドライブは 100% OK でした。新品で、OCZ サポートによって SMART 設定が 100% OK であることが検証されています。

HP 診断側でこのエラーをクリアすることはできません。OCZ の提案に従って、HP で SMART 診断をオフにする方法を見つけようとしましたが、うまくいきませんでした。

それで、OCZ SSD SMART データの HP SMART Array (不正確) 診断読み取りをクリアするにはどうしたらよいですか。あるいは、SSD からの HP による SMART 統計の読み取りをオフにするにはどうしたらよいですか。

これは、HP ブランドの SSD に 1,000 ドル以上を費やしたくないという私の責任だとわかっていますが、OCZ の SSD は完全に正常に動作しています。OCZ バージョンの SMART は、SSD ドライブの統計情報に関する HP の SMART の考え方と同じではなく、黄色の点滅する「システム劣化」のフロント パネル ライトには本当にうんざりしています。

はい、すでに「黒い絶縁テープを貼ってください」と言われました。:-)

しかし、私はもっと良い解決策を見つけたいと思っています。この SMART は準普遍的なものになるはずでした。

答え1

私は、内蔵の b120i ポート 5/6 (アレイ/JBOD なし - コントローラーを使用してポート 6 を起動可能にするだけ) で SATA SSD を搭載した ML310e Gen8 v2 を実行しており、再起動時に SSD ドライブが故障と表示されるのを防ぐ解決策を見つけました。これは Linux/ZFS を実行しているホームラボですが、実稼働でも間違いなく使用します。

  1. Smart Storage Administrator (SSA) を開きます - コントローラーが検出されたら、POST で F5 を使用してこれを実行しました。Intelligent Provisioning (F10) から実行することもできます。

  2. 「コントローラー設定の変更」に進み、「表面スキャン分析の優先順位」を無効にします。これにより、コントローラーが SSD の表面スキャンを試行しなくなり、SSD が失敗としてマークされなくなります。

  3. 起動時に失敗して無効にされることなく、サードパーティの SATA SSD をお楽しみいただけます。

HP Smart Storage Administrator ユーザー ガイドに解決のヒントがありました。SSD が故障とマークされる問題は、surfacescanmode が原因であるようです。このマニュアルには、SSA にアクセスする他の方法が示されています。また、他のドライブでこれを使用したい場合は、ssacli ツール (シリアル/iLo 経由も可能でしょうか?) を使用して、スロットごとに facescanmode をオフにできると思います (ただし、アレイ コントローラーの機能をまったく使用していないため、これを試していません...代わりにスマート モニタリングを使用してください)

SSA ユーザー ガイドによると、この設定は Gen9 でも機能するはずです。また、Gen6、Gen7 (ダウンロード イメージを通じて SSA にアクセス) でも機能します。Gen5 は ssacli をサポートしているため、機能すると思われます。

答え2

しかしOCZ SSDない正常に動作しています... おそらくコントローラーに温度が正しく報告されていないのでしょう。

あなたのHP ProLiant ML310eGen8サーバーには「ダイナミック」が組み込まれているスマートアレイ B120i コントローラマザーボード上にあります。これは「ソフトレイド」デバイスです。これはサーバー内の唯一のディスクですか?質問からはわかりません。そうでない場合、他のディスクは接続されていますか?

この設定には多くの制限があるため、何を説明すればよいかわかりません。

  • これはソフトウェア支援 RAID コントローラです。
  • 6 つのポートのうち 6Gbps なのは 2 つだけです。だからこそ、サーバーの内部に他に何があるか尋ねているのです。
  • SATA デバイスのみをサポートします。
  • 多くの場合、RAID 機能を無効にする必要があります。
  • キャッシュはありません。

特定の問題はOCZドライブだけである可能性があります(いずれにせよ彼らは破産している)。可能であれば、別の SSD を試してください。

編集:

このサーバーでは非 RAID SSD の使用をスキップし、(4 つの?) 内部ディスク ベイだけに頼ります。

HP ProLiantの世界では、複数の論理ドライブ物理アレイ上でディスクのグループを作成します。アレイ構成ユーティリティOS用に120GBの論理ドライブを用意し、残りのスペースをデータ用に割り当てる。Smart Array B120iは8つの論理ドライブをサポートしているので、これが最もスムーズな処理方法です...ただし、必要SSD ですが、このサーバーでは必要ないようです。

関連情報