NFS と GFS2 のパフォーマンスが遅い

Question 1

私が提供できるのは、一般的な指針だけです。

まず、いくつかの簡単なベンチマークメトリックを稼働させます。そうすれば、少なくとも、行った変更が最善のものかどうかがわかります。

ムニン
サボテン
ナギオス

いくつか良い選択肢があります。

これらのノードは仮想サーバーですか、それとも物理サーバーですか、その仕様は何ですか。

各ノード間のネットワーク接続の種類は何か

NFS はホスティングプロバイダーのプライベートネットワーク上でセットアップされていますか。

ファイアウォールでパケット/ポートを制限していませんか? ホスティングプロバイダーはこれを行っていますか?

Answer

私が提供できるのは、一般的な指針だけです。

まず、いくつかの簡単なベンチマークメトリックを稼働させます。そうすれば、少なくとも、行った変更が最善のものかどうかがわかります。

ムニン
サボテン
ナギオス

いくつか良い選択肢があります。

これらのノードは仮想サーバーですか、それとも物理サーバーですか、その仕様は何ですか。

各ノード間のネットワーク接続の種類は何か

NFS はホスティングプロバイダーのプライベートネットワーク上でセットアップされていますか。

ファイアウォールでパケット/ポートを制限していませんか? ホスティングプロバイダーはこれを行っていますか?

Question 2

2 つの問題があると思います。そもそもボトルネックが問題を引き起こしており、さらに重要なのは、GFS による障害処理が不十分であることです。GFS は、正常に動作するまで転送速度を低下させる必要がありますが、それについては私がサポートすることはできません。

クラスターは NFS に約 200 GB の新しいファイルを処理するとのことですが、クラスターから読み取られるデータの量はどれくらいですか?

フロントエンドとバックエンドに 1 つのネットワーク接続しかないと、フロントエンドがバックエンドを「直接」破壊する (データ接続に過負荷をかける) 可能性があるため、常に不安を感じます。

各ボックスに iperf をインストールすると、任意の時点で利用可能なネットワークスループットをテストできます。これは、ネットワークのボトルネックがあるかどうかを素早く特定する方法です。

ネットワークはどの程度使用されていますか? ストレージサーバーのディスクの速度はどのくらいですか? また、どのような RAID 設定を使用していますか? スループットはどのくらいですか? *nix を実行していて、テストする時間がない場合は、hdparm を使用できます。

$ hdpard -tT /dev/<device>

ネットワークの使用率が高い場合は、GFS をセカンダリの専用ネットワーク接続に配置することをお勧めします。

12 台のディスクをどのように RAID したかによって、パフォーマンスのレベルが異なり、これが 2 番目のボトルネックになる可能性があります。また、ハードウェア RAID を使用しているか、ソフトウェア RAID を使用しているかによっても異なります。

要求されたデータがメモリ全体よりも広い範囲に分散している場合、マシンに搭載されている大量のメモリはほとんど役に立たない可能性があります。その可能性は高いようです。また、メモリは読み取りにのみ役立ちますが、読み取りの多くが同じファイルに対するものである場合がほとんどです (そうでない場合、キャッシュから追い出されます)。

top / htop を実行するときは、iowait を監視します。ここで高い値が表示される場合、CPU が何か (ネットワーク、ディスクなど) を待機しているだけの優れた指標となります。

私の意見では、NFSが原因である可能性は低いです。私たちはNFSについてかなり広範な経験を持っていますが、NFSは調整/最適化できますが、傾向があるかなり確実に動作します。

GFS コンポーネントを安定させてから、NFS の問題が解決するかどうかを確認したいと思います。

最後に、OCFS2 は GFS の代替として検討できるオプションかもしれません。分散ファイルシステムについて調査していたときに、かなりの量の調査を行いましたが、OCFS2 を試すことにした理由は思い出せません。しかし、試してみました。おそらく、OCFS2 が Oracle のデータベースバックエンドに使用されており、非常に高い安定性が求められることと関係があるのでしょう。

Muninはあなたの友達です。しかし、もっと重要なのはtop / htopです。vmstatはいくつかの重要な数値も提供します。

$ vmstat 1

システムが何に時間を費やしているかについて、毎秒更新情報が得られます。

幸運を！

Answer

2 つの問題があると思います。そもそもボトルネックが問題を引き起こしており、さらに重要なのは、GFS による障害処理が不十分であることです。GFS は、正常に動作するまで転送速度を低下させる必要がありますが、それについては私がサポートすることはできません。

クラスターは NFS に約 200 GB の新しいファイルを処理するとのことですが、クラスターから読み取られるデータの量はどれくらいですか?

フロントエンドとバックエンドに 1 つのネットワーク接続しかないと、フロントエンドがバックエンドを「直接」破壊する (データ接続に過負荷をかける) 可能性があるため、常に不安を感じます。

各ボックスに iperf をインストールすると、任意の時点で利用可能なネットワークスループットをテストできます。これは、ネットワークのボトルネックがあるかどうかを素早く特定する方法です。

ネットワークはどの程度使用されていますか? ストレージサーバーのディスクの速度はどのくらいですか? また、どのような RAID 設定を使用していますか? スループットはどのくらいですか? *nix を実行していて、テストする時間がない場合は、hdparm を使用できます。

$ hdpard -tT /dev/<device>

ネットワークの使用率が高い場合は、GFS をセカンダリの専用ネットワーク接続に配置することをお勧めします。

12 台のディスクをどのように RAID したかによって、パフォーマンスのレベルが異なり、これが 2 番目のボトルネックになる可能性があります。また、ハードウェア RAID を使用しているか、ソフトウェア RAID を使用しているかによっても異なります。

要求されたデータがメモリ全体よりも広い範囲に分散している場合、マシンに搭載されている大量のメモリはほとんど役に立たない可能性があります。その可能性は高いようです。また、メモリは読み取りにのみ役立ちますが、読み取りの多くが同じファイルに対するものである場合がほとんどです (そうでない場合、キャッシュから追い出されます)。

top / htop を実行するときは、iowait を監視します。ここで高い値が表示される場合、CPU が何か (ネットワーク、ディスクなど) を待機しているだけの優れた指標となります。

私の意見では、NFSが原因である可能性は低いです。私たちはNFSについてかなり広範な経験を持っていますが、NFSは調整/最適化できますが、傾向があるかなり確実に動作します。

GFS コンポーネントを安定させてから、NFS の問題が解決するかどうかを確認したいと思います。

最後に、OCFS2 は GFS の代替として検討できるオプションかもしれません。分散ファイルシステムについて調査していたときに、かなりの量の調査を行いましたが、OCFS2 を試すことにした理由は思い出せません。しかし、試してみました。おそらく、OCFS2 が Oracle のデータベースバックエンドに使用されており、非常に高い安定性が求められることと関係があるのでしょう。

Muninはあなたの友達です。しかし、もっと重要なのはtop / htopです。vmstatはいくつかの重要な数値も提供します。

$ vmstat 1

システムが何に時間を費やしているかについて、毎秒更新情報が得られます。

幸運を！

Question 3

まず、Varnish または Nginx を使用して、Web サーバーのフロントに HA プロキシを配置します。

次に、Web ファイルシステムの場合: NFS、GFS2 の代わりに MooseFS を使用するのはいかがでしょうか。MooseFS はフォールトトレラントで読み取りが高速です。NFS、GFS2 ではローカルロックが使用できなくなりますが、アプリケーションにそれが必要なのでしょうか。必要でない場合は、MooseFS に切り替えて NFS、GFS2 の問題を回避します。MFS メタデータサーバーの HA には Ucarp を使用する必要があります。

MFSでレプリケーション目標を3に設定する

# mfssetgoal 3 /フォルダ

//キリスト教徒

Answer

まず、Varnish または Nginx を使用して、Web サーバーのフロントに HA プロキシを配置します。

次に、Web ファイルシステムの場合: NFS、GFS2 の代わりに MooseFS を使用するのはいかがでしょうか。MooseFS はフォールトトレラントで読み取りが高速です。NFS、GFS2 ではローカルロックが使用できなくなりますが、アプリケーションにそれが必要なのでしょうか。必要でない場合は、MooseFS に切り替えて NFS、GFS2 の問題を回避します。MFS メタデータサーバーの HA には Ucarp を使用する必要があります。

MFSでレプリケーション目標を3に設定する

# mfssetgoal 3 /フォルダ

//キリスト教徒

Question 4

Munin グラフに基づいて、システムはキャッシュを削除しています。これは、次のいずれかを実行することと同等です。

echo 2 > /proc/sys/vm/drop_caches
1. 空き dentry と inode
echo 3 > /proc/sys/vm/drop_caches
1. ページキャッシュ、デンティレス、iノードを解放する

疑問は、なぜ cron タスクが残っているのかということです。

01:00 -> 12:00 を除けば、一定の間隔になっているようです。

上記のコマンドのいずれかを実行しても問題が再現するかどうかは、ピークの半分くらいまで確認してみる価値はあるでしょう。いつもsyncそうする前に必ず右折してください。

それができない場合は、strace予想されるパージの時刻の前後からそのパージまでの間に、drbd プロセス (再びこれが原因であると仮定) を調べると、何らかの手がかりが得られるかもしれません。

Answer

Munin グラフに基づいて、システムはキャッシュを削除しています。これは、次のいずれかを実行することと同等です。

echo 2 > /proc/sys/vm/drop_caches
1. 空き dentry と inode
echo 3 > /proc/sys/vm/drop_caches
1. ページキャッシュ、デンティレス、iノードを解放する

疑問は、なぜ cron タスクが残っているのかということです。

01:00 -> 12:00 を除けば、一定の間隔になっているようです。

上記のコマンドのいずれかを実行しても問題が再現するかどうかは、ピークの半分くらいまで確認してみる価値はあるでしょう。いつもsyncそうする前に必ず右折してください。

それができない場合は、strace予想されるパージの時刻の前後からそのパージまでの間に、drbd プロセス (再びこれが原因であると仮定) を調べると、何らかの手がかりが得られるかもしれません。

NFS と GFS2 のパフォーマンスが遅い

答え1

答え2

答え3

答え4

関連情報