分散ストレージファイルシステム - どれですか?/すぐに使用できる製品はありますか?

Question 1

POSIX 要件を放棄する必要があると思います。それを実装しているシステムは非常に少なく、実際、NFS でさえ (ロックなどを考慮して) 実際には実装されておらず、冗長性もありません。

同期レプリケーションを使用するシステムは非常に遅くなります。非同期レプリケーション (または「最終的な一貫性」) を使用するシステムは POSIX ルールに違反し、「従来の」ファイルシステムのように動作しません。

Answer

POSIX 要件を放棄する必要があると思います。それを実装しているシステムは非常に少なく、実際、NFS でさえ (ロックなどを考慮して) 実際には実装されておらず、冗長性もありません。

同期レプリケーションを使用するシステムは非常に遅くなります。非同期レプリケーション (または「最終的な一貫性」) を使用するシステムは POSIX ルールに違反し、「従来の」ファイルシステムのように動作しません。

Question 2

残りのことについてはわかりませんが、あなたは「分散ストレージエンジン」と「分散ファイルシステム」を混同しているようです。これらは同じものではありません。同じものと間違えるべきではありませんし、同じものになることもありません。ファイルシステムは、ハードドライブ上の場所を追跡する方法です。Hadoop などのストレージエンジンは、キーによって識別されるデータチャンクを追跡する方法です。概念的には、大きな違いはありません。問題は、ファイルシステムがストレージエンジンに依存しているということです... 結局のところ、ブロックデバイスに書き込む方法が必要なのではないですか?

そんなことはすべてさておき、私はできる実稼働環境での分散ファイルシステムとしての ocfs2 の使用について説明します。細かい詳細を知りたくない場合は、次の行以降を読むのを止めてください。これはかなりクールですが、思ったよりもダウンタイムが長くなる可能性があります。

私たちは過去数年間、ocfs2 を実稼働環境で実行してきました。これは問題ありませんが、多くのアプリケーションには適していません。要件をよく検討して、それが何であるかを把握する必要があります。そうすると、思っていたよりもずっと多くの障害の許容範囲があることに気付くかもしれません。

たとえば、ocfs2 には、パーティションをマウントするクラスタ内の各マシンのジャーナルがあります。たとえば、4 台の Web マシンがあり、mkfs.ocfs2 を使用してパーティションを作成するときに、拡張の余地を残すために合計 6 台のマシンを指定するとします。これらの各ジャーナルはスペースを占有するため、ディスクに保存できるデータの量が減少します。ここで、マシンを 7 台に拡張する必要があるとします。その場合、全体クラスタをアンマウントし (つまり、すべての ocfs2 パーティションをアンマウントします)、空き領域がある場合は、tunefs.ocfs2 ユーティリティを使用して追加のジャーナルを作成します。その後、クラスタに 7 番目のマシンを追加し (ユーティリティを使用していない場合は、テキストファイルをクラスタの残りの部分に配布する必要があります)、すべてを元に戻し、7 台のマシンすべてにパーティションをマウントします。

私の言っている意味がおわかりですか? これは高可用性、つまり「常にオンライン」を意味するはずですが、実際にはダウンタイムが大量に発生します... また、ディスク領域が不足することは絶対に避けてください。ocfs2 を混雑させたときに何が起こるかは、見たくないはずです。

ocfs2 クラスターを管理する「推奨」方法であった evms は、clvmd と lvm2 に取って代わられ、絶滅の道をたどっていることに注意してください。(evms はもうおしまいです。) また、heartbeat はすぐにゾンビプロジェクトに変わり、openais/pacemaker スタックに取って代わられるでしょう。(余談ですが、ocfs2 の初期クラスター構成を行うときに、heartbeat ではなく 'pcmk' をクラスターエンジンとして指定できます。いいえ、これは文書化されていません。)

参考までに、私たちは pacemaker によって管理される nfs に戻りました。これは、pacemaker が nfs 共有を別のマシンに移行するときに発生する数秒のダウンタイムや、いくつかの tcp パケットのドロップが、ocfs2 の使用時にマシンを追加するなどの基本的な共有ストレージ操作で発生していたダウンタイムの量と比較すると些細なことだからです。

Answer