可能な限り最速の方法で大量のファイルをアーカイブする

Question

ディスクが本当にボトルネックである場合、パフォーマンスの面で最適なのは実際には 4 である可能性が高いです。これにより、ファイルをある場所から別の場所にコピーするために貴重な IOPS を費やす必要がなくなります。

また、オプション 4 は、サーバーがダウンロードを完了するとすぐにクライアントがトレントをダウンロードできる唯一のオプションです。つまり、クライアントは実際にデータに早くアクセスできます。また、この方法では、ユーザーが個々のファイルをダウンロードできるように簡単に許可するオプションがあります (ファイルはファイルシステム上に置かれているだけなので、非常に簡単です)。

tar のパフォーマンスがなぜそれほど悪いのか調べてみましょう。私の記憶では、チェックサムはデータ上にさえ存在しないので、問題がチェックサムにあるとは到底思えません。独自の tar パッカーを作成するのではなく、GNU tar からの出力を Web ブラウザーに直接パイプできない理由はありますか?

このアプローチでは、クライアントに正しいコンテンツの長さを提供することが課題の 1 つになります。その点を気にしない場合は、この送信を省略できます。その場合、クライアントはダウンロードのパーセンテージカウンターを表示しません。アプリケーションによっては、これが問題にならない場合があります。

Answer 1

ディスクが本当にボトルネックである場合、パフォーマンスの面で最適なのは実際には 4 である可能性が高いです。これにより、ファイルをある場所から別の場所にコピーするために貴重な IOPS を費やす必要がなくなります。

また、オプション 4 は、サーバーがダウンロードを完了するとすぐにクライアントがトレントをダウンロードできる唯一のオプションです。つまり、クライアントは実際にデータに早くアクセスできます。また、この方法では、ユーザーが個々のファイルをダウンロードできるように簡単に許可するオプションがあります (ファイルはファイルシステム上に置かれているだけなので、非常に簡単です)。

tar のパフォーマンスがなぜそれほど悪いのか調べてみましょう。私の記憶では、チェックサムはデータ上にさえ存在しないので、問題がチェックサムにあるとは到底思えません。独自の tar パッカーを作成するのではなく、GNU tar からの出力を Web ブラウザーに直接パイプできない理由はありますか?

このアプローチでは、クライアントに正しいコンテンツの長さを提供することが課題の 1 つになります。その点を気にしない場合は、この送信を省略できます。その場合、クライアントはダウンロードのパーセンテージカウンターを表示しません。アプリケーションによっては、これが問題にならない場合があります。

可能な限り最速の方法で大量のファイルをアーカイブする

答え1

関連情報