grep/sed/awk は非常に大きなファイルに対してどの程度のパフォーマンスを発揮しますか?

Question

grep一般的に、が最も速く、が最も遅いと言えますsed。もちろん、これは具体的に何をするかによって異なります。awkよりもはるかに速いと思いますsed。

実際の正規表現は必要なく、単純な固定文字列のみが必要な場合は、grep を高速化できます (オプション -F)。

パイプ内で grep、sed、awk を一緒に使用したい場合は、可能であれば grep コマンドを最初に配置します。

たとえば次のようになります:

grep -F "foo" file | sed -n 's/foo/bar/p'

通常はこれよりも高速です:

sed -n 's/foo/bar/p' file

grep最初の行のは不要と思われます。

LC_ALL=Cちなみに、単純な ASCII テキストファイルを扱う場合は、これらのコマンドを使用すると速度が上がる可能性があります。

私の経験はすべて gnu コマンドに基づいています。異なる実装を試して速度を比較することもできます。

Answer 1