別のファイルに存在するフィールドを置き換えながら、大きなファイル内で検索と置換を行う最も速い方法

Question

awk -F, -v OFS=, '
    NR==FNR {opu[$2]=$1; next} 
    $2 in opu {$2 = opu[$2]; print}
' file2 file1

これは、「マッピング」ファイルをメモリに読み込み、file1 の 2 番目のフィールドを置き換えます。各ファイルは 1 回だけ処理されます。

出力はstdoutに送られるので、ファイルを「その場で」置き換えるには次のようにします。

awk ... file2 file1 > tempfile && mv tempfile file1

Answer 1

awk -F, -v OFS=, '
    NR==FNR {opu[$2]=$1; next} 
    $2 in opu {$2 = opu[$2]; print}
' file2 file1

これは、「マッピング」ファイルをメモリに読み込み、file1 の 2 番目のフィールドを置き換えます。各ファイルは 1 回だけ処理されます。

出力はstdoutに送られるので、ファイルを「その場で」置き換えるには次のようにします。

awk ... file2 file1 > tempfile && mv tempfile file1

関連情報