特定の列のみを比較した2つのCSVをマージする

Question

awk を使えば超簡単:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

これにより、old.csv ファイルの 2 番目のフィールドが「old」という名前の配列に保存され、new.csv ファイルでは、2 番目のフィールドが「old」配列にないレコードが出力されます。

確かに、引用符内のパイプ文字は考慮されません。そのため、私は Ruby の csv モジュールを好みます。

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Answer 1

awk を使えば超簡単:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

これにより、old.csv ファイルの 2 番目のフィールドが「old」という名前の配列に保存され、new.csv ファイルでは、2 番目のフィールドが「old」配列にないレコードが出力されます。

確かに、引用符内のパイプ文字は考慮されません。そのため、私は Ruby の csv モジュールを好みます。

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

特定の列のみを比較した2つのCSVをマージする

答え1

関連情報