合併僅按特定列比較的兩個 CSV

Question

使用 awk 超簡單：

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

它將 old.csv 檔案的第二個欄位儲存在名為「old」的陣列中，然後對於 new.csv 文件，它將列印第二個欄位不在「old」陣列中的記錄。

確實，這不會尊重引號內的任何管道字元。為此，我喜歡 ruby 的 csv 模組：

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Answer 1

使用 awk 超簡單：

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

它將 old.csv 檔案的第二個欄位儲存在名為「old」的陣列中，然後對於 new.csv 文件，它將列印第二個欄位不在「old」陣列中的記錄。

確實，這不會尊重引號內的任何管道字元。為此，我喜歡 ruby 的 csv 模組：

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

合併僅按特定列比較的兩個 CSV

答案1

相關內容