Mesclando dois CSV comparados apenas por uma coluna específica

Question

Super simples com awk:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

Isso armazena o segundo campo do arquivo old.csv no array chamado "antigo" e, em seguida, para o arquivo new.csv, imprimirá registros onde o segundo campo não está no array "antigo".

É verdade que isso não respeitará nenhum caractere vertical entre aspas. Para isso, gosto do módulo csv do Ruby:

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Answer 1

Super simples com awk:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

Isso armazena o segundo campo do arquivo old.csv no array chamado "antigo" e, em seguida, para o arquivo new.csv, imprimirá registros onde o segundo campo não está no array "antigo".

É verdade que isso não respeitará nenhum caractere vertical entre aspas. Para isso, gosto do módulo csv do Ruby:

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Mesclando dois CSV comparados apenas por uma coluna específica

Responder1

informação relacionada