Fusionar dos CSV comparados solo por una columna específica

Question

Súper simple con awk:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

Eso almacena el segundo campo del archivo old.csv en la matriz denominada "antiguo" y luego, para el archivo new.csv, imprimirá registros donde el segundo campo no esté en la matriz "antigua".

Es cierto que esto no respetará ningún carácter de barra vertical entre comillas. Para eso, me gusta el módulo csv de Ruby:

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Answer 1

Súper simple con awk:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

Eso almacena el segundo campo del archivo old.csv en la matriz denominada "antiguo" y luego, para el archivo new.csv, imprimirá registros donde el segundo campo no esté en la matriz "antigua".

Es cierto que esto no respetará ningún carácter de barra vertical entre comillas. Para eso, me gusta el módulo csv de Ruby:

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Fusionar dos CSV comparados solo por una columna específica

Respuesta1

información relacionada