Como comparar duas colunas de dois arquivos diferentes

Como comparar duas colunas de dois arquivos diferentes

Eu tenho dois arquivos. O primeiro contém algo como:

a.com,5,some,text
b.com,10,some,text
c.com,5,some,text
d.com,12,some,text
e.com,5,some,text
c.com,5,some,text

O segundo contém algo como:

c.com,5,some,text
d.com,12,some,text
a.com,5,some,text
b.com,10,some,text
e.com,5,some,text
c.com,5,some,text

Quero classificar, comparar as duas primeiras colunas dos dois arquivos. Presumo que deveriam ser semelhantes. Se houver alguma diferença, quero saber onde está a diferença?

Responder1

No Bash:

diff <(sort file1 | cut -d , -f 1-2) <(sort file2 | cut -d , -f 1-2)

Mas diffverá apenas duas colunas, portanto sua saída (se houver diferença) será limitada a elas. Não sei se isso é aceitável para você.

Esta solução simples irá falhar se seus arquivoslidar com vírgulas, aspasetc. Neste caso devem ser utilizadas ferramentas mais especializadas (por exemplo, importar os arquivos para uma planilha e trabalhar lá).

informação relacionada