두 개의 파일이 있습니다. 첫 번째 파일에는 다음과 같은 내용이 포함되어 있습니다.
a.com,5,some,text
b.com,10,some,text
c.com,5,some,text
d.com,12,some,text
e.com,5,some,text
c.com,5,some,text
두 번째에는 다음과 같은 내용이 포함됩니다.
c.com,5,some,text
d.com,12,some,text
a.com,5,some,text
b.com,10,some,text
e.com,5,some,text
c.com,5,some,text
두 파일의 처음 두 열을 정렬하고 비교하고 싶습니다. 나는 그들이 비슷해야한다고 가정합니다. 차이점이 있다면 어디에서 차이점이 있는지 알고 싶습니다.
답변1
배쉬에서:
diff <(sort file1 | cut -d , -f 1-2) <(sort file2 | cut -d , -f 1-2)
그러나 diff
두 개의 열만 표시되므로 출력(차이가 있는 경우)은 해당 열로 제한됩니다. 이것이 당신에게 받아들여질지 모르겠습니다.
파일이 다음과 같은 경우 이 간단한 솔루션은 실패합니다.쉼표, 따옴표 처리등. 이 경우에는 보다 전문적인 도구를 사용해야 합니다(예: 파일을 스프레드시트로 가져와서 작업).