Linux에서 파일 구문 분석: 타임스탬프만 저장

Linux에서 파일 구문 분석: 타임스탬프만 저장

한 디렉토리에 31개의 파일이 있습니다. 파일 형식은 아래와 같습니다.

TimeStamop      user-id
1471417712595   1936f35c-XXXX-XXXX-XXXX-49898523b8ea
1471417717238   e3153e8d-XXXX-XXXX-XXXX-7710089c77bb
1471417718730   4e470320-XXXX-XXXX-XXXX-29bc448f09a1
1471417719211   e8b6a6c0-XXXX-XXXX-XXXX-dd68d836fb31
1471417723775   cbc009c1-XXXX-XXXX-XXXX-88cda2b1b812
1471417723775   cbc009c1-XXXX-XXXX-XXXX-88cda2b1b812
1471417725790   c332eba7-XXXX-XXXX-XXXX-509c42a621d1
1471417725522   4712acf1-XXXX-XXXX-XXXX-11a24bcbe7c8
1471417601920   502bc0dd-XXXX-XXXX-XXXX-eff38b468461
1471417604615   8c6b2ef9-XXXX-XXXX-XXXX-9efb1223e383

나는 타임스탬프 정보를 원하고 Linux 쉘 스크립트를 사용하여 하나의 파일에 모든 타임스탬프를 쓰고 싶습니다. 총 파일 크기(31개 파일 크기)는 4.5GB입니다. 나는 이 작업을 수행하는 효율적인 방법을 원합니다. 나는 이것을 파이썬으로 해냈습니다. 하지만 쉘 스크립트에서 원합니다.

답변1

를 사용하면 awk파일이 포함된 디렉터리에서 다음을 수행합니다.

awk 'FNR>1 {print $1}' * >output.txt
  • FNR>1각 파일에서 1보다 큰 레코드 번호를 가진 모든 레코드와 일치합니다. 즉, 각 파일에서 헤더를 제거하는 것입니다.

  • 해당 레코드의 경우 {print $1}타임스탬프인 첫 번째 필드만 인쇄합니다.

관련 정보