대용량 파일의 내부(파일 시스템 수준)에 대한 "멀티패스" 스크립트 수정?

Question 1

디스크의 파일 구조는 사용 중인 파일 시스템에 따라 다릅니다. 실제 파일 시스템 중 어느 것도 귀하가 설명하는 대로 연결 목록을 사용하지 않습니다(그러면 fseek(3)견딜 수 없게 됩니다). 이에 가장 가까운 것은 Microsoft의 것입니다.지방, 기본적으로 포인터를 데이터 블록에서 이를 가리는 배열로 이동합니다.

그러나 대부분의 파일 시스템은 파일의 데이터 블록에 대한 포인터 기반 참조를 사용하므로 원칙적으로 전체 파일 내용이 아닌 포인터 몇 개를 섞고 블록을 표시하여 파일 블록을 잘라낼 수 있습니다. 파일의 중간은 무료입니다. 안타깝게도 이는 별로 유용한 작업이 아닙니다. 파일 블록은 다소 크고(일반적으로 4KiB) 파일의 구조(라인 또는 기타 하위 구분)와 합리적으로 정렬되는 경우가 거의 없습니다.

Answer

디스크의 파일 구조는 사용 중인 파일 시스템에 따라 다릅니다. 실제 파일 시스템 중 어느 것도 귀하가 설명하는 대로 연결 목록을 사용하지 않습니다(그러면 fseek(3)견딜 수 없게 됩니다). 이에 가장 가까운 것은 Microsoft의 것입니다.지방, 기본적으로 포인터를 데이터 블록에서 이를 가리는 배열로 이동합니다.

그러나 대부분의 파일 시스템은 파일의 데이터 블록에 대한 포인터 기반 참조를 사용하므로 원칙적으로 전체 파일 내용이 아닌 포인터 몇 개를 섞고 블록을 표시하여 파일 블록을 잘라낼 수 있습니다. 파일의 중간은 무료입니다. 안타깝게도 이는 별로 유용한 작업이 아닙니다. 파일 블록은 다소 크고(일반적으로 4KiB) 파일의 구조(라인 또는 기타 하위 구분)와 합리적으로 정렬되는 경우가 거의 없습니다.

Question 2

당신이 묘사하는 것은 다음과 매우 유사하게 들립니다.다시 하다텍스트 편집기의다시 실행 목록변경되지 않은 원본 파일에 대해다시 실행 목록속합니다. 나는 gvim그런 것이 있다고 확신한다.지속적인실행 취소/다시 실행 목록(?)을 활용할 수 있으며, emacs(스크립트를 통해) 원하는 것은 무엇이든 하도록 유도할 수 있는 목록이 확실히 있다는 것을 알고 있습니다 elisp.세션 간 Emacs 실행 취소 기록 저장.

참고로, 다음과 같은 대용량 파일의 경우 원치 않는 작업을 모두 끄는 것이 좋습니다.자동 저장,구문 강조(천천히큰emacs 파일) 등.. 32비트 시스템의 emacs는 256MB입니다.파일 크기 제한.

제안한 것만큼 간결하지는 않지만 변경 사항이 많지 않은 경우에는 사용할 수 있습니다.

Answer

당신이 묘사하는 것은 다음과 매우 유사하게 들립니다.다시 하다텍스트 편집기의다시 실행 목록변경되지 않은 원본 파일에 대해다시 실행 목록속합니다. 나는 gvim그런 것이 있다고 확신한다.지속적인실행 취소/다시 실행 목록(?)을 활용할 수 있으며, emacs(스크립트를 통해) 원하는 것은 무엇이든 하도록 유도할 수 있는 목록이 확실히 있다는 것을 알고 있습니다 elisp.세션 간 Emacs 실행 취소 기록 저장.

참고로, 다음과 같은 대용량 파일의 경우 원치 않는 작업을 모두 끄는 것이 좋습니다.자동 저장,구문 강조(천천히큰emacs 파일) 등.. 32비트 시스템의 emacs는 256MB입니다.파일 크기 제한.

제안한 것만큼 간결하지는 않지만 변경 사항이 많지 않은 경우에는 사용할 수 있습니다.

Question 3

일반적으로 전체 파일을 메모리로 가져오지 않으면 파일을 편집할 수 없습니다. 나는 당신이 실제로하고 싶은 일은 특정 줄이없는 이전 파일의 복사본 인 새 파일을 갖는 것이라고 가정합니다. 이는 유닉스 유틸리티 head와 tail. 예를 들어, 파일에서 5, 12, 52행을 제외한 모든 내용을 복사하려면 다음을 수행하십시오.

head -n 4 bigfile.dat > tempfile.dat
tail -n +6 bigfile.dat | head -n 6 >> tempfile.dat 
tail -n +13 bigfile.dat | head -n 39 >> tempfile.dat 
tail -n 53 bigfile.dat >> tempfile.dat

이러한 유틸리티에 대해 잘 모르시는 경우를 대비해 더 자세히 설명하겠습니다.

유틸리티 head는 파일에서 처음 n줄을 인쇄합니다. 위치 인수가 제공되지 않으면 표준 입력을 파일로 사용합니다. 플래그 -n는 인쇄할 라인 수를 머리에 알려줍니다. 따라서 head -n 2표준 입력에서 처음 2줄만 인쇄합니다.

유틸리티 tail는 파일의 마지막 n줄을 인쇄합니다. head와 마찬가지로 파일이나 표준 입력에서 읽을 수 있습니다. -n 플래그는 tail 끝에서 인쇄할 줄 수를 알려줍니다. 숫자 앞에 더하기 기호를 붙여서 tail이 처음부터 해당 행부터 시작하여 파일 끝의 행을 인쇄하도록 할 수도 있습니다. 예를 들어 tail -n 2표준 입력에서 마지막 두 줄을 인쇄합니다. 그러나 tail -n +2라인 번호 2로 시작하는 모든 라인을 인쇄합니다(라인 1 생략).

따라서 일반적으로 파일에서 [x, y) 범위의 행을 인쇄하려면 다음을 수행하십시오.

`tail -n +x | head -n d`

여기서 d = y - x입니다. 이 명령은 새 파일을 생성합니다. 원하는 경우 이전 파일을 삭제할 수 있습니다. 이 방법의 장점은 head한 tail번에 한 줄만 메모리에 유지하면 되므로 RAM이 빨리 채워지지 않는다는 것입니다.

Answer