
iPad의 로컬 파일에서 Apple Books에 책(PDF)이 있었습니다. PDF에는 2개월 분량의 메모가 있었습니다.
오늘은 열 수 없었고 오류가 발생했습니다.
"문서를 열 수 없습니다. ''를 열 수 없습니다"
그래서 파일을 Mac에 Air Drop하고 Preview, Adobe 및 Acrobat에서 열어 보았습니다. 파일을 시도한 모든 곳에서 파일을 열 수 없습니다. 손상되거나 손상될 수 있습니다.
Ghostscript( )를 사용하여 복구하려고 했지만 gs
작동하지 않았습니다.
gs \
-o repaired.pdf \
-sDEVICE=pdfwrite \
-dPDFSETTINGS=/prepress \
corrupted.pdf
대신 오류가 발생합니다.
Catalog dictionary not located in file, unable to proceed
**** Error: Couldn't initialise file.
Output may be incorrect.
No pages will be processed (FirstPage > LastPage).
The following errors were encountered at least once while processing this file:
startxref offset invalid
xref table was repaired
**** This file had errors that were repaired or ignored.
**** Please notify the author of the software that produced this
**** file that it does not conform to Adobe's published PDF
**** specification.
iPad를 업데이트하려고 시도했지만 다시 시작해도 문제가 해결되지 않는 것 같습니다.
파일 크기는 약 150MB입니다. 복구하려면 어떻게 해야 합니까?
답변1
나는 59년 반 동안 컴퓨터 데이터를 다루며 지난 40년 동안 이상한 스위치와 릴레이, 찢어진 종이 테이프와 좀이 먹은 카드, 늘어나는 테이프와 케이블, 구부러지거나 부서진 디스크 등 다양한 수준에서 데이터 손실 문제를 해결해 왔습니다. 그리고 플레이키 칩. 내가 말할 수 없는 몇 가지 놀라운 이야기가 있습니다. 그렇지 않으면 내 정신 상태나 나를 고용한 사람들, 그들의 데이터를 감염시킨 사람들을 의심하게 될 것입니다.
따라서 첫 번째 조언은 "벽에 스위치를 껐나요?"라는 진부한 말일지라도 원인을 찾아내는 것입니다.
다음 단계는 복구 가능성과 복구 비용을 비교 평가하는 것입니다.
그래서 이것은 흥미로운 도전이었고 대답은 좋지 않았습니다.
편집 장치에 삭제된 복사본이 숨겨져 있을 가능성이 있고 교체 비용이 유난히 높다고 생각하는 경우. 그런 다음 디스크를 미러링하고 삭제된 %PDF-
헤더를 검색할 수 있는 진단 시스템에 법의학적으로 전원이 꺼진 장치를 연결하는 데 비용을 지불할 가치가 있을 수 있습니다.
최신 디스크는 해제된 공간을 대용량 메모리 스토리지 캐시에 신속하게 재사용하여 손실된 데이터를 덮어쓰는 방식으로 이를 가능하게 하지 않거나(솔리드 스테이트) 이전처럼 쉽게 만들지 않는 경향이 있습니다.
이제 "Questionable" 저장된 파일의 허브로 이동합니다.
원하는 데이터를 많이 유지했습니다. 그러나 편집되지 않은 소스 파일과 비교하면 손실이 매우 크다고 말할 수 있습니다.
원본 PDF는 이미 두 번 편집되었으므로(새로운 표지 하나와 사소한 수정 하나) 다른 편집 내용을 추가하기 위한 이상한 부분이 남아 있었습니다(비정상적이지는 않지만 피해야 함).
core /Size 39679 objects
edit /Size 39692
edit /Size 39694
해당 소스 파일을 재구성하면 작업 개수가 /Size 37546 개체로 최적화됩니다. 약간의 중복이 있었음을 나타내지만 다시 한 번 특이한 것은 아닙니다.
2개월에 걸쳐 하루에 몇 번 이상 추가하면 40,000개 이상으로 숫자가 늘어납니다. 그러나 그것은 /Size 70957이라고 보고합니다. 한 번에 확인하면 파일이 너무 커야 합니다. 따라서 약 32,000개의 추가 항목이 모두 보관된 파일에 있어야 하지만 필요한 것보다 상대적으로 작습니다.
(비교를 위한) 테스트로 주석 한 페이지만 복구했습니다(어떤 페이지에 적용되었는지 알지 못한 채). 일반적이지는 않지만 한 페이지에 약 120KB에 달합니다.
여기서는 맥락에 맞지 않게 구성 요소를 볼 수 없지만 아마도 오른쪽 페이지에 있는 변경 사항(날짜 참조)의 마지막 페이지이기 때문에 여기서는 의미가 없을 수 있습니다.
새 표지 위에 배치할 수 있습니다(여전히 알려지지 않은 삭제된 페이지는 정확하지 않음).
요약하면, 복구 비용이 느리고 유지된 개체 수가 적다는 점(/Annots 수 = 약 57페이지(페이지?))으로 인해 복구 비용이 "다시 수행"하는 데 소요되는 비용보다 더 비쌉니다. 67961부터 70957까지의 좋은 그룹이므로 복구가 가능해야 합니다.
내가 찾은 최고의 복구 응용 프로그램https://superuser.com/a/1808687/1769247. 총 849개 중 180개 이상의 명목 페이지에서 240개까지의 객체만 표시하고 실제로 두 배 이상의 추가 이미지 페이지를 재현합니다. 그림 측면에서 일부는 소프트 마스킹에 부정적인 영향을 미치므로 850-1845는 하위 이미지는 180-240의 복제본이거나 다른 이미지일 수 있습니다.
고정된 나머지 부분에 대한 30일 링크는 다음과 같습니다.https://filetransfer.io/data-package/nbXvfSBp#link
앞으로의 권장 사항
마스터 파일을 4개의 편리한 부분으로 분할하면 3배의 이점이 있습니다.
- 각 부분의 렌더링 속도가 빨라지고 무거운 주석에 대한 응답도 빨라집니다.
- 소스 파일의 기초 문제를 수정하세요.
- 미래의 치명적인 손실을 한 번에 25%로 줄이세요.
필요한 엄청난 양의 메모리를 처리하는 주석 소프트웨어의 능력과 일시적인 결함으로 인해 열려 있는 편집 파일이 손상될 수 있는 "브라우아웃" 손실 가능성을 다시 생각해 보십시오.
동기화된 클라우드 드라이브가 아닌 워크스테이션과 같은 안정적인 로컬 디스크 시스템에서 작업하세요.
복구된 파일 자체를 사용하지 말고 반복 작업에 대한 미리 알림으로 사용하세요. 다른 오류가 발생하지 않도록 PDF GUI 편집기에 개체 잘라내기 및 붙여넣기를 포함할 수 있습니다.
사례별 가능성.
페이지 번호가 동기화되지 않았지만 순서는 정확하거나 운 좋게도 마스터 파일로 전송하기 위한 완벽한 순서를 찾을 수 있습니다. 그렇다면 JSON과 같이 복구 파일에서 /Annots를 내보내어 전송 속도를 "빠른" 다음 페이지 번호별로 적절하게 최적화된 마스터 파일로 가져올 수 있는 명령줄 도구가 있습니다. 그러한 도구 중 하나는 최적화 도구 및 /Annots 내보내기 가져오기 기능이 있는 일관된 cpdf일 수 있습니다. 하지만 그것이 이 문제에 충분히 답할 수 있을지는 말할 수 없습니다.