Ich hatte ein Buch (PDF) in Apple Books aus lokalen Dateien auf dem iPad. Ich hatte Notizen im Umfang von 2 Monaten im PDF.
Heute konnte ich es nicht öffnen und erhielt eine Fehlermeldung:
„Dokument kann nicht geöffnet werden. '' kann nicht geöffnet werden “
Also habe ich die Datei per AirDrop auf einen Mac übertragen und versucht, sie in Preview, Adobe und Acrobat zu öffnen. Überall, wo ich es versucht habe, konnte die Datei nicht geöffnet werden. Sie könnte beschädigt oder defekt sein.
Ich habe versucht, gs
es mit Ghostscript () zu reparieren, aber es hat nicht funktioniert:
gs \
-o repaired.pdf \
-sDEVICE=pdfwrite \
-dPDFSETTINGS=/prepress \
corrupted.pdf
Stattdessen erhalte ich eine Fehlermeldung:
Catalog dictionary not located in file, unable to proceed
**** Error: Couldn't initialise file.
Output may be incorrect.
No pages will be processed (FirstPage > LastPage).
The following errors were encountered at least once while processing this file:
startxref offset invalid
xref table was repaired
**** This file had errors that were repaired or ignored.
**** Please notify the author of the software that produced this
**** file that it does not conform to Adobe's published PDF
**** specification.
Ich habe versucht, das iPad zu aktualisieren und neu zu starten, aber das Problem scheint nicht behoben zu sein.
Die Datei ist etwa 150 MB groß. Was kann ich tun, um sie wiederherzustellen?
Antwort1
Ich bin seit 59 1/2 Jahren als Junge und Mann im Umgang mit Computerdaten tätig und habe in den letzten 40 Jahren Probleme mit verlorenen Daten auf verschiedenen Ebenen gelöst, von zwielichtigen Schaltern und Relais, zerrissenen Lochstreifen und von Motten zerfressenen Karten, gedehnten Bändern und Kabeln, verbogenen oder rissigen Festplatten und schuppigen Chips. Einige unglaubliche Geschichten kann ich nicht erzählen, sonst würden Sie an meinem Verstand zweifeln oder an den Leuten, die mich beschäftigten, oder an denen, die ihre Daten infizierten.
Der erste Ratschlag lautet also: Beseitigen Sie die Ursache, selbst wenn es sich dabei nur um das abgedroschene „Haben Sie an der Wand ausgeschaltet?“ handelt.
Der nächste Schritt besteht darin, die Chance einer Wiederherstellung den Kosten einer Wiederholung gegenüberzustellen.
Das war also eine interessante Herausforderung und die Antworten sind nicht gut.
Wenn Sie glauben, dass das Bearbeitungsgerät möglicherweise eine versteckte gelöschte Kopie enthält und die Kosten für den Ersatz außergewöhnlich hoch sind, kann es sich lohnen, für die forensische Anbindung des ausgeschalteten Geräts an ein Diagnosesystem zu bezahlen, wo die Festplatte gespiegelt und nach gelöschten %PDF-
Headern durchsucht werden kann.
Bei modernen Festplatten ist dies in der Regel weder möglich (Solid State) noch so einfach wie früher, da der freigegebene Speicherplatz schnell für große Speicher-Caches wiederverwendet und so die verlorenen Daten überschrieben werden.
Nun zum Hub der „fragwürdigen“ gespeicherten Datei.
Viele der gewünschten Daten sind erhalten geblieben. Im Vergleich mit der unbearbeiteten Quelldatei können wir jedoch sagen, dass der Verlust erheblich war.
Das Quell-PDF wurde bereits zweimal bearbeitet (ein neues Cover? und eine kleine Optimierung), sodass durch die verschiedenen Bearbeitungen noch Merkwürdigkeiten auftraten (was nicht ungewöhnlich, aber zu vermeiden ist).
core /Size 39679 objects
edit /Size 39692
edit /Size 39694
Wenn ich diese Quelldatei neu strukturiere, wird die Arbeitsanzahl auf /Size 37546 Objekte optimiert. Dies deutet darauf hin, dass es eine gewisse Redundanz gab, was aber auch nicht ungewöhnlich ist.
Die Hinzufügungen über 2 Monate hinweg sollten bei mehr als ein paar pro Tag die Anzahl auf 40.000 oder mehr erhöhen. Es wird jedoch gemeldet, dass es /Size 70957 war. Die Bestätigung, dass die Datei zu einem bestimmten Zeitpunkt übermäßig groß gewesen sein muss. Daher müssen die zusätzlichen ca. 32.000 Elemente alle in der beibehaltenen Datei enthalten sein, aber sie ist vergleichsweise kleiner als erforderlich.
Als Test (zu meinem Vergleich) habe ich nur eine Seite mit Anmerkungen wiederhergestellt (ohne zu wissen, welche Seitenzahl sie umfasste). Das ist vielleicht nicht typisch, beträgt aber etwa 120 KB pro Seite.
Dies ergibt hier möglicherweise keinen Sinn, da die Komponenten hier nicht ohne Kontext zu sehen sind, aber es handelt sich vermutlich um die letzte Seite mit den Änderungen (siehe Datum), die sich auf einer rechten Seite befindet.
Wir können es über das neue Deckblatt legen (immer noch nicht die richtige unbekannte gelöschte Seite)
Zusammenfassend ist mein Bauchgefühl, dass die langsamen Kosten der Wiederherstellung und die geringe Anzahl der beibehaltenen Objekte (Anzahl der /Annots = ca. 57 (Seiten?) darauf schließen lassen, dass die Wiederherstellung teurer ist als der Arbeitsaufwand, es „noch einmal zu machen“. Verlockenderweise gibt es eine gute Gruppe von 67961 bis 70957, daher sollten diese wiederherstellbar sein.
Die beste Wiederherstellungsanwendung, die ich gefunden habehttps://superuser.com/a/1808687/1769247. Zeigt nur Objekte ab einer nominellen Seitenzahl von 180 bis 240 von insgesamt 849 und reproduziert tatsächlich über doppelt so viele zusätzliche Bildseiten, da es sich bei einigen in bildlicher Hinsicht um Negative der Softmaskierung handelt und es sich bei 850-1845 daher um Teile handelt, bei denen es sich möglicherweise um Unterbildduplikate der 180-240 oder um Teile anderer handelt ?.
Hier ist ein 30 Tage Link zu den festen Restteilenhttps://filetransfer.io/data-package/nbXvfSBp#link
Empfehlungen für das weitere Vorgehen
Teilen Sie die Masterdatei in vier praktische Teile auf. Das hat einen dreifachen Vorteil.
- Jeder Teil lässt sich schneller rendern und reagiert schneller auf umfangreiche Anmerkungen.
- Beheben Sie sämtliche Fundamentprobleme in der Quelldatei.
- Reduzieren Sie zukünftige katastrophale Verluste jeweils auf nur 25 %.
Überdenken Sie die Fähigkeit der Annotation-Software, mit den enormen erforderlichen Speichermengen und dem Potenzial für einen „Brownout“-Verlust zu arbeiten, bei dem jede vorübergehende Störung eine geöffnete Bearbeitungsdatei zerstören kann.
Arbeiten Sie auf einem zuverlässigen lokalen Festplattensystem wie einer Workstation und niemals auf einem synchronisierten Cloud-Laufwerk.
Verwenden Sie nicht die reparierte Datei selbst, sondern nutzen Sie sie lediglich als Warnung für wiederholte Aufgaben. Kann das Ausschneiden und Einfügen von Objekten in einem PDF-GUI-Editor umfassen, wodurch die Übertragung anderer Fehler vermieden werden sollte.
Fallspezifische Möglichkeit.
Möglicherweise stellen Sie fest, dass die Seitenzahlen nicht synchron sind, aber in der richtigen Reihenfolge vorliegen oder mit etwas Glück in der perfekten Reihenfolge für die Übertragung in die Masterdatei. Wenn dies der Fall ist, gibt es Befehlszeilentools, die die Übertragung „möglicherweise“ beschleunigen, indem sie /Annots aus einer Wiederherstellungsdatei wie beispielsweise JSON exportieren und dann den Import in eine entsprechend optimierte Masterdatei nach Seitenzahlen ermöglichen. Ein solches Tool könnte Coherent cpdf sein, da es über ein Optimierungstool und /Annots-Export-Import verfügt. Ich kann jedoch nicht sagen, ob es dieses Problem ausreichend lösen wird.