So extrahieren Sie Text aus einer PRC-Datei

So extrahieren Sie Text aus einer PRC-Datei

Ich möchte prcunter Linux den gesamten Text aus einer (DRM-freien) Datei extrahieren. Gibt es dafür ein Tool? Das Entpacken einer epubDatei ist nur ein prc, daher hoffe ich, dass es prcauch für Dateien einen ähnlichen Trick/ein ähnliches Tool gibt.

Antwort1

Was Sie hier tatsächlich sehen, ist ein PalmOS-"ausführbares" Dateiformat, das (aus Gründen, die ich nicht verstehe) als eBook-Format für "Mobipocket" wiederverwendet wurde. SieheHierfür den Hintergrund und eine detaillierte Beschreibung des Dateiformats.

Da Sie behauptet haben, dass die QuelldateinichtDRMed bedeutet, dass der gesamte Text irgendwo in einem konvertierungsbereiten Format vorhanden ist. Sie benötigen also nur eine Bibliothek, um die Daten entsprechend zu lesen.

Mein Lieblingsprogramm unter Linux zum Konvertieren zwischen verschiedenen eBook-Formaten (oder aus den eBook-Formaten heraus) istKaliber– es unterstützt unverschlüsselte prcDateien.

Wenn Calibre selbst den Text nicht in ein von Ihnen verwendetes Format extrahieren kann und ihn nur in Formate konvertieren kann, die Sie nicht verwenden können, würde ich Ihnen empfehlen, sich die Low-Level-Bibliotheken anzusehen, die Calibre als Abhängigkeiten zum Lesen von prcDateien verwendet. Sie könnten dann Beispielcode aus dieser Bibliothek verwenden, um ein Tool zu entwickeln, mit dem Sie die PRC-Daten auf hoher Ebene lesen, feststellen können, wo sich der Text befindet, und ihn in eine Datei schreiben können. Für Entwickler sollte das relativ einfach sein.

Das ist eine gute Frage. +1.

Antwort2

verwandte Informationen