Linux で(DRM フリーの) ファイルからすべてのテキストを取得したいのですが、prc
そのためのツールはありますか?epub
ファイルを解凍するのは簡単なのでprc
、ファイルにも同様のトリックやツールがあることを願っていますprc
。
答え1
実際にご覧になっているのは、PalmOS の「実行可能」ファイル形式です。これは (理由はわかりませんが) 「Mobipocket」の電子書籍形式として再利用されています。ここファイル形式の背景と基本的な説明については、こちらをご覧ください。
ソースファイルはないDRM が適用されているということは、すべてのテキストが変換可能な形式でどこかに保存されていることを意味します。したがって、必要なのはデータを適切に読み取るライブラリだけです。
Linux上で異なるeBookフォーマット間で(またはeBookフォーマット全体から)変換するのに私が気に入っているプログラムは口径-- 暗号化されていないprc
ファイルもサポートします。
Calibre 自体がテキストを使用可能な形式に抽出できず、使用できない形式に変換することしかできない場合は、prc
ファイルを読み取るために Calibre が依存関係として使用する低レベル ライブラリを確認することをお勧めします。その後、そのライブラリのサンプル コードを使用して、PRC データを高レベルで読み取り、テキストの場所を特定し、ファイルに書き込むツールを開発できます。開発者であれば、かなり簡単なはずです。
これは良い質問です。+1。
答え2
Kindle解凍うまく機能します。GitHubからダウンロード可能。
参照:KindleUnpack (MobiUnpack): Kindle/Mobi ファイルからテキスト、画像、メタデータを抽出しますMobileRead フォーラムで。