帶註釋的 PDF 的版本控制

帶註釋的 PDF 的版本控制

我有很多重要的 PDF 檔案。我修改它們的唯一方法是新增/刪除註解。有沒有一種有效的方法來對此類文件進行版本控制。我也許可以使用 SVN/Git 等標準工具。我聽說 SVN 即使對於二進位也只儲存增量。就 SVN/GIT 而言,如果我所做的只是更改 PDF 文件中的註釋,增量會很大嗎?我想它們不會很大,但我不確定註釋如何儲存在 PDF 文件中以及增量演算法有多聰明。

答案1

在一個活躍的專案中,我們使用git來進行分發和版本控制。有些文件是PDF格式的,而且效果很好。正如已經說過的,沒有辦法做三角洲。

然而,一種可能與增量一起使用的可能性是匯出註釋(以 FDF 形式出現),然後使用這些匯出檔案進行版本控制。如果註釋不是太大,FDF可以是純文字檔;但是,您必須執行測試。

答案2

您可以使用以下命令解壓縮 PDF一些工具(qpdf、pdftk、mutool、cpdf)。例如:

pdftk original.pdf output uncompressed.pdf uncompress

這將為您提供一種格式的 PDF,您可以在其中以純文字形式查看和比較註釋。未壓縮的檔案通常主要由 ASCII 字元組成,但它可能仍包含二進位資料。您必須測試它如何與您選擇的版本控制軟體配合使用,以及它是否能很好地處理「嵌入」的二進位資料。

問題是當您修改註釋(我假設使用 GUI 編輯器)、儲存檔案並解壓縮時會發生什麼。如果幸運的話,除了註釋之外,文件將基本上相同,但這並不能保證。您必須明智地選擇軟體組合。

答案3

我不知道 PDF 文件有任何本機版本控制(我的 Google 搜尋也不知道)。 PDF 檔案(根據維基百科)是二進位的。增量儲存僅適用於文字檔案(例如原始碼檔案和自述檔案)。

我有使用 SVN 和 Git 的背景。我推薦使用 Git,因為它具有卓越的壓縮功能,並且是分散式版本控制系統。 Subversion 是一個集中式版本控制系統,這意味著您需要一個伺服器才能運行它。您可以在電腦上安裝 SVN 伺服器軟體,但這可能不值得花費這些費用。分散式版本控制系統透過本機儲存庫工作(即:不需要伺服器)。

相關內容