當我們使用 Adob​​e Acrobat 2017 使用 OCR 時,不會多次擷取同一頁上的相同文本

當我們使用 Adob​​e Acrobat 2017 使用 OCR 時,不會多次擷取同一頁上的相同文本

當我使用 Adob​​e Acrobat 2017 使用 OCR 時,我發現它沒有在同一頁上擷取相同的文字。例如,當我們在同一頁上出現 Dr. Thandabout 15 次時,它只選擇這個名字 12 次。有人可以就這個問題提供指導嗎?

答案1

OCRing 永遠不會 100% 準確,在 PDF OCR 後應進行編輯審查。

根據我對 OCR 結果的估計(認為):

  • 無襯線字體:準確率 95%
  • 襯線:準確率 90%
  • 等寬字體:80% 準確
  • 裝飾襯線:準確率 75%
  • 草寫:準確率 50%

當然,上述估計僅適用於未掃描 PDF 並且只是基於圖像且不含垃圾的 PDF 的情況。

如果您無法透過編輯執行 PDF,您可以隨時F7按鍵檢查拼字或使用Edit => Check Spelling => In Fields, Comment, Editable Text

相關內容