如何訓練 tesseract 忽略拼字和語法錯誤偵測新增的波浪線？

Question

我目前正在嘗試學習如何教授 tesseract（我一直專注於如何建立用於訓練的 lstm 檔案），但我知道您可以微調您的訓練資料。我用jTessBoxEditor為了糾正 tesseract 在 OCR 過程中出現的錯誤，我只是還沒有找到一種方法來以培訓形式實施更改，但我認為該工具正是您所需要的。

使用jTessBoxEditor你可以看到你的圖片是如何完成OCR的，你也可以編輯它，但我仍然堅持如何實施培訓（仍在等待論壇和這裡的回复）所以我真的無法提供更多幫助，因為這就是我所取得的進展，我不希望有人回答你的問題，因為它已經有兩年了，所以你的設定可能已經過時了。我正在嘗試tesseract-ocr 4.* ，新版本的教學發生了很大變化，而且工具也不斷發展，所以你的問題可以用jTessBoxEditor 解決，但我不知道如何實現它，所以這並不是真正的答案，而只是一個答案部分的。

我希望我能幫助你，哪怕只是一點點。

Answer 1

我目前正在嘗試學習如何教授 tesseract（我一直專注於如何建立用於訓練的 lstm 檔案），但我知道您可以微調您的訓練資料。我用jTessBoxEditor為了糾正 tesseract 在 OCR 過程中出現的錯誤，我只是還沒有找到一種方法來以培訓形式實施更改，但我認為該工具正是您所需要的。

使用jTessBoxEditor你可以看到你的圖片是如何完成OCR的，你也可以編輯它，但我仍然堅持如何實施培訓（仍在等待論壇和這裡的回复）所以我真的無法提供更多幫助，因為這就是我所取得的進展，我不希望有人回答你的問題，因為它已經有兩年了，所以你的設定可能已經過時了。我正在嘗試tesseract-ocr 4.* ，新版本的教學發生了很大變化，而且工具也不斷發展，所以你的問題可以用jTessBoxEditor 解決，但我不知道如何實現它，所以這並不是真正的答案，而只是一個答案部分的。

我希望我能幫助你，哪怕只是一點點。

如何訓練 tesseract 忽略拼字和語法錯誤偵測新增的波浪線？

答案1

相關內容