철자법 및 문법 오류 감지로 인해 추가된 물결선을 무시하도록 tesseract를 어떻게 훈련합니까?

Question

저는 현재 tesseract를 가르치는 방법을 배우려고 노력 중입니다(훈련용 lstm 파일을 만드는 방법에 대해 고민 중입니다). 그러나 훈련된 데이터를 미세 조정할 수 있다는 것을 알고 있습니다. 나는 사용한다jTessBoxEditorOCR 중에 tesseract가 수행하는 실수를 수정하기 위해 훈련 형태로 변경 사항을 구현하는 방법을 찾지 못했지만 그 도구가 바로 당신에게 필요한 것이라고 생각합니다.

jTessBoxEditor를 사용하면 사진에서 OCR이 어떻게 수행되는지 볼 수 있고 편집할 수도 있지만 여전히 교육을 구현하는 방법에 대해 고민하고 있으므로(여전히 포럼과 여기에서 응답을 기다리고 있습니다) 더 이상 도움을 드릴 수 없습니다. 그게 내가 얻은 거리이고 2년 전의 질문이므로 누구도 귀하의 질문에 대답할 것이라고 기대하지 않으므로 귀하의 설정은 이미 구식일 것입니다. 나는 tesseract-ocr 4.*를 시도하고 새 버전에서 가르치는 것이 많이 바뀌었지만 도구도 발전했기 때문에 jTessBoxEditor로 문제를 해결할 수 있지만 구현 방법을 모르기 때문에 이것은 실제로 대답은 아니지만 단지 부분적.

제가 조금이라도 도움이 되었으면 좋겠습니다.

Answer 1

저는 현재 tesseract를 가르치는 방법을 배우려고 노력 중입니다(훈련용 lstm 파일을 만드는 방법에 대해 고민 중입니다). 그러나 훈련된 데이터를 미세 조정할 수 있다는 것을 알고 있습니다. 나는 사용한다jTessBoxEditorOCR 중에 tesseract가 수행하는 실수를 수정하기 위해 훈련 형태로 변경 사항을 구현하는 방법을 찾지 못했지만 그 도구가 바로 당신에게 필요한 것이라고 생각합니다.

jTessBoxEditor를 사용하면 사진에서 OCR이 어떻게 수행되는지 볼 수 있고 편집할 수도 있지만 여전히 교육을 구현하는 방법에 대해 고민하고 있으므로(여전히 포럼과 여기에서 응답을 기다리고 있습니다) 더 이상 도움을 드릴 수 없습니다. 그게 내가 얻은 거리이고 2년 전의 질문이므로 누구도 귀하의 질문에 대답할 것이라고 기대하지 않으므로 귀하의 설정은 이미 구식일 것입니다. 나는 tesseract-ocr 4.*를 시도하고 새 버전에서 가르치는 것이 많이 바뀌었지만 도구도 발전했기 때문에 jTessBoxEditor로 문제를 해결할 수 있지만 구현 방법을 모르기 때문에 이것은 실제로 대답은 아니지만 단지 부분적.

제가 조금이라도 도움이 되었으면 좋겠습니다.

철자법 및 문법 오류 감지로 인해 추가된 물결선을 무시하도록 tesseract를 어떻게 훈련합니까?

답변1

관련 정보