법적 청구서 OCR 솔루션

법적 청구서 OCR 솔루션

다양한 종류의 법적 청구서가 있습니다. Excel 시트로 디지털화하고 싶습니다. 레이아웃이 다르고 너무 많아서 처리할 방법을 찾을 수 없습니다. 누군가 나에게 실용적인 솔루션을 제공할 수 있나요?

답변1

내가 알고 있는 합리적이고 합리적인 가격의 솔루션은 없습니다. :(

Nuance OmniPage 또는 Abby FlexiCapture를 확인해 보세요(데스크톱 버전부터 $100,000 기업용 버전까지 있습니다). 얼마 전 나는 그들 사이의 SDK/OCR 품질을 비교했습니다. 큰 차이는 없지만 Abbyy가 조금 더 나아졌다고 느꼈습니다(Nuance는 몇 번 충돌했지만 Abbyy는 충돌하지 않았습니다).

OmniPage와 FlexiCapture(FineReader)에는 PDF를 편집 가능한 Excel 파일로 변환하는 데스크톱 버전이 있습니다. 무료 평가판을 사용하면서 배운 것은 편집 가능한 Excel 파일을 생성하지만 매우 고품질의 깨끗한 소스에 대해서만 가능하다는 것입니다. 둘 다 일괄 처리 기능도 제공합니다.

또한 나는 scanstore.com이 놀라운 리소스라는 것을 알았습니다.

http://www.scanstore.com/Scanning_Software/Forms_Processing/Invoice_Processing/

오픈 소스를 찾고 있다면 최고의 '엔진'은 tesseract입니다. 그 주위에 전체 양식 캡처 비트를 구축해야 합니다. 나는 이것에 대해 몇 가지 생각을 해봤습니다. 그리고 당신은 다음이 필요합니다:

  1. '바코드'를 사용하거나 송장 유형을 등록하세요.
  2. 각 유형에 대해 - 송장의 어느 부분이 테이블인지 파악
  3. 관련 영역을 잘라서 tesserat/abbyy/nuance로 보냅니다.
  4. 테이블로 구문 분석할 수 있는 항목을 다시 가져옵니다.
  5. 언어 모델링 적용(놀랍게도 Abbyy, Nuance는 여기서 형편없는 일을 합니다)

아 그리고 참고로 데이터 입력 작업을 실제로 수행하는 'BPO' 서비스 회사가 많이 있습니다. 생각보다 비싸지 않습니다.

답변2

다음은 무료 OCR 소프트웨어입니다: CuneiForm, GOCR, Ocrad, OCRopus, Tesseract. 하지만 결과는 그리 좋지 않습니다. 하지만 FineReader, ExperVision, OmniPage를 사용해 보면 결과가 더 좋아질 것입니다. 그러나 내 경험에 따르면 순수 기술 솔루션에만 의존할 수는 없습니다. 합리적인 가격으로 프로젝트 비용을 관리하고 싶다면. OCR 기술과 인력을 통합하는 것은 좋은 선택입니다. 제가 아는 한 Expervision은 맞춤형 OCR 기술과 BPO 서비스를 모두 제공할 수 있으며 웹에서 확인할 수 있습니다.체험

관련 정보