기본적으로 저는 다음 작업 흐름을 가능하게 해주는 도구(Windows/Mac)를 찾고 있습니다.
- 내 모든 문서를 폴더로 스캔합니다(스캔 이미지 200-300개)
- 모든 파일을 검사하고 해당 파일에 대해 OCR을 실행하는 도구를 실행하십시오.
- OCR을 기반으로 각 파일에 메타데이터가 적용됩니다.
- 그런 다음 메타데이터를 읽고 그에 따라 일괄 처리를 통해 파일을 분류합니다.
SU & SE에는 파일에 대한 일반 OCR을 수행하기 위한 몇 가지 제안이 있지만 문서의 OCR 데이터를 기반으로 프로그래밍 방식으로 작업을 수행할 수 있는 솔루션을 찾을 수 없었습니다.
문서 템플릿은 표준이므로 어떤 종류의 파일이 필요한지 알 수 있습니다. 우리는 전체 묶음을 스캔한 다음 각 폴더에 깔끔하게 분류/업로드하는 백엔드 프로세스를 실행하려고 합니다. OCR을 사용하면 파일 내에서 검색할 수 있는 옵션이 제공되며 Acrobat 리더/미리 보기와 같은 프로그램에서 파일을 열 수 있습니다. 하지만 배치/셸/apple 스크립트에서 이 분류 논리를 실행하고 싶습니다. 파일 이름 앞에 문서 번호를 붙이는 것과 같은 것.
답변1
귀하가 설명하는 것은 독특한 사용 시나리오인 것 같습니다. 나는 당신이 기본적으로 설명하는 방식으로 작동하는 솔루션이 있다고 믿지 않습니다. 이것이 비상업적/연구용 프로젝트라면 특히 창문에 대해서는 선택의 여지가 별로 없습니다. tesseract에 대해 Google에서 무엇을 할 수 있는지 살펴보세요.
예산이 충분하다면 여러 가지 선택이 가능합니다. 즉시 사용할 수 있는 솔루션이 필요한지 SDK가 필요한지 확실하지 않습니다. 첫 번째 솔루션이 필요하다고 가정하므로 다음을 살펴보는 것이 좋습니다.인식 서버, 대규모 부서 및 기업 전반에 걸쳐 중대형 문서 처리를 위해 설계된 서버 기반 OCR 솔루션입니다. 독립 실행형 프로그램으로 배포하거나 DMS, RMS 및 전자 보관 시스템과 같은 타사 시스템과 통합할 수 있습니다.
저는 @ABBYY에서 일하고 있으며 필요한 경우 추가 정보를 제공할 수 있습니다. 도움이 되길 바랍니다!