지금까지 조부모님은 재무 기록을 손으로 쓰셨는데, 필기체가 아닌 손글씨가 아래 사진보다 더 깔끔하고 이해하기 쉽습니다. 각 페이지를 스캔한 후 Excel 2019에서 스캔한 이미지를 자동으로 즉시 Excel 스프레드시트로 변환할 수 있나요? OCR이 문자와 숫자를 인식하더라도 각각의 문자와 숫자를 배열하는 것은 너무 많은 시간을 소모하게 됩니다.
두 번째 사진의 출처는 여기입니다.이 2016 Reddit 게시물아무런 도움이 되지 않습니다.
답변1
나는 동의해야한다music2myear의 답변.
액세스할 수 있는 컴퓨터에서는 손으로 쓴 기록을 Excel로 전환하는 데 유용한 작업을 수행할 수 없습니다.
최소한 세 가지 어려운 작업이 있습니다.
- "내용"과 내용이 아닌 것을 구별합니다.
- 레이아웃을 인식하고 이를 셀 위치로 변환합니다.
- 손으로 쓴 문자를 인식하고 이를 텍스트로 변환합니다.
소비자 소프트웨어와 온라인 서비스를 이용할 수 있으며 깨끗한 표 형식의 기계로 인쇄된 텍스트를 스프레드시트 파일로 변환하는 합리적인 작업을 수행합니다. 그러나 최고라도 완벽과는 거리가 멀 수 있습니다. 이는 위치에 따라 올바른 셀에 텍스트를 할당하는 작업일 뿐입니다.
이러한 이미지를 볼 때, 두뇌는 "미리 인쇄된 형식"이 무엇인지, 내용이 무엇인지, 노이즈가 무엇인지, 관련 없는 인간 표시가 무엇인지 분류하는 데 매우 능숙합니다. 사물이 어떻게 정렬되어 있는지, 상황에 따라 무엇이 어울리는지 인식할 수 있습니다. 컴퓨터에게는 배경색이 아닌 모든 것이 "무언가"입니다. 그 중 무엇이 당신에게 중요한지, 그리고 잠재적으로 번역할 어떤 종류의 캐릭터가 될 수 있는지 파악하는 것은 극히 어렵습니다. 그리고 콘텐츠가 미리 인쇄된 줄과 겹치면 컴퓨터가 쉽게 처리할 수 없는 끊김과 데이터 누락이 발생합니다.
예를 들어 이미지를 찍으십시오. 첫 번째 이미지는 잃어버린 원인입니다. 대부분은 선과 레이아웃을 무시합니다. 콘텐츠에서 미리 인쇄된 그리드를 분리하고 제거하는 추가 작업이 있습니다. 두 번째 이미지에서는 내용이 대부분 그리드 경계 내에 있지만 정리가 필요한 흩어진 표시(슬래시, 밑줄 등)가 많이 있습니다.
하지만 가장 어려운 부분은 손글씨를 인식하고 이를 컴퓨터 텍스트로 변환하는 것입니다. 이미지 1의 경우 인간조차도 그 중 일부가 무엇인지 파악하는 데 어려움을 겪을 수 있으며 문맥과 단어에 대한 친숙도를 기반으로 많은 추측이 필요합니다. 이미지 2에서는 대부분의 숫자가 그리 나쁘지는 않지만 텍스트가 문제가 될 수 있습니다.
조부모님의 기록이 필기체가 아니고 깔끔하고 읽기 쉽고 일관성이 있고 기계 인쇄와 유사한 경우 OCR은 이에 대해 "합리적인" 작업을 수행할 수 있습니다. 그러나 여전히 많은 정리가 필요할 것입니다.
관점에서 볼 때, 미국 우편국은 자동화된 장비로 분류할 수 있도록 우편물에 있는 주소를 읽는 데 사용하는 가장 진보된 필기 인식 기능을 갖추고 있습니다. 그들이 이를 할 수 있는 유일한 방법은 주소가 미리 정해진 구조와 형식으로 되어 있고 가능한 모든 주소를 미리 알고 있기 때문입니다. 목표는 모든 문자를 올바르게 작성하는 것보다 손으로 쓴 주소를 실행 가능한 후보자와 일치시키는 것입니다.
엄청난 중복이 있습니다. 문자의 절반만 해독할 수 있는 경우에도 가능한 일치 항목은 하나 또는 몇 개만 있을 수 있습니다. 그럼에도 불구하고 상당 부분은 사람의 개입이 필요합니다. 작업이 완료되고 우편물이 배달을 위해 운송업체에 도착하면 운송업체는 경로에 있는 주소와 이름을 알고 있으며 주소가 잘못 해석되지 않았는지 모두 확인합니다.
이것이 바로 최첨단 기술과 극도로 통제된 비교 가능성을 갖춘 필기 OCR의 수준입니다. 귀하의 작업은 모든 문자를 번역해야 합니다. 해당 기록에 합법적으로 포함될 수 있는 모든 단어의 마스터 목록이 없습니다(전체 언어 사전 제외). OCR에는 너무 많은 정리가 필요하므로 단순히 레코드를 읽고 Excel에 입력하는 것이 더 빠릅니다. 이는 특이한 작업이 아니며 전문적인 데이터 입력 사람들은 매우 빠르고 저렴하게 이 작업을 수행할 수 있습니다.
답변2
이것으로는 할 수 없습니다.
또는 이를 수행하는 "OCR"("광학 문자 인식")이라는 도구를 사용해 볼 수 있습니다. 그러나 이러한 도구는 표시되는 문자에 대해 가장 잘 추측하는 알고리즘을 기반으로 하며 문자의 조건을 기반으로 합니다. 여기에 있는 입력으로는 만족스러운 결과를 얻을 가능성이 매우 낮습니다.
기본적으로 오늘날 소비자 및 기업 시장에서 사용할 수 있는 최고의 도구를 사용하더라도 결국에는 거의 모든 데이터를 직접 수동으로 수정하거나 입력해야 합니다.
컴퓨터는 지속적으로 발전하고 있지만 이러한 종류의 정보를 해석하는 데 있어서는 적어도 귀하와 내가 사용할 수 있는 컴퓨터 및 소프트웨어 수준에서는 인간의 눈과 두뇌보다 훨씬 열등합니다.