有了這個,你就不能。

有了這個,你就不能。

到目前為止,我的祖父母手寫了他們的財務記錄,但他們的非草書筆跡比下面的圖片更整潔、更容易理解。掃描每一頁後,Excel 2019 是否可以自動將掃描的影像立即轉換為 Excel 電子表格?即使 OCR 識別了文字和數字,排列每個文字和數字也會消耗太多時間。

這是第二張圖的來源這篇 2016 年 Reddit 帖子沒有任何幫助。

在此輸入影像描述

在此輸入影像描述

答案1

我必須同意音樂2年的回答

對於您可以存取的任何計算機,您無法執行任何從手寫記錄到 Excel 的有用操作。

至少有三個艱鉅的任務:

  1. 區分「內容」和非內容。
  2. 識別佈局並將其轉換為單元位置。
  3. 識別手寫字元並將其翻譯為文字。

消費者軟體和線上服務可用,並且可以合理地將乾淨表格格式的機器列印文字轉換為電子表格檔案。但即使是最好的也遠非完美。這只是根據位置將文字分配給正確單元格的任務。

當您查看這些圖像時,您的大腦非常擅長區分什麼是「預印形式」、什麼是內容、什麼是噪音以及什麼是不相關的人類標記。您可以根據上下文識別事物如何對齊,以及什麼與什麼相符。對於電腦來說,所有不是背景顏色的東西都是「某種東西」。要弄清楚其中哪些對您來說很重要,以及哪些可能是需要翻譯的某種字元是極其困難的。如果內容與預先列印的行重疊,就會出現電腦無法輕鬆處理的中斷和遺失資料。

以您的圖像為例。第一張圖片是失敗的原因。其中大部分都忽略了線條和佈局。您還需要執行從內容中分離和刪除預先列印網格的額外任務。在第二張影像中,內容大部分位於網格範圍內,但有許多需要清理的雜散標記(斜線、底線等)。

然而,最困難的部分是識別手寫並將其轉換為電腦文字。對於圖 1,即使是人類也很難弄清楚其中的一些內容,並且需要根據上下文和對單字的熟悉程度進行大量猜測。在圖 2 中,大多數數字都還不錯,但文字會是個問題。

如果您祖父母的記錄不是草書,並且整潔、清晰、一致且類似於機器列印,OCR 可能會對其進行「合理」的處理。但你仍然需要進行大量的清理工作。

從長遠來看,美國郵政服務擁有一些最先進的手寫識別技術,用於讀取郵件上的地址,以便可以使用自動化設備對郵件進行分類。他們能夠做到這一點的唯一方法是因為地址採用規定的結構和格式,並且他們提前知道每個可能的地址。我們的目標更多是將手寫地址與可行的候選人進行匹配,而不是讓每個字元都正確。

有大量的冗餘。如果您只能破解一半的字符,則仍然可能只有一個或幾個可能的匹配。即便如此,仍有很大一部分需要人工幹預。完成後,郵件到達承運人處進行投遞,承運人知道其路線上的地址和姓名,並且他們會進行所有檢查以確保地址不會被誤解。

這就是手寫 OCR 的水平,採用最先進的技術和嚴格控制的可比較可能性範圍。您的任務需要翻譯每個字元。您沒有可能合法出現在這些記錄中的所有單字的主列表(除了整個語言的字典)。 OCR 需要大量清理工作,因此直接讀取記錄並將其輸入 Excel 會更快。這並不是一項不尋常的任務,專業的資料輸入人員可以非常快速且廉價地完成它。

答案2

有了這個,你就不能。

或者,您可以嘗試使用稱為“OCR”(“光學字元辨識”)的工具來執行此操作,但是這些工具基於對所表示的字元做出最佳猜測的演算法,並且基於以下條件:根據您在這裡的輸入,您不太可能獲得滿意的結果。

基本上,即使使用當今消費者和企業市場上最好的工具,您最終也必須自行手動更正或輸入幾乎所有資料。

電腦可能會不斷改進,但在解釋此類資訊方面,它們仍然遠遠不如人眼和大腦,至少在你我可用的電腦和軟體層面上是如此。

相關內容