修正 Word 中不適當的段落分隔符號?

修正 Word 中不適當的段落分隔符號?

我最近將 PDF 轉換為 Microsoft Word,在更改轉換文件的邊距和紙張尺寸後遇到問題。對話中間有一個段落標記。這是一個範例:

「當菲爾莫爾快要死的時候,他非常餓。但是他的醫生試圖讓他不發燒或其他什麼。不過 ,
菲爾莫爾不會閉嘴想要吃東西,所以最後醫生給了他一小茶匙湯

這段對話本來應該在同一個段落中,但轉換後的文章中有很多相同的問題。我如何解決它? (我希望我能一次解決所有問題,這樣可以節省時間。)

答案1

根據我對上述問題的理解,它與 OCR 處理有關,OCR 只是轉換它理解的內容並創建文檔,很多時候會做出與可能被誤解的字符相關的錯誤翻譯。所以,無論如何,這還不是一門精確的科學,因為 OCR 程序已經發展得很好,但它們的解釋仍然不是 100% 積極的。我們總是需要手動修復這些錯誤。

答案2

我不認為 PDF 文件的段落結構與任何文字處理程序中的段落結構相同。它只是文字在工作表中的位置,字符要么表示為打印圖像或關聯字符,但我不相信它執行諸如顏色、段落和下一行或輸入代碼之類的格式信息。

相關內容