將非數學文字從 MS Word 剪下並貼上到 .tex 文件

將非數學文字從 MS Word 剪下並貼上到 .tex 文件

我正在幫助一位朋友使用 LaTeX 產生一本短篇小說集。這些故事是從 MS Word 中的作者那裡收到的——不幸的是,這只是世界上大多數人都知道的文字編輯器。無需擔心數學內容,只需純文字。然而,Word 喜歡將一些純文字轉換為其他字元:到目前為止我注意到的兩個是引號和...

我嘗試了建議的使用方法,inputenc即使使用各種輸入編碼也沒有成功。我使用的\inputencoding不是包選項,因為我覺得我可能需要在不同的故事之間更改它們。

在此輸入影像描述

那麼,處理這個問題的建議方法是什麼?理想情況下,我希望有某種方法將這些字元對應到適當的 LaTeX 友善字元。

筆記:

  • 我個人不喜歡離開聰明的引用,因為在某些情況下,作者錯過了結束引用,然後所有後續引用都是不正確的。如果儘早發現這一問題,則可以在貼上 .tex 檔案之前輕鬆地在 Word 文件中更正它。但通常,編輯者在註意到此問題之前已對 .tex 檔案進行了重大編輯。因此,優先處理csquotes這個問題而不是使用特定的開盤價和收盤價。

參考

代碼:

\documentclass{article}
\usepackage{inputenc}
\usepackage{csquotes}
\MakeOuterQuote{"}

%\inputencoding{utf8}
%\inputencoding{latin1}
%\inputencoding{ansinew}
\inputencoding{cp1252}

\begin{document}

"It's too late now…" (should have \ldots\ before end quote)

“Please, sir, don’t.”  (should have left and right quotes)
\end{document}

答案1

關於輸入法的問題

如果我將其複製到 utf8 文件中並將 inputenc 編碼相應地聲明為 utf8,則您的範例可以正常工作。與 ansinew 同上。

我真的無法想像如何在圖像中獲得輸出——它可以被創建,但恕我直言,不能使用標準檔案。它們都不會用問號取代非 ASCII 字元。

關於報價

直引號(") 在德語tex 文件中很活躍,用於許多有用的事情,例如添加斷點和連字符。所以我永遠不會將它們用於真正的引號,我更喜歡帶有智能引號的Word檔案\MakeAutoQuote{„}{“}。可以避免大多數錯誤,但word 檔案從來都不是完美的,所以一個簡單的。

答案2

這是我有時會做的工作。嗯,您可以使用很少的工具來解決這個問題。也許最好的、自動的方法是使用pandoc,但說實話,我還沒有進行足夠的測試,也沒有獲得令人滿意的體驗。另一個選擇是按照@Bernard 的建議去做。

以前我用於AbiWord打開文檔文件和導出 int LateX,這對我來說不是一個很好的解決方案,因為不尊重文檔結構並且所有變音符號都以 ascii 模式編碼。對於簡短的英文文本,機器人也許是個不錯的選擇。

根據我的經驗,最有效且我喜歡從 到 傳遞文字WordLaTeX崇高文本2。是的,也許對其他人來說是愚蠢的,不是最好的解決方案,更不用說自動的了,但它效果很好。

第一個優勢我發現它允許你處理編​​碼。您可以使用您想要的(或幾乎)編碼開啟文件,然後將其重新編碼為您需要的任何內容,通常我全部使用 utf8。您仍然可以重新打開它或使用您需要的編碼來保存它,並且不會得到奇怪的符號,例如當您嘗試使用 Texmaker 時。 (在這種情況下,我將其設為 utf8,每當我打開檔案時,請告訴我它是否採用其他編碼)。

第二個優點與配色方案和語法有關。預設使用一個名為 Monokai 的漂亮方案,我習慣切換到 Monokai Bright(區別在於用於突出顯示的選擇的顏色,在 Monokai Bright 中預設為橙色而不是灰色)。 LaTeX 的語法看起來非常舒服,也讓我們很容易偵測到引號。當然,我們可以在vimor中實現相同的目的emacs,但這裡很容易。如果有常見和錯誤的引號,"那麼具有此配色方案的 Sublime Text 會以活潑的粉紅色突出顯示之間的文字。所以很容易看出我們必須在哪裡進行修正。不幸的是,如果作者或編輯忘記關閉引號,我們就看不到它們的顏色,但編輯器允許我們輕鬆找到它們。當引號在 ascii 模式下正確組成時:``'' 我們將看到黃色文字而不是白色文字。

第三個優勢與即時同時使用遊標以及使用正規表示式有關,可以快速修正許多事情,例如省略號。您可以選擇...在 Word 中寫入的內容,然後使用[Ctrl]+[D][Cmd]+[D]在 Mac 中)選擇文件中的所有出現的內容,選擇後將其變更為\ldots僅寫入。因此,變化不是在一個方面,而是在所有選擇中同時發生。快速又簡單。

你不需要任何特殊的工具來實現這一點,但如果你想要的話,你也可以增強編輯器直接在其上編譯,或者為了獲得更多工具,yopu 可以安裝包控制並用它輕鬆獲得LaTeXTool包裹和另一個。

我知道這個編輯器在做網路的人中很受歡迎,但我認為它LaTeX還有一些有趣的功能,嘗試一下,看看它是否能讓你信服。


附加物

為了正確實現我之前告訴過的所有這些,我通常使用這兩個套件:inpuntenc(with utf8) 和fontenc(withT1對於沒有數學的西歐語言來說就足夠了)。

答案3

潘多克docx是一個可以將檔案轉換為 LaTeX 檔案的命令列工具。至於處理省略號和引號,我認為處理它們的最佳方法是使用 LaTeX 編輯器中的搜尋和替換功能。

相關內容