
我正在幫助一位朋友使用 LaTeX 產生一本短篇小說集。這些故事是從 MS Word 中的作者那裡收到的——不幸的是,這只是世界上大多數人都知道的文字編輯器。無需擔心數學內容,只需純文字。然而,Word 喜歡將一些純文字轉換為其他字元:到目前為止我注意到的兩個是引號和...
。
我嘗試了建議的使用方法,inputenc
即使使用各種輸入編碼也沒有成功。我使用的\inputencoding
不是包選項,因為我覺得我可能需要在不同的故事之間更改它們。
那麼,處理這個問題的建議方法是什麼?理想情況下,我希望有某種方法將這些字元對應到適當的 LaTeX 友善字元。
筆記:
- 我個人不喜歡離開聰明的引用,因為在某些情況下,作者錯過了結束引用,然後所有後續引用都是不正確的。如果儘早發現這一問題,則可以在貼上 .tex 檔案之前輕鬆地在 Word 文件中更正它。但通常,編輯者在註意到此問題之前已對 .tex 檔案進行了重大編輯。因此,優先處理
csquotes
這個問題而不是使用特定的開盤價和收盤價。
參考
從MS Word文件複製貼上時如何使撇號正常顯示?提供了一個腳本來對某些字元進行一次性轉換,但如果可能的話,我更願意將它們完整地保留在來源 .tex 檔案中。
我發現這是一個很好的參考fontenc 與 inputenc。
代碼:
\documentclass{article}
\usepackage{inputenc}
\usepackage{csquotes}
\MakeOuterQuote{"}
%\inputencoding{utf8}
%\inputencoding{latin1}
%\inputencoding{ansinew}
\inputencoding{cp1252}
\begin{document}
"It's too late now…" (should have \ldots\ before end quote)
“Please, sir, don’t.” (should have left and right quotes)
\end{document}
答案1
關於輸入法的問題
如果我將其複製到 utf8 文件中並將 inputenc 編碼相應地聲明為 utf8,則您的範例可以正常工作。與 ansinew 同上。
我真的無法想像如何在圖像中獲得輸出——它可以被創建,但恕我直言,不能使用標準檔案。它們都不會用問號取代非 ASCII 字元。
關於報價
直引號(") 在德語tex 文件中很活躍,用於許多有用的事情,例如添加斷點和連字符。所以我永遠不會將它們用於真正的引號,我更喜歡帶有智能引號的Word檔案\MakeAutoQuote{„}{“}
。可以避免大多數錯誤,但word 檔案從來都不是完美的,所以一個簡單的。
答案2
這是我有時會做的工作。嗯,您可以使用很少的工具來解決這個問題。也許最好的、自動的方法是使用pandoc
,但說實話,我還沒有進行足夠的測試,也沒有獲得令人滿意的體驗。另一個選擇是按照@Bernard 的建議去做。
以前我用於AbiWord
打開文檔文件和導出 int LateX
,這對我來說不是一個很好的解決方案,因為不尊重文檔結構並且所有變音符號都以 ascii 模式編碼。對於簡短的英文文本,機器人也許是個不錯的選擇。
根據我的經驗,最有效且我喜歡從 到 傳遞文字Word
的LaTeX
是崇高文本2。是的,也許對其他人來說是愚蠢的,不是最好的解決方案,更不用說自動的了,但它效果很好。
第一個優勢我發現它允許你處理編碼。您可以使用您想要的(或幾乎)編碼開啟文件,然後將其重新編碼為您需要的任何內容,通常我全部使用 utf8。您仍然可以重新打開它或使用您需要的編碼來保存它,並且不會得到奇怪的符號,例如當您嘗試使用 Texmaker 時。 (在這種情況下,我將其設為 utf8,每當我打開檔案時,請告訴我它是否採用其他編碼)。
第二個優點與配色方案和語法有關。預設使用一個名為 Monokai 的漂亮方案,我習慣切換到 Monokai Bright(區別在於用於突出顯示的選擇的顏色,在 Monokai Bright 中預設為橙色而不是灰色)。 LaTeX 的語法看起來非常舒服,也讓我們很容易偵測到引號。當然,我們可以在vim
or中實現相同的目的emacs
,但這裡很容易。如果有常見和錯誤的引號,"
那麼具有此配色方案的 Sublime Text 會以活潑的粉紅色突出顯示之間的文字。所以很容易看出我們必須在哪裡進行修正。不幸的是,如果作者或編輯忘記關閉引號,我們就看不到它們的顏色,但編輯器允許我們輕鬆找到它們。當引號在 ascii 模式下正確組成時:``'' 我們將看到黃色文字而不是白色文字。
第三個優勢與即時同時使用遊標以及使用正規表示式有關,可以快速修正許多事情,例如省略號。您可以選擇...
在 Word 中寫入的內容,然後使用[Ctrl]+[D]
([Cmd]+[D]
在 Mac 中)選擇文件中的所有出現的內容,選擇後將其變更為\ldots
僅寫入。因此,變化不是在一個方面,而是在所有選擇中同時發生。快速又簡單。
你不需要任何特殊的工具來實現這一點,但如果你想要的話,你也可以增強編輯器直接在其上編譯,或者為了獲得更多工具,yopu 可以安裝包控制並用它輕鬆獲得LaTeXTool
包裹和另一個。
我知道這個編輯器在做網路的人中很受歡迎,但我認為它LaTeX
還有一些有趣的功能,嘗試一下,看看它是否能讓你信服。
附加物
為了正確實現我之前告訴過的所有這些,我通常使用這兩個套件:inpuntenc
(with utf8
) 和fontenc
(withT1
對於沒有數學的西歐語言來說就足夠了)。
答案3
潘多克docx
是一個可以將檔案轉換為 LaTeX 檔案的命令列工具。至於處理省略號和引號,我認為處理它們的最佳方法是使用 LaTeX 編輯器中的搜尋和替換功能。