
MS Word で書かれたレポートを LaTeX 文書に変換したいと考えています。文書の内容を LaTeX エディタ (TeXShop、LaTeX、pdfTeX) にコピーして貼り付けたところ、アポストロフィが と出力される以外はすべて正常に出力されました'
(?
つまり、 ではなく がI'm
出力I?m
されます)。
私の LaTeX エディタでは、アポストロフィは正しく表示されますが、コンパイルされた PDF ドキュメントでのみ に変換されます?
。
奇妙なことに、エディターでアポストロフィを削除し、同じアポストロフィをエディターで再入力すると、正常に出力されることに気付きました。このトリックは、検索と置換を行うと機能しないため、これまでの解決策は、テキスト内の各アポストロフィを手動で削除して再入力するだけです。
しかし、これは非常に時間がかかるので、もっと良い解決策を見つけたいと思います。
答え1
Word は入力を自動的'
に正しいタイポグラフィに修正します’
。LaTeX も同様に動作します。
- Word自体ですべて
’
を検索して置換するか、'
- 別の入力エンコーディング(UTF8 など)を使用します。
\usepackage[utf8]{inputenc}
答え2
私も同じような問題に遭遇したことがあります。Word は、「、」でも「.」でもないあらゆる種類の特殊文字に対してダーク置換マジックを実行しているように私には思えます。具体的に何をするかは、言語設定と Word のバージョンによって異なるようです。
私はそれに対処するために独自のブードゥーを使用しています。その中には、このsedスクリプトがあります
#!/bin/sed -f
s/\x84/,,/g
s/\x93/''/g
s/\xE2\x80\x98/'/g
s/\xE2\x80\x99/'/g
s/\x85/\\ldots/g
s/\x96/--/g
s/\xE2\x80\x9C//g
s/\xE2\x80\x9D//g
s/\xE2\x80//g
あなたの目的には、最初の 4 ~ 5 つのルールが最も興味深いはずです。いつものように、YMMV です。
答え3
何らかのソースから切り取って貼り付けた場合は、その単語を削除し、アポストロフィを付けて TeX ファイルに再入力します。私の場合は毎回うまくいきます。