
У меня есть отчет, написанный в MS Word, который я хотел бы превратить в документ LaTeX. Я скопировал и вставил содержимое документа в мой редактор LaTeX (TeXShop, LaTeX, pdfTeX), и все вышло нормально, за исключением апострофов, которые '
вышло как ?
(например, вместо вывода выводится ).I'm
I?m
В моем редакторе LaTeX апострофы отображаются так, как и должны, только в скомпилированном PDF-документе они преобразуются в ?
.
По странной причине я заметил, что если я удаляю (в редакторе) апостроф и снова ввожу тот же апостроф в редакторе, то они выводятся нормально. Этот трюк не работает, если я использую Find and Replace, поэтому решение, которое у меня есть до сих пор, — это просто вручную удалять и снова вводить каждый апостроф в тексте.
Однако это отнимает очень много времени, поэтому я бы хотел найти лучшее решение!
решение1
Word автоматически исправляет вводимые данные '
на типографски правильные ’
. LaTeX делает то же самое.
- Вы можете попробовать выполнить поиск и замену
’
в'
самом Word или - Используйте другую кодировку входных данных, например UTF8:
\usepackage[utf8]{inputenc}
решение2
У меня тоже были такие проблемы. Мне кажется, что Word делает темную магию замены со всеми видами специальных символов, которые не являются ни ",", ни ".". Что именно он делает, похоже, зависит от языковых настроек и версий Word.
Я использую свое собственное вуду, чтобы справиться с этим, среди которого есть этот sed-скрипт
#!/bin/sed -f
s/\x84/,,/g
s/\x93/''/g
s/\xE2\x80\x98/'/g
s/\xE2\x80\x99/'/g
s/\x85/\\ldots/g
s/\x96/--/g
s/\xE2\x80\x9C//g
s/\xE2\x80\x9D//g
s/\xE2\x80//g
Для ваших целей первые 4-5 правил должны быть самыми интересными. Как всегда, YMMV.
решение3
Если это была вырезка и вставка из любого источника, удалите слово и перепечатайте в TeX-файле с апострофом. У меня всегда работает.