Фон
Для целей моего исследования мне нужно создать межстрочные лингвистические глосс. Изначально я использовал документ docx с обычным глоссированием через невидимые таблицы, но глоссы быстро стали очень грязными. Поэтому я попробовал gb4e
, и он действительно создал такие красивые глоссы. Поэтому я планировал написать весь свой документ в LaTeX, потому что в конце концов он в любом случае аккуратнее, чем docx.
Однако мой руководитель не одобрил написание всего документа в LaTeX. Постановлено, что формат LaTeX не может быть принят для отправки. Документ должен быть в формате docx. Зная о возможности Microsoft Word читать документы PDF, я воспользовался этой функцией, но оказалось, что она не отформатировала толкование в документе Word аккуратно.
Проблема конвертации gb4e-gloss-into-docx
Попытка использования gb4e
Межстрочные лингвистические глоссирования обычно хорошо согласуются друг с другом. Рассмотрим следующий пример использования gb4e
:
\documentclass[10pt]{article}
\ExpandArgs{c}\newcommand{new@fontshape}{anything}
\usepackage{linguex}
\usepackage[russian,indonesian]{babel}
\usepackage[none]{hyphenat}
\usepackage{geometry}
\usepackage{setspace}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{tikz}
\usepackage{tikz-qtree}
\usepackage{gb4e}
\usepackage{times}
\primebars
\let\emptyset\varnothing
\geometry{
a4paper,
left=3cm,
right=3cm,
top=3cm,
bottom=3cm
}
\newcommand{\?}[1]{\foreignlanguage{russian}{#1}}
\begin{document}
\begin{exe}
\let\eachwordone=\it
\noautomath
\setlength{\glossglue}{2pt plus 2pt minus 1pt}
\renewcommand{\eachwordthree}{\rule[-10pt]{0pt}{0pt}}
\ex % Glosa 1
{\bf(Strategi praanggapan = \textnormal{\textsc{pgp}})}
\glll \?{Геи} \?{всë} \?{равно} \?{пришли} — \?{вопреки} \?{запрету} \\
gei vsë ravno prišli — vopreki zapretu \\
gay semua dengan\textunderscore sama\textsc{.pgp} pergi\textsc{.pgp} — meskipun larangan\textsc{.pgp} \\
\trans “Para kelompok gay, bagaimanapun, tetap pergi, meskipun terdapat larangan” \\
\end{exe}
\end{document}
В результате получается такой перевод, в котором все слова выровнены друг с другом:
Давайте теперь откроем PDF-документ глянца с помощью Microsoft Word.
Попробуйте открыть файл PDF с помощью Microsoft Words.
Уже после того, как Microsoft Word обработал документ PDF, это привело к тому, что глоссы потеряли свой формат, где слова не выровнены друг с другом, а диакритические знаки отделены от слов. Однако, похоже, что \textsc{}
сохранил свой формат. Взгляните на документ, прочитанный Word:
В этом случае мне все равно придется заново создавать невидимые таблицы в Microsoft Word, чтобы междустрочные глянцы оставались выровненными относительно друг друга.
Цель
Моя цель сейчас — преобразовать gb4e
документ tex с межстрочным глянцем в формат docx, сохранив при этом исходный gb4e
формат, то естьхорошо выровненные словаиприкрепленный диакритический знакдля каждого слова. Есть ли решение для этого? Я видел конвертер LaTeX в docx в сети, но я пытаюсь увидеть решение из LaTeX.