Преобразование межстрочного глоссария gb4e в хорошо отформатированный документ docx

Преобразование межстрочного глоссария gb4e в хорошо отформатированный документ docx

Фон

Для целей моего исследования мне нужно создать межстрочные лингвистические глосс. Изначально я использовал документ docx с обычным глоссированием через невидимые таблицы, но глоссы быстро стали очень грязными. Поэтому я попробовал gb4e, и он действительно создал такие красивые глоссы. Поэтому я планировал написать весь свой документ в LaTeX, потому что в конце концов он в любом случае аккуратнее, чем docx.

Однако мой руководитель не одобрил написание всего документа в LaTeX. Постановлено, что формат LaTeX не может быть принят для отправки. Документ должен быть в формате docx. Зная о возможности Microsoft Word читать документы PDF, я воспользовался этой функцией, но оказалось, что она не отформатировала толкование в документе Word аккуратно.


Проблема конвертации gb4e-gloss-into-docx

Попытка использования gb4e

Межстрочные лингвистические глоссирования обычно хорошо согласуются друг с другом. Рассмотрим следующий пример использования gb4e:

\documentclass[10pt]{article}
\ExpandArgs{c}\newcommand{new@fontshape}{anything}

\usepackage{linguex}
\usepackage[russian,indonesian]{babel}
\usepackage[none]{hyphenat}
\usepackage{geometry}
\usepackage{setspace}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{tikz}
\usepackage{tikz-qtree}
\usepackage{gb4e}
\usepackage{times}

\primebars
\let\emptyset\varnothing

\geometry{
 a4paper,
 left=3cm,
 right=3cm,
 top=3cm,
 bottom=3cm
 }

\newcommand{\?}[1]{\foreignlanguage{russian}{#1}}


\begin{document}

 \begin{exe}
 
 \let\eachwordone=\it
 
 \noautomath
\setlength{\glossglue}{2pt plus 2pt minus 1pt}
\renewcommand{\eachwordthree}{\rule[-10pt]{0pt}{0pt}}

\ex % Glosa 1
{\bf(Strategi praanggapan = \textnormal{\textsc{pgp}})}
\glll \?{Геи} \?{всë} \?{равно} \?{пришли} — \?{вопреки} \?{запрету} \\
gei vsë ravno prišli — vopreki zapretu \\
gay semua dengan\textunderscore sama\textsc{.pgp} pergi\textsc{.pgp} — meskipun larangan\textsc{.pgp} \\
\trans “Para kelompok gay, bagaimanapun, tetap pergi, meskipun terdapat larangan” \\

\end{exe}

\end{document}

В результате получается такой перевод, в котором все слова выровнены друг с другом: введите описание изображения здесь

Давайте теперь откроем PDF-документ глянца с помощью Microsoft Word.

Попробуйте открыть файл PDF с помощью Microsoft Words.

Уже после того, как Microsoft Word обработал документ PDF, это привело к тому, что глоссы потеряли свой формат, где слова не выровнены друг с другом, а диакритические знаки отделены от слов. Однако, похоже, что \textsc{}сохранил свой формат. Взгляните на документ, прочитанный Word:

введите описание изображения здесь

В этом случае мне все равно придется заново создавать невидимые таблицы в Microsoft Word, чтобы междустрочные глянцы оставались выровненными относительно друг друга.


Цель

Моя цель сейчас — преобразовать gb4eдокумент tex с межстрочным глянцем в формат docx, сохранив при этом исходный gb4eформат, то естьхорошо выровненные словаиприкрепленный диакритический знакдля каждого слова. Есть ли решение для этого? Я видел конвертер LaTeX в docx в сети, но я пытаюсь увидеть решение из LaTeX.

Связанный контент