gb4e インターライングロスを適切にフォーマットされた docx ドキュメントに変換する

gb4e インターライングロスを適切にフォーマットされた docx ドキュメントに変換する

背景

研究の目的のため、行間の言語注釈を作成する必要があります。最初は、目に見えない表を使った従来の注釈付きの docx 文書を使用していましたが、注釈がすぐに乱雑になってしまいました。そこで を試してみたところgb4e、とても美しい注釈が作成されました。そのため、ドキュメント全体を LaTeX で作成することにしました。結局のところ、docx よりも LaTeX の方がすっきりしているからです。

しかし、上司は文書全体を LaTeX で書くことを承認しませんでした。LaTeX 形式は提出に受け入れられないと規定されています。文書は docx 形式である必要があります。Microsoft Word には pdf 文書を読み取る機能があることを知っていたので、その機能を利用しましたが、Word 文書では注釈がきちんとフォーマットされないことがわかりました。


gb4e-gloss から docx への変換の問題

gb4eの使用を試みる

行間の言語注釈は通常、互いによく一致しています。 を使用した次の例を検討してくださいgb4e

\documentclass[10pt]{article}
\ExpandArgs{c}\newcommand{new@fontshape}{anything}

\usepackage{linguex}
\usepackage[russian,indonesian]{babel}
\usepackage[none]{hyphenat}
\usepackage{geometry}
\usepackage{setspace}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{tikz}
\usepackage{tikz-qtree}
\usepackage{gb4e}
\usepackage{times}

\primebars
\let\emptyset\varnothing

\geometry{
 a4paper,
 left=3cm,
 right=3cm,
 top=3cm,
 bottom=3cm
 }

\newcommand{\?}[1]{\foreignlanguage{russian}{#1}}


\begin{document}

 \begin{exe}
 
 \let\eachwordone=\it
 
 \noautomath
\setlength{\glossglue}{2pt plus 2pt minus 1pt}
\renewcommand{\eachwordthree}{\rule[-10pt]{0pt}{0pt}}

\ex % Glosa 1
{\bf(Strategi praanggapan = \textnormal{\textsc{pgp}})}
\glll \?{Геи} \?{всë} \?{равно} \?{пришли} — \?{вопреки} \?{запрету} \\
gei vsë ravno prišli — vopreki zapretu \\
gay semua dengan\textunderscore sama\textsc{.pgp} pergi\textsc{.pgp} — meskipun larangan\textsc{.pgp} \\
\trans “Para kelompok gay, bagaimanapun, tetap pergi, meskipun terdapat larangan” \\

\end{exe}

\end{document}

その結果、すべての単語が互いに整列した次の注釈が作成されます。 ここに画像の説明を入力してください

それでは、Microsoft Words を使用して、注釈の PDF ドキュメントを開いてみましょう。

Microsoft Wordsを使用してPDFファイルを開こうとする

Microsoft Word が PDF 文書を処理した後、注釈の書式が失われ、単語が互いに揃わず、発音区別記号が単語から切り離されています。ただし、書式は\textsc{}保持されているようです。Word で読み取った文書を見てみましょう。

ここに画像の説明を入力してください

この場合、行間の注釈が互いに揃った状態を保つために、Microsoft Words で非表示の表を再作成する必要がありました。


ゴール

gb4e私の現在の目標は、インターライングロスTex文書を、元の形式を維持したままdocx形式に変換することです。gb4eつまり、きれいに並んだ単語付加された分音記号各単語に対して。これに対する解決策はありますか? LaTeX から docx へのコンバーターをオンラインで見たことがありますが、LaTeX からの解決策を見つけようとしています。

関連情報