背景
研究の目的のため、行間の言語注釈を作成する必要があります。最初は、目に見えない表を使った従来の注釈付きの docx 文書を使用していましたが、注釈がすぐに乱雑になってしまいました。そこで を試してみたところgb4e
、とても美しい注釈が作成されました。そのため、ドキュメント全体を LaTeX で作成することにしました。結局のところ、docx よりも LaTeX の方がすっきりしているからです。
しかし、上司は文書全体を LaTeX で書くことを承認しませんでした。LaTeX 形式は提出に受け入れられないと規定されています。文書は docx 形式である必要があります。Microsoft Word には pdf 文書を読み取る機能があることを知っていたので、その機能を利用しましたが、Word 文書では注釈がきちんとフォーマットされないことがわかりました。
gb4e-gloss から docx への変換の問題
gb4eの使用を試みる
行間の言語注釈は通常、互いによく一致しています。 を使用した次の例を検討してくださいgb4e
。
\documentclass[10pt]{article}
\ExpandArgs{c}\newcommand{new@fontshape}{anything}
\usepackage{linguex}
\usepackage[russian,indonesian]{babel}
\usepackage[none]{hyphenat}
\usepackage{geometry}
\usepackage{setspace}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{tikz}
\usepackage{tikz-qtree}
\usepackage{gb4e}
\usepackage{times}
\primebars
\let\emptyset\varnothing
\geometry{
a4paper,
left=3cm,
right=3cm,
top=3cm,
bottom=3cm
}
\newcommand{\?}[1]{\foreignlanguage{russian}{#1}}
\begin{document}
\begin{exe}
\let\eachwordone=\it
\noautomath
\setlength{\glossglue}{2pt plus 2pt minus 1pt}
\renewcommand{\eachwordthree}{\rule[-10pt]{0pt}{0pt}}
\ex % Glosa 1
{\bf(Strategi praanggapan = \textnormal{\textsc{pgp}})}
\glll \?{Геи} \?{всë} \?{равно} \?{пришли} — \?{вопреки} \?{запрету} \\
gei vsë ravno prišli — vopreki zapretu \\
gay semua dengan\textunderscore sama\textsc{.pgp} pergi\textsc{.pgp} — meskipun larangan\textsc{.pgp} \\
\trans “Para kelompok gay, bagaimanapun, tetap pergi, meskipun terdapat larangan” \\
\end{exe}
\end{document}
その結果、すべての単語が互いに整列した次の注釈が作成されます。
それでは、Microsoft Words を使用して、注釈の PDF ドキュメントを開いてみましょう。
Microsoft Wordsを使用してPDFファイルを開こうとする
Microsoft Word が PDF 文書を処理した後、注釈の書式が失われ、単語が互いに揃わず、発音区別記号が単語から切り離されています。ただし、書式は\textsc{}
保持されているようです。Word で読み取った文書を見てみましょう。
この場合、行間の注釈が互いに揃った状態を保つために、Microsoft Words で非表示の表を再作成する必要がありました。
ゴール
gb4e
私の現在の目標は、インターライングロスTex文書を、元の形式を維持したままdocx形式に変換することです。gb4e
つまり、きれいに並んだ単語と付加された分音記号各単語に対して。これに対する解決策はありますか? LaTeX から docx へのコンバーターをオンラインで見たことがありますが、LaTeX からの解決策を見つけようとしています。