Konvertieren der gb4e-Interlinearglossar in ein gut formatiertes docx-Dokument

Konvertieren der gb4e-Interlinearglossar in ein gut formatiertes docx-Dokument

Hintergrund

Für meine Forschung muss ich eine interlineare linguistische Glosse erstellen. Anfangs habe ich ein docx-Dokument mit der herkömmlichen Glosse durch unsichtbare Tabellen verwendet, aber die Glossen wurden schnell sehr unübersichtlich. Also habe ich es versucht gb4eund es wurden wirklich schöne Glossen erstellt. Daher habe ich geplant, mein gesamtes Dokument in LaTeX zu schreiben, weil es schließlich sowieso übersichtlicher ist als docx.

Mein Vorgesetzter hat mir jedoch nicht gestattet, das gesamte Dokument in LaTeX zu schreiben. Es wurde entschieden, dass das LaTeX-Format nicht zur Einreichung akzeptiert wird. Das Dokument muss im docx-Format vorliegen. Da ich wusste, dass Microsoft Word PDF-Dokumente lesen kann, habe ich diese Funktion genutzt, aber es stellte sich heraus, dass die Glossen im Word-Dokument nicht ordentlich formatiert wurden.


Das Problem der Konvertierung von gb4e-gloss in docx

Versuch mit gb4e

Interlineare linguistische Glossen sind normalerweise gut aufeinander abgestimmt. Betrachten Sie das folgende Beispiel mit gb4e:

\documentclass[10pt]{article}
\ExpandArgs{c}\newcommand{new@fontshape}{anything}

\usepackage{linguex}
\usepackage[russian,indonesian]{babel}
\usepackage[none]{hyphenat}
\usepackage{geometry}
\usepackage{setspace}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{tikz}
\usepackage{tikz-qtree}
\usepackage{gb4e}
\usepackage{times}

\primebars
\let\emptyset\varnothing

\geometry{
 a4paper,
 left=3cm,
 right=3cm,
 top=3cm,
 bottom=3cm
 }

\newcommand{\?}[1]{\foreignlanguage{russian}{#1}}


\begin{document}

 \begin{exe}
 
 \let\eachwordone=\it
 
 \noautomath
\setlength{\glossglue}{2pt plus 2pt minus 1pt}
\renewcommand{\eachwordthree}{\rule[-10pt]{0pt}{0pt}}

\ex % Glosa 1
{\bf(Strategi praanggapan = \textnormal{\textsc{pgp}})}
\glll \?{Геи} \?{всë} \?{равно} \?{пришли} — \?{вопреки} \?{запрету} \\
gei vsë ravno prišli — vopreki zapretu \\
gay semua dengan\textunderscore sama\textsc{.pgp} pergi\textsc{.pgp} — meskipun larangan\textsc{.pgp} \\
\trans “Para kelompok gay, bagaimanapun, tetap pergi, meskipun terdapat larangan” \\

\end{exe}

\end{document}

Das Ergebnis ist diese Glosse, in der alle Wörter aneinandergereiht sind: Bildbeschreibung hier eingeben

Öffnen wir nun das PDF-Dokument der Glosse mit Microsoft Word.

Versuchen Sie, die PDF-Datei mit Microsoft Words zu öffnen

Bereits nachdem Microsoft Word das PDF-Dokument verarbeitet hatte, kam es zu einem Formatverlust der Glossen, da die Wörter nicht mehr aneinander ausgerichtet waren und die diakritischen Zeichen von den Wörtern getrennt waren. Das \textsc{}Format schien jedoch erhalten zu bleiben. Werfen Sie einen Blick in das von Word gelesene Dokument:

Bildbeschreibung hier eingeben

In diesem Fall muss ich die unsichtbaren Tabellen in Microsoft Words dennoch neu erstellen, damit die Interlinearglossar weiterhin aneinander ausgerichtet bleiben.


Ziel

gb4eMein Ziel ist es nun, das Interlineargloss-Tex-Dokument in das docx-Format konvertieren zu können, wobei das ursprüngliche gb4eFormat erhalten bleibt, d. h. einschön angeordnete Wörterund einangehängtes diakritischesfür jedes Wort. Gibt es dafür eine Lösung? Ich habe online einen LaTeX-zu-Docx-Konverter gesehen, aber ich versuche, die Lösung von LaTeX zu sehen.

verwandte Informationen