Exportar contenido de texto desde un documento LaTeX complejo

Exportar contenido de texto desde un documento LaTeX complejo

Tengo un documento LaTeX grande y complejo (XeLaTeX) con bibliografía multisección (biblatex). Quiero exportar el contenido del texto resultante a texto sin formato. La salida de pdf2textherramientas similares y otras contiene nuevas líneas y guiones adicionales. Tampoco puedo usar detexuna herramienta similar porque necesito una bibliografía completa.

La única idea que tengo es exportar el documento con un tamaño de página muy grande (una línea por párrafo) y hacerlo pdf2textdespués (ver MWE). ¿Puede haber una solución más elegante?

\documentclass{article}
\usepackage{biblatex}
\usepackage[paperwidth=50in, paperheight=8.5in, left=1in]{geometry}

\begin{filecontents}{literatur.bib}

@ARTICLE{Reitman2015,
     author = {Reitman, N. G. and Bennett, S. E. and Gold, R. D. and Briggs, R. W. and DuRoss, C. B.},
      title = {Транзитная фотомозаика высокого разрешения из моделирования на основе изображений: анализ рабочих процессов и ошибок},
    journal = {Bulletin of the Seismological Society of America},
       year = {2015},
     volume = {105},
      pages = {2354-2366}
}


\end{filecontents}

\addbibresource{literatur.bib}

\begin{document}

Проверка

\thispagestyle{empty}

\nocite{Reitman2015}

\printbibliography

\end{document} 

Respuesta1

Puede convertir su documento a HTML y luego convertir el archivo HTML a texto. TeX4ht admite XeLaTeX y BibLaTeX, pero debe configurarse para admitir alfabetos no latinos.

Guarde el siguiente código como myconfig.cfg:

\Preamble{xhtml}
\xeuniuseblock{Cyrillic}
\begin{document}
\EndPreamble

El\xeuniuseblock comando carga declaraciones de caracteres Unicode para el determinadobloque Unicode. Necesitará comandos similares para griego o árabe, si los tiene en la bibliografía.

La conversión se puede realizar utilizando los siguientes comandos:

make4ht -uxm draft -c myconfig.cfg filename.tex
biber filename
make4ht -uxm draft -c myconfig.cfg filename.tex
pandoc filename.html -t plain -o filename.txt

Este es el resultado:

Проверка

References

 [1] 

    N. G. Reitman et al. “Транзитная фотомозаика высокого разрешения из
    моделирования на основе изображений: анализ рабочих процессов и
    ошибок”. In: Bulletin of the Seismological Society of America 105
    (2015), pp. 2354–2366.

información relacionada