복잡한 LaTeX 문서에서 텍스트 콘텐츠 내보내기

복잡한 LaTeX 문서에서 텍스트 콘텐츠 내보내기

다중 섹션 서지(biblatex)가 포함된 크고 복잡한 LaTeX 문서(XeLaTeX)가 있습니다. 결과 텍스트 콘텐츠를 일반 텍스트로 내보내고 싶습니다. 및 유사한 도구 의 출력에는 pdf2text추가 새 줄과 하이픈이 포함되어 있습니다. detex완전한 참고문헌이 필요하기 때문에 유사한 도구도 사용할 수 없습니다 .

내가 가지고 있는 유일한 아이디어는 매우 큰 페이지 크기(문단당 한 줄)로 문서를 내보내고 pdf2text이후에 만드는 것입니다(MWE 참조). 더 우아한 해결책이 있을까요?

\documentclass{article}
\usepackage{biblatex}
\usepackage[paperwidth=50in, paperheight=8.5in, left=1in]{geometry}

\begin{filecontents}{literatur.bib}

@ARTICLE{Reitman2015,
     author = {Reitman, N. G. and Bennett, S. E. and Gold, R. D. and Briggs, R. W. and DuRoss, C. B.},
      title = {Транзитная фотомозаика высокого разрешения из моделирования на основе изображений: анализ рабочих процессов и ошибок},
    journal = {Bulletin of the Seismological Society of America},
       year = {2015},
     volume = {105},
      pages = {2354-2366}
}


\end{filecontents}

\addbibresource{literatur.bib}

\begin{document}

Проверка

\thispagestyle{empty}

\nocite{Reitman2015}

\printbibliography

\end{document} 

답변1

문서를 HTML로 변환한 다음 HTML 파일을 텍스트로 변환할 수 있습니다. TeX4ht는 XeLaTeX와 BibLaTeX를 모두 지원하지만 라틴어가 아닌 알파벳을 지원하려면 구성해야 합니다.

다음 코드를 다음과 같이 저장합니다 myconfig.cfg.

\Preamble{xhtml}
\xeuniuseblock{Cyrillic}
\begin{document}
\EndPreamble

그만큼\xeuniuseblock 명령은 지정된 유니코드 문자에 대한 선언을 로드합니다.유니코드 블록. 참고문헌에 해당 명령이 있는 경우 그리스어나 아랍어에 대해서도 유사한 명령이 필요합니다.

변환은 다음 명령을 사용하여 수행할 수 있습니다.

make4ht -uxm draft -c myconfig.cfg filename.tex
biber filename
make4ht -uxm draft -c myconfig.cfg filename.tex
pandoc filename.html -t plain -o filename.txt

결과는 다음과 같습니다.

Проверка

References

 [1] 

    N. G. Reitman et al. “Транзитная фотомозаика высокого разрешения из
    моделирования на основе изображений: анализ рабочих процессов и
    ошибок”. In: Bulletin of the Seismological Society of America 105
    (2015), pp. 2354–2366.

관련 정보