PDF generado en látex con texto de varias líneas que coloca una nueva línea después de cada línea

PDF generado en látex con texto de varias líneas que coloca una nueva línea después de cada línea

Tengo texto de varias líneas en of \itemo {itemize}in {section}y estoy creando un pdf del documento. Cuando copio el texto del pdf, hay un carácter de nueva línea al final de cada línea. Estoy creando un documento que será leído por una herramienta de inteligencia artificial y dividir oraciones lo estropeará.

¿Cómo puedo configurarlo para no agregar esas nuevas líneas innecesarias?

Por ejemplo, si copio el texto del pdf generado a partir del siguiente código, hay un carácter de nueva línea entrecharacter inythe middle

\begin{itemize}
    \item This is some text that spans multiple lines. I need the pdf to not have a newline 
    character in the middle of the sentence in the copied text
    \item Some more text.
\end{itemize}

ingrese la descripción de la imagen aquí

Respuesta1

Bueno, esta es una de las cosas queProyecto PDF etiquetadoes sobre. Si compila esto aquí en un TeXsystem actual con lualatex (que maneja mejor los caracteres del espacio real)

\DocumentMetadata{testphase=phase-III}
\documentclass{article}

\begin{document}
\begin{itemize}
    \item This is some text that spans multiple lines. I need the pdf to not have a newline 
    character in the middle of the sentence in the copied text
    \item Some more text.
\end{itemize}
\end{document}

luego copiar y pegar le dará


This is some text that spans multiple lines. I need the pdf to not have a newline character in the middle of the sentence in the copied text
Some more text.

Pero, en general, no deberías confiar demasiado en copiar y pegar desde un PDF. El formato no contiene texto simple y eso significa que cada lector tiene que realizar algunas heurísticas.

información relacionada