¿Cómo puedo mostrar los posibles puntos de separación de palabras para palabras en un idioma que no sea inglés de EE. UU.?

¿Cómo puedo mostrar los posibles puntos de separación de palabras para palabras en un idioma que no sea inglés de EE. UU.?

Este es un seguimiento dela pregunta de tohecz, que estoy preguntando por sugerencia demico.

La pregunta original pregunta cómo descubrir los puntos de separación de palabras para palabras particulares, y las respuestas explican cómo hacerlo de varias maneras y para varios motores.

Por ejemplo,respuesta de user9588presenta\showhyphens yEl comentario de Mico.explica cómo utilizar el comando de forma interactiva.

Entonces, aquí hay una sesión de muestra:

$ tex
This is TeX, Version 3.14159265 (TeX Live 2014) (preloaded format=tex)
**\relax

*\showhyphens{un casgliad credadwy traddodiadau athroniaeth mathemateg canolfan hapusrwydd blwyddyn deuddeg llongyfarchiadau cyfeiriadau}

Underfull \hbox (badness 10000) detected at line 0
[] \tenrm un cas-gliad credadwy trad-do-di-adau athro-ni-aeth math-e-mateg cano
l-fan ha-pus-r-wydd blwyd-dyn deud-deg llongy-farchi-adau cyfeiri-adau

*\bye
(see the transcript file for additional information)
No pages of output.
Transcript written on texput.log.

Ahora bien, claramente hay un problema porque estos no son necesariamente loscorrectopuntos de separación de palabras. Por ejemplo, ddes una sola letra, pero TeX se está dividiendo traddodiadauy blwyddynen deuddegel medio de esa letra.

El problema no es que los patrones de separación de palabras correctos no estén disponibles:

Patrones de separación de palabras en galés

Como puede verse, traddodiadauy deuddegse dividen correctamente en esta salida y, en general, las palabras se dividen en puntos que no están predichos por la sesión de muestra con \showhyphens.

El problema es que TeX necesita cargar los patrones de separación de palabras correctos y aplicar el conjunto correcto para el idioma activo:

\documentclass[welsh,a6paper,twocolumn]{article}
\usepackage{babel}
\usepackage[hscale=.25]{geometry}
\begin{document}
    un casgliad credadwy traddodiadau athroniaeth mathemateg canolfan hapusrwydd blwyddyn deuddeg llongyfarchiadau cyfeiriadau
\end{document}

¿Cómo puedo mostrar los posibles puntos de separación de palabras para palabras en un idioma que no sea inglés de EE. UU.?

He usado un ejemplo que no está en inglés arriba, pero la misma pregunta también se aplicará a otras variantes del inglés. Por ejemplo, los patrones de separación de palabras británicos difieren de los estadounidenses. (Compare los resultados de \showhyphens{favourite}y \showhyphens{favorite}, por ejemplo).

Respuesta1

Puedes usar el testhyphenspaquete.

\documentclass{article}
\usepackage[british,welsh]{babel}
\usepackage{testhyphens}

\begin{document}

\begin{checkhyphens}{}
un casgliad credadwy traddodiadau athroniaeth mathemateg canolfan
hapusrwydd blwyddyn deuddeg llongyfarchiadau cyfeiriadau
\end{checkhyphens}

\selectlanguage{british}

\begin{checkhyphens}{}
un casgliad credadwy traddodiadau athroniaeth mathemateg canolfan
hapusrwydd blwyddyn deuddeg llongyfarchiadau cyfeiriadau
\end{checkhyphens}

\end{document}

ingrese la descripción de la imagen aquí

Respuesta2

aquí hay una adaptación de su archivo que generará las separaciones de palabras que busca:

\documentclass[welsh]{article}
\usepackage{babel}
\begin{document}
\showhyphens{un casgliad credadwy traddodiadau athroniaeth}

\showhyphens{mathemateg canolfan hapusrwydd blwyddyn}

\showhyphens{deuddeg llongyfarchiadau cyfeiriadau}

\end{document}

simplemente procese esto con látex y busque los resultados en el registro:

Underfull \hbox (badness 10000) in paragraph at lines 7--7
[] \OT1/cmr/m/n/10 un casgl-iad cred-adwy tra-ddod-iadau athron-iaeth

\hbox(6.94444+1.94444)x16383.99998, glue set 1938.74178 []


Underfull \hbox (badness 10000) in paragraph at lines 9--9
[] \OT1/cmr/m/n/10 math-emateg canol-fan hapus-rwydd blwyddyn

\hbox(6.94444+1.94444)x16383.99998, glue set 2425.43556 []


Underfull \hbox (badness 10000) in paragraph at lines 11--11
[] \OT1/cmr/m/n/10 deu-ddeg llon-gy-farch-iadau cyf-eir-iadau

\hbox(6.94444+1.94444)x16383.99998, glue set 3240.64192 []

Respuesta3

Suponiendo que está utilizando un formato simple con los babelpatrones de separación de palabras disponibles (por ejemplo, pdftexo xetex), puede cambiar a la separación de palabras correcta utilizando el hecho de que \lang@<name>es el número de idioma. De este modo

\language\csname lang@welsh\endcsname
\showhyphens{un casgliad credadwy traddodiadau athroniaeth mathemateg canolfan hapusrwydd blwyddyn deuddeg llongyfarchiadau cyfeiriadau}
\bye

da

[] \tenrm un casgl-iad cred-adwy tra-ddod-iadau athron-iaeth math-emateg canol-
fan hapus-rwydd blwyddyn deu-ddeg llon-gy-farch-iadau cyf-eir-iadau

Si desea utilizar LaTeX, entonces lo prefiere \l@<name>en lugar de \lang@<name>, además necesita al menos el comienzo de un documento.

\documentclass{article}
\begin{document}
\language\csname l@welsh\endcsname
\showhyphens{un casgliad credadwy traddodiadau athroniaeth mathemateg canolfan hapusrwydd blwyddyn deuddeg llongyfarchiadau cyfeiriadau}

información relacionada