Como configurar o texto do dicionário para melhor capacidade de pesquisa?

Como configurar o texto do dicionário para melhor capacidade de pesquisa?

Muitos dicionários inserem um \cdotentre as sílabas de uma palavra, conforme mostrado abaixo:

porco-da-terra

Esses pontos podem ser úteis para dar sentido a palavras complexas e, em alguns casos, essenciais: sem marcar explicitamente as divisões das sílabas, não seria fácil dizer que Ai (uma cidade antiga) tem duas sílabas.

Infelizmente, esses pontos significam que não se pode simplesmente Ctrl+ Fe procurar por “porco-da-terra”. Não importa se o documento é impresso, mas a facilidade de pesquisa é uma grande vantagem dos formatos eletrônicos, e seria uma pena ter que abrir mão disso.

Existe uma maneira de configurar o LaTeX ou o pdf para que o texto acima possa ser encontrado com uma pesquisa de texto simples (para que a função de pesquisa "ignore" o \cdot)?

Parece que isso poderia ser feito se o LaTeX tivesse uma maneira de criar caracteres "ocultos" que aparecem na tela, mas não no texto pesquisado. Existe outra maneira de abordar isso?

Responder1

Existe uma maneira específica do leitor.accsuppfunciona bem com o Adobe Reader:

insira a descrição da imagem aqui

\documentclass{article}

\usepackage{accsupp,xstring}

\makeatletter
\newcommand{\@syllable}{$\cdot$}
\newcommand{\setsyllable}[1]{\renewcommand{\@syllable}{#1}}
\newcommand{\dict}[1]{%
  \StrSubstitute{#1}{|}{}[\@ActualText]% Strip syllable symbol |
  \StrSubstitute{#1}{|}{\@syllable}[\@VisualText]% Replace syllable
  \BeginAccSupp{ActualText=\@ActualText}\@VisualText\EndAccSupp{}%
}
\makeatother

\begin{document}

\dict{Aard|vark}

\setsyllable{:}

\dict{Aar|dv|ark}

\setsyllable{-}

\dict{A|a|r|d|v|a|r|k}

\end{document}

Isso não funciona com Sumatra.

informação relacionada