![Como podemos copiar texto da Wikipedia sem as partes de citação "[1]", "[2]", "[3]"?](https://rvso.com/image/1286573/Como%20podemos%20copiar%20texto%20da%20Wikipedia%20sem%20as%20partes%20de%20cita%C3%A7%C3%A3o%20%22%5B1%5D%22%2C%20%22%5B2%5D%22%2C%20%22%5B3%5D%22%3F.png)
Se copiarmos o texto deuma página da Wikipédia, isso é aproximadamente o que obtemos:
O espaçamento entre frases é o espaço horizontal entre as frases no texto digitado. É uma questão de convenção tipográfica. [1] Desde a introdução da impressão de tipos móveis na Europa, várias convenções de espaçamento entre frases têm sido usadas em línguas com alfabeto derivado do latim. [2] Estes incluem um espaço normal entre palavras (como entre as palavras de uma frase), um único espaço ampliado, dois espaços completos e, mais recentemente na mídia digital, nenhum espaço. [3] Embora as fontes digitais modernas possam ajustar automaticamente o espaço de uma única palavra para criar um espaçamento visualmente agradável e consistente após a pontuação do terminal, [4] a maior parte do debate é sobre se deve-se pressionar a barra de espaço do teclado uma ou duas vezes entre as frases. [5]
Não desejo copiar as partes [1]
e [2]
etc. Na verdade, era isso que eu queria copiar:
O espaçamento entre frases é o espaço horizontal entre as frases no texto digitado. É uma questão de convenção tipográfica. Desde a introdução da impressão de tipos móveis na Europa, várias convenções de espaçamento entre frases têm sido usadas em línguas com alfabeto derivado do latim. Estes incluem um espaço normal entre palavras (como entre as palavras de uma frase), um único espaço ampliado, dois espaços completos e, mais recentemente na mídia digital, nenhum espaço. Embora as fontes digitais modernas possam ajustar automaticamente o espaço de uma única palavra para criar um espaçamento visualmente agradável e consistente após a pontuação do terminal, a maior parte do debate é sobre se deve-se pressionar a barra de espaço do teclado uma ou duas vezes entre as frases.
A resposta selecionada abaixo usa regex, masnão funciona sempre. (Se o próprio texto contém [
e ]
o regex não deveria removê-los.)
Existem soluções melhores?
Responder1
Um bookmarklet é seu amigo...
Crie um novo marcador do navegador e copie o código javascript abaixo nele - quando quiser copiar algum texto da Wikipedia, basta clicar nele antes e ele removerá todas as instâncias de [n] para atender aos seus requisitos na pergunta.
javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();
Nos bastidores, basta fazer uma pesquisa de expressão regular e substituir todas <sup>...</sup>
as tags HTML da página.
Acabei de tentar isso no IE7 e funciona bem, então espero que funcione em outros navegadores também.
vou creditareste tópico SOapontando-me na direção certa - eu sabia que um bookmarklet era o caminho a percorrer, mas nunca tinha escrito um antes.
Responder2
Propriedade CSSuser-select
especifica se o texto do elemento é selecionável (com CtrlA, destaque do mouse, etc.). A seguinte regra CSS para Wikipedia omitirá as referências embutidas da seleção ao destacar o texto do artigo:
sup.reference { user-select: none; }
Adicione-o aseu arquivo CSS da Wikipédia(que só tem efeito enquanto você estiver logado); ou para uma folha de estilo do usuário através de uma extensão do navegador (por exemploCaneta) ou através dos recursos internos do navegador (por exemplouserContent.css
para Firefox,custom.css
para Chromium), que estará ativo independentemente de você estar conectado à conta da Wikipedia.
Verhttps://en.wikipedia.org/wiki/Help:Reference_display_customizationpara mais exemplos. Por exemplo, para não mostrar os números das citações in-line, use:
sup.reference { display: none; }