Se eu acessar um link do YouTube, por exemplohttp://www.youtube.com/watch?v=1Jfm-92JXVEe quero copiar alguns comentários para o bloco de notas, acho que algum texto ainda é menor que outro texto.
Se eu selecionar tudo e usar a tecla de atalho PureText, a formatação ainda não será removida. Se eu selecionar tudo e "alterar" para uma fonte e tamanho de fonte (já era), isso não tornará tudo do mesmo tamanho.
Responder1
Embora não haja formatação no texto, o texto parece conter caracteres Unicode (quanto a quais não tenho certeza), acho que é isso que causa o problema. Uma maneira rápida de removê-los é salvar o arquivo de texto como ASCII e reabri-lo.
Responder2
Você pode encontrar esses caracteres fora do intervalo e decidir o que fazer com eles. Alguns deles podem ser aspas curvas. Você pode querer apenas substituí-los por aspas diretas. Mas outros serão seus personagens incômodos que o bloco de notas pode não lidar bem e você deseja excluir.
Então, para o notepad ++, uma descoberta de[\x{0080}-\x{FFFF}]
Observe que você clicaria na guia substituir para poder localizar/substituir.
O que foi dito acima deve ser suficiente, mas algumas explicações adicionais
O intervalo ASCII é 0000h-007Fh, ou seja, base10, 0-127. Portanto, se você pesquisar qualquer unicode fora desse, ou seja, 128+, ou seja, 80h-FFFFh, poderá encontrar esses caracteres. A sintaxe Regex tem o conceito de intervalo de caracteres, então [AZ] seria qualquer caractere entre A e Z em unicode. E no notepad++ você especifica um caractere com código utf-16 com a notação \x{...} onde ... é o hexadecimal, então para 'A', cujo hexadecimal é 41, você especificaria \x{0041 }. O Editpad usaria \u.... por exemplo \u0041
. Então, no editpad pro você faria [\u0080-\uFFFF]
. No notepad++ você faria como na foto acima. [\x{0080}-\x{FFFF}]
Observe que o aspecto da sintaxe regex é o mesmo, mas a forma como um caractere é especificado difere entre os editores de texto.
Responder3
por algum motivo, posso jogar qualquer coisa no meu bloco de notas e toda a formatação é removida sem salvá-la. além do texto simples, apenas algumas guias permanecem. Usando o Win 7 home premium versão 6.1 SP1 outras dicas sobre http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm e http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove-text-formatting-when-copying-and-pasting.html
Responder4
Com base na resposta do R4D4, sugiro o seguinte (ambos funcionaram para mim):
1) Use o Bloco de Notas do Windows:
- (a) cole o texto em um novo arquivo no Bloco de Notas do Windows
- (b) exclua quaisquer caracteres não intencionais/ocultos que apareçam, como hífens suaves (veja a resposta de barlop neste tópico:Copiar texto do YouTube para a área de transferência apresenta travessões?)
- (c) salve-o como um arquivo ANSI (nota: uma mensagem de aviso aparecerá aqui se o texto contiver caracteres Unicode; clique em ok)
- (d) abra o arquivo ANSI criado na etapa anterior
- (e) copie e cole o texto no destino desejado
2) Use o Bloco de Notas++
- (a) cole o texto em um novo arquivo no Notepad++
- (b) excluir quaisquer caracteres estranhos que possam aparecer**
- (c) alterar a codificação de UTF-8 para ANSI
- (d) excluir novamente quaisquer caracteres estranhos que possam aparecer
- (e) copie e cole o texto no destino desejado
**Isso pressupõe que as configurações do Notepad++ sigam o padrão para criar novos arquivos com codificação UTF-8. A verificação de caracteres não intencionais em ambas as codificações pode ser necessária porque alguns caracteres problemáticos não parecem estranhos em ANSI e são mais fáceis de detectar em UTF-8 (como hífens suaves: veja a resposta de barlop neste tópico:Copiar texto do YouTube para a área de transferência apresenta travessões?).