Si voy a un enlace de YouTube, por ejemplohttp://www.youtube.com/watch?v=1Jfm-92JXVEy quiero copiar algunos comentarios al bloc de notas, encuentro que parte del texto es aún más pequeño que otro.
Si lo selecciono todo y uso la tecla de acceso directo PureText, todavía no elimina el formato. Si selecciono todo y lo "cambio" a una sola fuente y tamaño de fuente (ya lo era), no lo convierte todo en un solo tamaño.
Respuesta1
Si bien no hay ningún formato en el texto, parece contener caracteres Unicode (no estoy seguro de cuáles), supongo que esto es lo que causa el problema. Una forma rápida de eliminarlos es guardar el archivo de texto como ASCII y volver a abrirlo.
Respuesta2
Puede encontrar estos caracteres fuera de rango y decidir qué hacer con ellos. Algunos de ellos pueden ser comillas. Es posible que desees reemplazarlas con comillas simples. Pero otros serán caracteres molestos que el bloc de notas quizás no maneje bien y querrás eliminar.
Entonces, para notepad ++, un hallazgo de[\x{0080}-\x{FFFF}]
Tenga en cuenta que debe hacer clic en la pestaña reemplazar para poder buscar/reemplazar.
Lo anterior debería ser suficiente, pero alguna explicación más
El rango ascii es 0000h-007Fh, es decir, base10, 0-127. Entonces, si busca cualquier Unicode fuera de eso, es decir, 128+, es decir, 80h-FFFFh, entonces podrá encontrar esos caracteres. La sintaxis Regex tiene el concepto de rango de caracteres, por lo que [AZ] sería cualquier carácter entre A y Z en Unicode. Y en notepad++ especificas un carácter con código utf-16 con la notación \x{...} donde ... es el hexadecimal, por lo que para 'A', cuyo hexadecimal es 41, especificarías \x{0041 }. Editpad usaría \u.... por ejemplo \u0041
. Entonces en editpad pro harías [\u0080-\uFFFF]
. En notepad++ harías lo que se muestra en la imagen de arriba. [\x{0080}-\x{FFFF}]
Observe que el aspecto de la sintaxis de expresiones regulares es el mismo, pero la forma en que se especifica un carácter difiere entre los editores de texto.
Respuesta3
por alguna razón puedo tirar cualquier cosa en mi bloc de notas y todo el formato se elimina sin guardarlo. Aparte del texto sin formato, sólo quedan algunas pestañas. Usando Win 7 home premium Versión 6.1 SP1 otros consejos sobre http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm y http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove-text-formatting-when-copying-and-pasting.html
Respuesta4
Sobre la base de la respuesta de R4D4, sugiero lo siguiente (cualquiera o ambos funcionaron para mí):
1) Utilice el Bloc de notas de Windows:
- (a) pegue el texto en un archivo nuevo en el Bloc de notas de Windows
- (b) elimine los caracteres no deseados/ocultos que aparezcan, como guiones suaves (consulte la respuesta de barlop en este hilo:¿Copiar texto de YouTube al Portapapeles introduce guiones?)
- (c) guárdelo como un archivo ANSI (nota: aquí aparecerá un mensaje de advertencia si el texto contiene caracteres Unicode; haga clic en Aceptar)
- (d) abra el archivo ANSI creado en el paso anterior
- (e) copie y pegue el texto en el destino deseado
2) Utilice el Bloc de notas++
- (a) pegue el texto en un nuevo archivo en Notepad++
- (b) eliminar los caracteres extraños que puedan aparecer**
- (c) cambiar la codificación de UTF-8 a ANSI
- (d) borrar nuevamente cualquier carácter extraño que pueda aparecer
- (e) copie y pegue el texto en el destino deseado
**Esto supone que la configuración de Notepad++ sigue la configuración predeterminada para crear nuevos archivos con codificación UTF-8. Puede ser necesario verificar si hay caracteres no deseados en ambas codificaciones porque algunos caracteres problemáticos no parecen extraños en ANSI y son más fáciles de detectar en UTF-8 (como guiones suaves: consulte la respuesta de barlop en este hilo:¿Copiar texto de YouTube al Portapapeles introduce guiones?).