
Tengo el dilema de editar un archivo javascript o no. Cuando lo abro con gedit, muestra la siguiente advertencia:
El archivo que abrió tiene algunos caracteres no válidos. Si continúa editando este archivo, podría dañar este documento. También puedes elegir otra codificación de caracteres e intentarlo de nuevo.
La codificación actual es UTF-8. Como el archivo tiene más de 100.000 líneas de código, ¿existe una forma rápida de buscar caracteres no válidos?
Respuesta1
Como el archivo es UTF-8, puedes ejecutarisutf8. Un paquete de utilidades adicional. Le proporciona línea, carácter y compensación para bytes incorrectos.
Luego use xxd, hexdump o similares para analizar.
Lamentablemente se detiene al primer choque. Pero depende del archivo. Podría ser que solo haya un byte incorrecto;)
Tenga algún código C que haga un análisis similar pero para el archivo completo. Está en un disco olvidado hace mucho tiempo. Podría intentar encontrarlo si es necesario.
Si no, el rápido y el no.esoLa manera sucia sería hacer una diferencia entre una copia guardada con gedit, como propuso el buen señor.@vonbrand.