Como procuro caracteres inválidos no gedit?

Como procuro caracteres inválidos no gedit?

Estou com um dilema se devo editar um arquivo javascript ou não. Quando abro com o gedit, ele mostra o seguinte aviso:

O arquivo que você abriu contém alguns caracteres inválidos. Se você continuar editando este arquivo, poderá corromper este documento. Você também pode escolher outra codificação de caracteres e tentar novamente.

A codificação atual é UTF-8. Como o arquivo tem mais de 100.000 linhas de código, existe uma maneira rápida de procurar caracteres inválidos?

Responder1

Como o arquivo é UTF-8 você pode executarisutf8. Um pacote de utilitários adicional. Ele fornece linha, caractere e deslocamento para bytes incorretos.

Em seguida, use xxd, hexdump ou algo semelhante para analisar.

Infelizmente ele para na primeira falha. Mas, novamente, depende do arquivo. Pode ser que haja apenas um byte incorreto;)

Tenha algum código C que faça uma análise semelhante, mas para o arquivo inteiro. Está em um disco em algum lugar há muito esquecido. Poderia tentar encontrá-lo se precisar.

Senão sim, o rápido e nãoqueA maneira mais suja seria fazer uma comparação entre uma cópia salva com o gedit – como proposto pelo bom sr.@vonbrand.

informação relacionada