gedit で無効な文字をスキャンするにはどうすればよいですか?

Question

ファイルはUTF-8なので、いいえ追加のユーティリティパッケージ。不良バイトの行、文字、オフセットの両方を提供します。

その後、xxd、hexdump などを使用して解析します。

残念ながら、最初のクラッシュで停止します。しかし、それはファイルによって異なります。不良バイトが 1 つだけある可能性もあります ;)

_{ファイル全体に対して同様の分析を行う C コードがあります。それは、長い間忘れられていたディスクのどこかにあります。必要な場合は、それを探してみてください。}

そうでなければ、迅速でそれ汚いやり方としては、gedit で保存したコピーとの差分を取ることです。これは、good mr が提案したものです。@vonbrand。

Answer 1

ファイルはUTF-8なので、いいえ追加のユーティリティパッケージ。不良バイトの行、文字、オフセットの両方を提供します。

その後、xxd、hexdump などを使用して解析します。

残念ながら、最初のクラッシュで停止します。しかし、それはファイルによって異なります。不良バイトが 1 つだけある可能性もあります ;)

_{ファイル全体に対して同様の分析を行う C コードがあります。それは、長い間忘れられていたディスクのどこかにあります。必要な場合は、それを探してみてください。}

そうでなければ、迅速でそれ汚いやり方としては、gedit で保存したコピーとの差分を取ることです。これは、good mr が提案したものです。@vonbrand。

関連情報