テキストファイルがバイナリとしてマークされる問題が発生しています

Question 1

少なくとも最初の質問には答えられます。Unix/Linuxを使用している場合はtrを使用できます。

tr -d '\000' < filein > fileout

ここで、\000 は null 文字です。次の例に示すように、印刷できない文字をすべて削除することもできます。「Unix テキスト編集: sed、tr、cut、od、awk」

2 番目の質問に関して、どのプログラミング言語を使用しているかはわかりませんが、出力ファイルに印刷されてしまう可能性のある初期化されていない変数を検索します。

Answer

少なくとも最初の質問には答えられます。Unix/Linuxを使用している場合はtrを使用できます。

tr -d '\000' < filein > fileout

ここで、\000 は null 文字です。次の例に示すように、印刷できない文字をすべて削除することもできます。「Unix テキスト編集: sed、tr、cut、od、awk」

2 番目の質問に関して、どのプログラミング言語を使用しているかはわかりませんが、出力ファイルに印刷されてしまう可能性のある初期化されていない変数を検索します。

Question 2

推測してみます…。

プログラムは、各文字に 2 バイトを使用する Unicode のエンコードである UTF-16 でファイルを書き込みます。ほとんどの場合、2 バイトごとに null になります。

iconv -f utf-16 -t utf-8 < filein > fileout

ほとんどの coreutils が対応している UTF-8 に変換します。

Answer

推測してみます…。

プログラムは、各文字に 2 バイトを使用する Unicode のエンコードである UTF-16 でファイルを書き込みます。ほとんどの場合、2 バイトごとに null になります。

iconv -f utf-16 -t utf-8 < filein > fileout

ほとんどの coreutils が対応している UTF-8 に変換します。

Question 3

もう一つの選択肢は文字列このツールは、エンコーディングやヌル文字を「修正」するだけでなく、実際のバイナリからテキストデータを取得できるため、

$ strings output_file.txt | grep "grep 文字列"

バイナリファイル内の何かを素早く見つけるのに非常に便利です。例:

$ 文字列firmware.bin | grep VERSION

Answer

もう一つの選択肢は文字列このツールは、エンコーディングやヌル文字を「修正」するだけでなく、実際のバイナリからテキストデータを取得できるため、

$ strings output_file.txt | grep "grep 文字列"

バイナリファイル内の何かを素早く見つけるのに非常に便利です。例:

$ 文字列firmware.bin | grep VERSION

関連情報