我在將文字檔案標記為二進位檔案時遇到問題

Question 1

我至少可以回答第一個問題。如果您使用 Unix/Linux，則可以使用 tr

tr -d '\000' < filein > fileout

其中 \000 是空字元。您也可以刪除所有不可列印的字符，如範例所示：“Unix 文本編輯：sed、tr、cut、od、awk”

關於你的第二個問題，我不知道你的程式語言是什麼，但我會搜尋未初始化的變量，這些變數可能最終會列印到輸出檔案中。

Answer

我至少可以回答第一個問題。如果您使用 Unix/Linux，則可以使用 tr

tr -d '\000' < filein > fileout

其中 \000 是空字元。您也可以刪除所有不可列印的字符，如範例所示：“Unix 文本編輯：sed、tr、cut、od、awk”

關於你的第二個問題，我不知道你的程式語言是什麼，但我會搜尋未初始化的變量，這些變數可能最終會列印到輸出檔案中。

Question 2

我來猜測一下......

您的程式以 UTF-16 寫入文件，這是一種 Unicode 編碼，每個字元使用兩個位元組。大多數情況下，每隔一個位元組都是空值。

iconv -f utf-16 -t utf-8 < filein > fileout

會將其轉換為大多數 coreutils 都熟悉的 UTF-8。

Answer

我來猜測一下......

您的程式以 UTF-16 寫入文件，這是一種 Unicode 編碼，每個字元使用兩個位元組。大多數情況下，每隔一個位元組都是空值。

iconv -f utf-16 -t utf-8 < filein > fileout

會將其轉換為大多數 coreutils 都熟悉的 UTF-8。

Question 3

另一個選擇可能是使用字串工具，它實際上比僅僅「修復」編碼或空字元更強大，它可以從任何真正的二進位檔案中獲取文字數據，所以

$ 字串輸出檔.txt | grep "grep 字串"

通常可以很方便地在二進位檔案中快速找到某些內容，例如

$ 字串韌體.bin |版本號

Answer

另一個選擇可能是使用字串工具，它實際上比僅僅「修復」編碼或空字元更強大，它可以從任何真正的二進位檔案中獲取文字數據，所以

$ 字串輸出檔.txt | grep "grep 字串"

通常可以很方便地在二進位檔案中快速找到某些內容，例如

$ 字串韌體.bin |版本號

相關內容