處理以 BOM (FF FE) 開頭的文件

Question 1

由此維基百科文章，FF FE方法UTF16LE。所以你應該告訴iconv從轉換UTF16LE為UTF8：

iconv -f UTF-16LE -t UTF-8 dotan.csv > fixed.txt

Answer

由此維基百科文章，FF FE方法UTF16LE。所以你應該告訴iconv從轉換UTF16LE為UTF8：

iconv -f UTF-16LE -t UTF-8 dotan.csv > fixed.txt

Question 2

dos2unix也刪除 BOM 並將 UTF-16 轉換為 UTF-8：

$ printf %s あ|recode ..utf16 >a;xxd -p a;dos2unix a;xxd -p a
feff3042
dos2unix: converting file a to Unix format...
e38182

dos2unix也刪除了 UTF-8 BOM：

$ printf %b '\xef\xbb\xbfa'>a;dos2unix a;xxd -p a
dos2unix: converting file a to Unix format...
61

Answer

dos2unix也刪除 BOM 並將 UTF-16 轉換為 UTF-8：

$ printf %s あ|recode ..utf16 >a;xxd -p a;dos2unix a;xxd -p a
feff3042
dos2unix: converting file a to Unix format...
e38182

dos2unix也刪除了 UTF-8 BOM：

$ printf %b '\xef\xbb\xbfa'>a;dos2unix a;xxd -p a
dos2unix: converting file a to Unix format...
61

Question 3

StackOverflow 也有答案：如何從 UTF-8 檔案中刪除 BOM？ @rici有一個很好的答案。

簡短回答：

Answer

StackOverflow 也有答案：如何從 UTF-8 檔案中刪除 BOM？ @rici有一個很好的答案。

簡短回答：

相關內容