Procesar un archivo que comienza con una lista de materiales (FF FE)

Question 1

De estoartículo de wikipedia, FF FEmedio UTF16LE. Entonces deberías decirle iconvque convierta de UTF16LEa UTF8:

iconv -f UTF-16LE -t UTF-8 dotan.csv > fixed.txt

Answer

De estoartículo de wikipedia, FF FEmedio UTF16LE. Entonces deberías decirle iconvque convierta de UTF16LEa UTF8:

iconv -f UTF-16LE -t UTF-8 dotan.csv > fixed.txt

Question 2

dos2unixtambién elimina las listas de materiales y convierte UTF-16 a UTF-8:

$ printf %s あ|recode ..utf16 >a;xxd -p a;dos2unix a;xxd -p a
feff3042
dos2unix: converting file a to Unix format...
e38182

dos2unixtambién elimina las listas de materiales UTF-8:

$ printf %b '\xef\xbb\xbfa'>a;dos2unix a;xxd -p a
dos2unix: converting file a to Unix format...
61

Answer

dos2unixtambién elimina las listas de materiales y convierte UTF-16 a UTF-8:

$ printf %s あ|recode ..utf16 >a;xxd -p a;dos2unix a;xxd -p a
feff3042
dos2unix: converting file a to Unix format...
e38182

dos2unixtambién elimina las listas de materiales UTF-8:

$ printf %b '\xef\xbb\xbfa'>a;dos2unix a;xxd -p a
dos2unix: converting file a to Unix format...
61

Question 3

Respuesta corta:

Respuesta corta: sed -i $'1s/^\uFEFF//' file.txt, pero no en BSD u OS/X.
Otra respuesta: vi file.txt, :set nobomb, :w, simple pero manual
Instalar dos2unuix;dos2unix -r file.txt
Estas marcas tienen varios significados posibles, incluido simplemente que el archivo es UTF-8; ver elArtículo de Wikipedia.
A los programas de Windows les encanta agregar estas marcas. La mayoría de los editores no eliminarán estas marcas.

Answer

Respuesta corta:

Respuesta corta: sed -i $'1s/^\uFEFF//' file.txt, pero no en BSD u OS/X.
Otra respuesta: vi file.txt, :set nobomb, :w, simple pero manual
Instalar dos2unuix;dos2unix -r file.txt
Estas marcas tienen varios significados posibles, incluido simplemente que el archivo es UTF-8; ver elArtículo de Wikipedia.
A los programas de Windows les encanta agregar estas marcas. La mayoría de los editores no eliminarán estas marcas.

información relacionada