Bash ersetzt Sonderzeichen in einer Variablen

Question

Sie haben wahrscheinlich eine "bom" (Byte Order Mark, die auf Unicode-basierten Systemen verwendet wird, um die "Little-Endian"/"Big-Endian"-Eigenschaft des Systems anzugeben.

sehenhttps://en.wikipedia.org/wiki/Byte_order_mark

Glücklicherweise scheint es sich dabei um das Gebietsschema UTF-8 zu handeln, was gut ist, wenn Sie nur ASCII-Zeichen der Größen 1–177 erwarten ...

Sie könnten es entfernen, indem Sie ein Sed einfügen, das gezwungen wurde, (vorübergehend) das Gebietsschema C zu verwenden, um Folgendes zu „sehen“:

LC_ALL=C sed '1s/^\xEF\xBB\xBF//'

verwendet beispielsweise als:

incoming program | LC_ALL=C sed '1s/^\xEF\xBB\xBF//' | somecmd
 # or
< incomingfile LC_ALL=C sed '1s/^\xEF\xBB\xBF//' > outputfile
  #  <incomingfile  : will give "incomingfile" content as stdin to sed 
  # then sed modifies only the first line, replacing the BOM with ""
  #    (the rest is not touched by sed and is transmitted as-is)
  #  > outputfile : directs sed output (ie, incomingfile without the BOM) to "outputfile"

Answer 1