`grep -z -a -b -P --only-matching 'LUKS\xba\xbe'` は `LUKS\xba\xbe...` と一致しません

Question

TL;DR:grepコマンドは現在のロケールを使用して入力を解釈します。

あなたが示したように、これは一致しません:

echo -e 'LUKS\xba\xbe...' | grep -z -a -b -P --only-match 'LUKS\xba'

さらに、.すべてに一致するはずのも一致しません。

echo -e 'LUKS\xba\xbe...' | grep -z -a -b -P --only-match 'LUKS.'

ただし、このセッションのロケールを設定すると...

export LC_ALL=C

そしてもう一度試してみると、うまくいきます:

echo -e 'LUKS\xba\xbe...' | grep -z -a -b -P --only-match 'LUKS\xba'

ロケールはシステムの設定によって異なります。と入力localeすると、すべてのロケール情報が表示されます。私のシステムでは、デフォルトのロケールはです。これは、が入力が UTF8 であると想定しており、入力(16 進数) が有効な UTF8 シーケンスではないLC_CTYPE="en_US.UTF-8"ことを意味していると思います。Grepのマニュアルページを参照してください。また、「ピリオド . は任意の 1 文字と一致します」と記載されていることにも注意してください。 grepLUKS\xba\xbe...4c 55 4b 53 ba be 2e 2e 2eLC_ALL, LC_CTYPE, LANGエンコードエラーに一致するかどうかは未指定です。「（強調は筆者による）」

Answer 1