sed regexp caractere HEX

Question

Isso seria porque as [...]correspondências de um personagem. sedtentaria combinar caracteres com o intervalo especificado em [...]. Em localidades UTF-8, você só pode encontrar \x8fcomo parte de um caractere multibyte. Você notará que .isso também não corresponde (e isso é um requisito do POSIX).

Por exemplo:

sed 's/[eé\xa9]//'

não faria sentido. éé um caractere (codificado como 0xc3 0xa9), 0xa9 não é um caractere, mas sim um byte, pode ser encontrado dentro de um caractere (como é), eé um caractere (codificado como 0x65). Você não pode esperar sedde alguma forma corresponder 0xa9 dentro de um caractere e como um byte.

Para combinar dados de bytes arbitrários com umtextoutilitário como sed, você desejará usar um local onde os caracteres são bytes, esse é um caso típico paraLC_ALL=C.

LC_ALL=C sed 's/12[\x8f\x9f]//g'

Ou portável:

LC_ALL=C sed "$(printf 's/12[\217\237]//g')"

Observe que você não pode esperar processar dados contendo caracteres NUL (ou que não terminem em um caractere de nova linha ou onde os caracteres de nova linha tenham mais do que alguns quilobytes separados) de forma portável com sed. Use perl -p/-nem vez disso nesse caso.

Answer 1