Как работать с непечатаемыми символами на клавиатуре?

Question 1

Самый простой способ — использовать точку, соответствующую символу градуса.

/[0-9][0-9]*.[a-z|A-Z]+/

Например

$ echo -e "30\0260FHigh" \
| awk '/[0-9][0-9]*.[a-z|A-Z]+/ { print "yes" }'

yes

(\0260 — восьмеричное число для обозначения градуса в вашем вопросе)

Если вы хотите точно сопоставить его, вам придется определить его значение в используемой кодировке. В тексте вашего вопроса это, кажется, 0xb0.

 $ echo -e "30\0260FHigh" \
 | awk '/[0-9][0-9]*\xb0[a-z|A-Z]+/ {print "yes" }'

 yes

\0260 и \xb0 просто иллюстрируют два способа обозначить одно и то же.

Answer

Самый простой способ — использовать точку, соответствующую символу градуса.

/[0-9][0-9]*.[a-z|A-Z]+/

Например

$ echo -e "30\0260FHigh" \
| awk '/[0-9][0-9]*.[a-z|A-Z]+/ { print "yes" }'

yes

(\0260 — восьмеричное число для обозначения градуса в вашем вопросе)

Если вы хотите точно сопоставить его, вам придется определить его значение в используемой кодировке. В тексте вашего вопроса это, кажется, 0xb0.

 $ echo -e "30\0260FHigh" \
 | awk '/[0-9][0-9]*\xb0[a-z|A-Z]+/ {print "yes" }'

 yes

\0260 и \xb0 просто иллюстрируют два способа обозначить одно и то же.

Question 2

Современная оболочка Linux очень хорошо понимает Unicode. На самом деле, я думаю, что все данные обрабатываются как UTF-8.

У меня не возникло проблем с запуском этого кода:

$ echo ° | awk '/°/{print "found it"}'
found it

Если вы создаете скрипт оболочки, убедитесь, что он в кодировке UTF-8, а не ASCII.

Answer

Современная оболочка Linux очень хорошо понимает Unicode. На самом деле, я думаю, что все данные обрабатываются как UTF-8.

У меня не возникло проблем с запуском этого кода:

$ echo ° | awk '/°/{print "found it"}'
found it

Если вы создаете скрипт оболочки, убедитесь, что он в кодировке UTF-8, а не ASCII.

Связанный контент