Попытка удалить символы конца слова с помощью sed regex

Question 1

echo 'Hello Hello' | sed 's/o$//'

кажется мне более полезным, чем ваш

echo 'Hello Hello' | sed 's/\(.*\)o$/\1/g'

В вашем вопросе говорится, что выход

echo 'Hello Hello' | sed 's/\(.*\)o\b/\1/g'

было Hello Hello, но для меня это так Hello Hell. Вы можете исправить это на

echo 'Hello Hello' | sed 's/\([^o]*\)o\b/\1/g'

но

echo 'Hello Hello' | sed 's/o\b//g'

Мне кажется, так лучше.

Answer

echo 'Hello Hello' | sed 's/o$//'

кажется мне более полезным, чем ваш

echo 'Hello Hello' | sed 's/\(.*\)o$/\1/g'

В вашем вопросе говорится, что выход

echo 'Hello Hello' | sed 's/\(.*\)o\b/\1/g'

было Hello Hello, но для меня это так Hello Hell. Вы можете исправить это на

echo 'Hello Hello' | sed 's/\([^o]*\)o\b/\1/g'

но

echo 'Hello Hello' | sed 's/o\b//g'

Мне кажется, так лучше.

Question 2

Удаление oв конце слов — это удаление ao между символом слова и несловесным символом (или EOL), поэтому:

sed -r 's/(\w)o(\W|$)/\1\2/g'

Answer

Удаление oв конце слов — это удаление ao между символом слова и несловесным символом (или EOL), поэтому:

sed -r 's/(\w)o(\W|$)/\1\2/g'

Question 3

Мне интересно, spaceне является ли ваш разделитель слов чем-то другим. Попробуйте что-то вроде следующего:

$ echo hello hello | sed -e 's/o / /g;s/o$//'
hell hell

Проблема с этим примером в том, что вам также придется сделать то же самое для .and ,и любого другого разделителя слов. Сопоставьте, oза которым следует другой определенный символ с помощью []like o[ \.,]. По какой-то причине это не работает для EOL $, поэтому добавьте еще одну строку поиска с помощью ;. Пример:

$ echo hello hello, hello. toot hello | sed -e 's/o\([ \.,]\)/\1/g;s/o$//'
hell hell, hell. toot hell
$ echo $SHELL
/bin/bash
$ sed --version
sed (GNU sed) 4.4
$ set | grep IFS
IFS=$' \t\n'

Answer

Мне интересно, spaceне является ли ваш разделитель слов чем-то другим. Попробуйте что-то вроде следующего:

$ echo hello hello | sed -e 's/o / /g;s/o$//'
hell hell

Проблема с этим примером в том, что вам также придется сделать то же самое для .and ,и любого другого разделителя слов. Сопоставьте, oза которым следует другой определенный символ с помощью []like o[ \.,]. По какой-то причине это не работает для EOL $, поэтому добавьте еще одну строку поиска с помощью ;. Пример:

$ echo hello hello, hello. toot hello | sed -e 's/o\([ \.,]\)/\1/g;s/o$//'
hell hell, hell. toot hell
$ echo $SHELL
/bin/bash
$ sed --version
sed (GNU sed) 4.4
$ set | grep IFS
IFS=$' \t\n'

Question 4

Я попробовал это со всеми символами-якорями, которые только смог придумать.

Это не якоря, а то, что у вас жадный матч со звездочкой. Выражение $.*$oсовпадаеткак можно длиннее, поэтому он съест все до самогопоследний o. Это может совпадать oи с более ранними .

Но тогда бесполезно что-то захватывать и возвращать обратно, можно просто удалить и то, $.*$и другое \1полностью.

Итак, это (по крайней мере в GNU sed) удалит o«'» в конце слов:

sed 's/o\>//g' 
sed 's/o\b//g'

Это, конечно, только в конце строки:

sed 's/o$//g'

И это удалит o, а также следующий за ним символ, не являющийся словом (например, пробел после Hello):

sed 's/o\W//g'

Если ваш sedне поддерживает \</ \>или \b, вам придется сделать что-то еще. Это будет соответствовать oследующему небуквенно-цифровому символу или концу строки:

$ echo "jello, jello" | sed -E -e 's/o([^[:alnum:]]|$)/\1/g'
jell, jell

Это работает, например, в sedОС OS X/macOS.

Регулярные выражения Perl поддерживают добавление вопросительного знака к *или , +чтобы сделать их нежадными. Тогда они будут соответствоватьсамый короткийвозможная строка:

echo "jello, jello" | perl -pe 's/(.*?)o/$1/g'
jell, jell

Answer

Я попробовал это со всеми символами-якорями, которые только смог придумать.

Это не якоря, а то, что у вас жадный матч со звездочкой. Выражение $.*$oсовпадаеткак можно длиннее, поэтому он съест все до самогопоследний o. Это может совпадать oи с более ранними .

Но тогда бесполезно что-то захватывать и возвращать обратно, можно просто удалить и то, $.*$и другое \1полностью.

Итак, это (по крайней мере в GNU sed) удалит o«'» в конце слов:

sed 's/o\>//g' 
sed 's/o\b//g'

Это, конечно, только в конце строки:

sed 's/o$//g'

И это удалит o, а также следующий за ним символ, не являющийся словом (например, пробел после Hello):

sed 's/o\W//g'

Если ваш sedне поддерживает \</ \>или \b, вам придется сделать что-то еще. Это будет соответствовать oследующему небуквенно-цифровому символу или концу строки:

$ echo "jello, jello" | sed -E -e 's/o([^[:alnum:]]|$)/\1/g'
jell, jell

Это работает, например, в sedОС OS X/macOS.

Регулярные выражения Perl поддерживают добавление вопросительного знака к *или , +чтобы сделать их нежадными. Тогда они будут соответствоватьсамый короткийвозможная строка:

echo "jello, jello" | perl -pe 's/(.*?)o/$1/g'
jell, jell

Попытка удалить символы конца слова с помощью sed regex

решение1

решение2

решение3

решение4

Связанный контент