Как с помощью egrep вывести все строки, где фамилии начинаются с K
или k
Jennifer Cowan:548-834-2348:583 Laurel Ave., Kingsville, TX 83745:10/1/35:58900
Lesley Kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600
Jennifer Cowan:548-834-2348:583 Laurel Ave., kingsville, TX 83745:10/1/35:58900
Lesley kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600
William Kopf:846-836-2837:6937 Ware Road, Milton, PA 93756:9/21/46:43500
Arthur Putie:923-835-8745:23 Wimp Lane, Kensington, DL 38758:8/31/69:126000
Первая попытка будет
grep '^[^ ]* *[Kk]'
Но это предполагает, что всегда есть только одно имя и нет инициалов.
В этом примере вы можете использовать -i
опцию и заменить [Kk]
только наk
Возможно, лучше остановиться на первом двоеточии.
grep -i ' k[^:]*:'
Если вы действительно хотите вывести только фамилию, а не всю строку, вам следует рассмотреть возможность использования awk (или perl)
'^[^ ]* *[Kk]'
Обновление: вот как строится первое выражение grep
' apostrophe delimits a parameter that contains spaces
and other so-called meta-characters that the shell might alter
^ caret means start of line
[ brackets mark a set of characters, any one of which is to be matched
^ inside brackets means negation or 'none of the following'
so `[^ ]` means "not a space"
] is the end of the set.
* means 0,1 or more of the prior character
so `[^ ]*` means any contiguous group of characters that does not
contain a space
then we have two spaces
* means 0,1 or more of the prior character
so space space * means 1 nor more spaces.
[Kk] means `K` or `k`
[^:]* means 0,1 or more characters that are not a colon
: followed by a colon
perl -aF/:/ -ne 'print if $F[0] =~ /\s[Kk]\S+$/'
- При использовании
вся строка разбивается на поля, разделенные двоеточиями; $F[0]
является нулевым полем и содержит имена;/\s[Kk]\S+$/
соответствует пробелу (\s
), за которым следуетK
, за которым следует любое количество символов, не являющихся пробелом (\S+
), до конца поля ($