Как egrep-ом получить первый символ во втором столбце?

Как egrep-ом получить первый символ во втором столбце?

Как с помощью egrep вывести все строки, где фамилии начинаются с Kили k?

Jennifer Cowan:548-834-2348:583 Laurel Ave., Kingsville, TX 83745:10/1/35:58900
Lesley Kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600
Jennifer Cowan:548-834-2348:583 Laurel Ave., kingsville, TX 83745:10/1/35:58900
Lesley kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600
William Kopf:846-836-2837:6937 Ware Road, Milton, PA 93756:9/21/46:43500
Arthur Putie:923-835-8745:23 Wimp Lane, Kensington, DL 38758:8/31/69:126000

решение1

Первая попытка будет

  grep '^[^ ]*  *[Kk]'

Но это предполагает, что всегда есть только одно имя и нет инициалов.
В этом примере вы можете использовать -iопцию и заменить [Kk]только наk

Возможно, лучше остановиться на первом двоеточии.

  grep -i ' k[^:]*:'

Если вы действительно хотите вывести только фамилию, а не всю строку, вам следует рассмотреть возможность использования awk (или perl)


'^[^ ]* *[Kk]'Обновление: вот как строится первое выражение grep

  '     apostrophe delimits a parameter that contains spaces
        and other so-called meta-characters that the shell might alter
  ^     caret means start of line
  [     brackets mark a set of characters, any one of which is to be matched
  ^     inside brackets means negation or 'none of the following'
        so `[^ ]` means "not a space"
  ]     is the end of the set.
  *     means 0,1 or more of the prior character
        so `[^ ]*` means any contiguous group of characters that does not 
        contain a space
  then we have two spaces
  *     means 0,1 or more of the prior character
        so space space * means 1 nor more spaces.
  [Kk]  means `K` or `k`
  [^:]* means 0,1 or more characters that are not a colon
  :     followed by a colon

решение2

perl -aF/:/ -ne 'print if $F[0] =~ /\s[Kk]\S+$/'
  • При использовании -aF/:/вся строка разбивается на поля, разделенные двоеточиями;
  • $F[0]является нулевым полем и содержит имена;
  • /\s[Kk]\S+$/соответствует пробелу ( \s), за которым следует Kили k, за которым следует любое количество символов, не являющихся пробелом ( \S+), до конца поля ( $).

Связанный контент