Как отфильтровать ссылки из html с помощью grep или sed?

Question

Попробуйте следующую команду:

curl -s http://www.example.com | grep -Po '(?<=src=")[^"]*(jpg|png)'

Объяснение:

От man grep:

   -o, --only-matching
          Print only the matched (non-empty) parts of a matching line,
          with each such part on a separate output line.
   -P, --perl-regexp
          Interpret PATTERN as a Perl compatible regular expression (PCRE)

Ретроспективный просмотр (?<=src=)утверждает, что в текущей позиции в строке предшествуют символы src=. Затем мы ищем все, кроме того ", что заканчивается на jpg или png.

Answer 1

Попробуйте следующую команду:

curl -s http://www.example.com | grep -Po '(?<=src=")[^"]*(jpg|png)'

Объяснение:

От man grep:

   -o, --only-matching
          Print only the matched (non-empty) parts of a matching line,
          with each such part on a separate output line.
   -P, --perl-regexp
          Interpret PATTERN as a Perl compatible regular expression (PCRE)

Ретроспективный просмотр (?<=src=)утверждает, что в текущей позиции в строке предшествуют символы src=. Затем мы ищем все, кроме того ", что заканчивается на jpg или png.

Как отфильтровать ссылки из html с помощью grep или sed?

решение1

Связанный контент