複数の @ タイプを grep するにはどうすればよいでしょうか?

複数の @ タイプを grep するにはどうすればよいでしょうか?

Linux Centos 6-64を使用しています。

次のコマンドを変更するにはどうすればよいですかは、入力フォルダー内の @ で書かれたメールのみを取得します。

grep -E -o -r "[A-Za-z0-9][A-Za-z0-9._%+-]+@[A-Za-z0-9][A-Za-z0-9.-]+\.[A-Za-z]{2,6}" /inputfolder/ | sort | uniq > "/outputfolder/result.txt"

以下のすべての @ 形式のメールを取得するにはどうすればよいですか?

info@example.com
[email protected]
info(at)example.com
info[at]example.com
info%26%23064%3Bexample.com
info%40example.com

可能であれば、1行でコマンドを入力してください。ありがとうございます

答え1

-PPerl 正規表現と大文字と小文字を区別しないフラグを使用できます-i

grep -Pi "[A-Z0-9][\w.%+-]+(?:@|@|\(at\)|\[at\]|%26%23064%3B|%40)[A-Z0-9][A-Z0-9.-]+\.[A-Z]{2,6}"

\wを意味する[a-zA-Z0-9_]

説明:

[A-Z0-9]            : 1 alphanum
[\w.%+-]+           : 1 or more alphanum, _, ., %, + or -
(?:                 : start non capture group
    @               : literally @
  |                 : OR
    @          : html entity for @
  |                 :
    \(at\)          :
  |                 :
    \[at\]          :
  |                 :
    %26%23064%3B    :
  |                 :
    %40             :
)                   :
[A-Z0-9]            : 1 alphanum
[A-Z0-9.-]+         : 1 or more alphanum, . or -
\.                  : a dot
[A-Z]{2,6}          : 2 upto 6 alpha (be aware that TLDs may have much more characters, see: https://www.iana.org/domains/root/db)

与えられた例の結果:

grep -Pi "[A-Z0-9][\w.%+-]+(?:@|@|\(at\)|\[at\]|%26%23064%3B|%40)[A-Z0-9][A-Z0-9.-]+\.[A-Z]{2,6}" file.txt

info@example.com
[email protected]
info(at)example.com
info[at]example.com
info%26%23064%3Bexample.com
info%40example.com

関連情報