Как извлечь только IP-номера из файла, отформатированного следующим образом?
test-Zookeeper2-Z1-solr1006 10.15.5.226
10.15.6.103 test-Zookeeper2-Z2-solr1006
10.15.5.92 test-Zookeeper3-Z1-solr1006
10.15.6.217 test-Zookeeper1-Z2-solr1006
10.15.6.83 test-Zookeeper3-Z2-solr1006
test-Zookeeper-Z1-solr1006 10.15.7.106
решение1
В Perl есть проверенный модуль для общих регулярных выражений, включая адреса IPv4:
$ perl -MRegexp::Common=net -lane 'print for grep {/^$RE{net}{IPv4}$/} @F' file
10.15.5.226
10.15.6.103
10.15.5.92
10.15.6.217
10.15.6.83
10.15.7.106
решение2
Для выборочных данных:
grep -o '\b[0-9.]\+\b'
или
grep -o '[0-9.]\{7,\}'
решение3
Предположим, что ваш пример входных данных находится в файле с именем test.in
:
sed 's/.*\([1-9][0-9]*\.[1-9][0-9]*\.[1-9][0-9]*\.[1-9][0-9]*\).*$/\1/' test.in
Вы можете потратить много времени, чтобы все сделать «как надо», например, удалить дубликаты и т. д., но это поможет вам начать.
решение4
Способ awk
:
$ awk '{for(i=1;i<=NF;i++){if($i~/^[0-9.]{7,15}$/){print $i}}}' file
10.15.5.226
10.15.6.103
10.15.5.92
10.15.6.217
10.15.6.83
10.15.7.106
И еще один perl
способ:
$ perl -lne '/\b[0-9.]{7,15}\b/ && print $&' file
10.15.5.226
10.15.6.103
10.15.5.92
10.15.6.217
10.15.6.83
10.15.7.106