Получить конкретную информацию из файла журнала

Question 1

«Однострочный» код на Perl:

$ perl -lne '
BEGIN{
    printf "%-10s%-10s%-10s%-10s%-15s\n", qw([user] [module] [action] [doAjax] [ajaxAction]);
} 
$usr = $mde = $act = $doAj = $ajAc = "null"; 
$usr=$1 if m|\s/([^/]+)/|; 
$mde=$1 if /m=(.+?)(&|$)/; 
$act=$1 if /a=(.+?)(&|$)/; 
$doAj=$1 if /doajax=(.+?)(&|$)/; 
$ajAc=$1 if /action=(.+?)(&|$)/; 
printf "%-10s%-10s%-10s%-10s%-15s\n", ($usr,$mde,$act,$doAj,$ajAc)' file 
[user]    [module]  [action]  [doAjax]  [ajaxAction]   
userx     contacts  form      null      null           
usery     customer  null      request   getContacts    
userx     meeting   null      date      null

Основной трюк здесь заключается в поиске каждой из строк, идентифицирующих части вашего URL, и, если они найдены, присвоении ей соответствующей переменной. В каждом случае мы ищем идентификатор, за которым следует =(например m=), а затем либо a &, либо конец строки (&|$). Поскольку совпавшая часть заключена в скобки (например m=(.+?)), мы можем ссылаться на нее как , $2и это то, что сохраняется в каждой переменной.

Если вам действительно нужен |разделитель и вы не возражаете против того, что он сделает вывод менее читабельным, вы можете использовать это:

$ perl -lne '
BEGIN{
    printf "%s|%s|%s|%s|%s\n", qw([user] [module] [action] [doAjax] [ajaxAction]);
} 
$usr = $mde = $act = $doAj = $ajAc = "null"; 
$usr=$1 if m|\s/([^/]+)/|; 
$mde=$1 if /m=(.+?)(&|$)/; 
$act=$1 if /a=(.+?)(&|$)/; 
$doAj=$1 if /doajax=(.+?)(&|$)/; 
$ajAc=$1 if /action=(.+?)(&|$)/; 
print join "|", ($usr,$mde,$act,$doAj,$ajAc)' file 
[user]|[module]|[action]|[doAjax]|[ajaxAction]
userx|contacts|form|null|null
usery|customer|null|request|getContacts
userx|meeting|null|date|null

Лучшим (более читабельным) подходом было бы использовать printfвместо этого:

Answer

«Однострочный» код на Perl:

$ perl -lne '
BEGIN{
    printf "%-10s%-10s%-10s%-10s%-15s\n", qw([user] [module] [action] [doAjax] [ajaxAction]);
} 
$usr = $mde = $act = $doAj = $ajAc = "null"; 
$usr=$1 if m|\s/([^/]+)/|; 
$mde=$1 if /m=(.+?)(&|$)/; 
$act=$1 if /a=(.+?)(&|$)/; 
$doAj=$1 if /doajax=(.+?)(&|$)/; 
$ajAc=$1 if /action=(.+?)(&|$)/; 
printf "%-10s%-10s%-10s%-10s%-15s\n", ($usr,$mde,$act,$doAj,$ajAc)' file 
[user]    [module]  [action]  [doAjax]  [ajaxAction]   
userx     contacts  form      null      null           
usery     customer  null      request   getContacts    
userx     meeting   null      date      null

Основной трюк здесь заключается в поиске каждой из строк, идентифицирующих части вашего URL, и, если они найдены, присвоении ей соответствующей переменной. В каждом случае мы ищем идентификатор, за которым следует =(например m=), а затем либо a &, либо конец строки (&|$). Поскольку совпавшая часть заключена в скобки (например m=(.+?)), мы можем ссылаться на нее как , $2и это то, что сохраняется в каждой переменной.

Если вам действительно нужен |разделитель и вы не возражаете против того, что он сделает вывод менее читабельным, вы можете использовать это:

$ perl -lne '
BEGIN{
    printf "%s|%s|%s|%s|%s\n", qw([user] [module] [action] [doAjax] [ajaxAction]);
} 
$usr = $mde = $act = $doAj = $ajAc = "null"; 
$usr=$1 if m|\s/([^/]+)/|; 
$mde=$1 if /m=(.+?)(&|$)/; 
$act=$1 if /a=(.+?)(&|$)/; 
$doAj=$1 if /doajax=(.+?)(&|$)/; 
$ajAc=$1 if /action=(.+?)(&|$)/; 
print join "|", ($usr,$mde,$act,$doAj,$ajAc)' file 
[user]|[module]|[action]|[doAjax]|[ajaxAction]
userx|contacts|form|null|null
usery|customer|null|request|getContacts
userx|meeting|null|date|null

Лучшим (более читабельным) подходом было бы использовать printfвместо этого:

Question 2

Если вы предпочитаете делать это в awk, вы можете сделать следующее. Split позволяет вам разделить строку с любым разделителем полей.

awk  '{split($7,a,"/"); split(a[3],b,"m="); split(b[2],c,"&"); split(c[2],d,"="); print a[2], c[1], d[1], d[2] }' logfile

Это сгенерирует нужные столбцы.

userx contacts a form
usery customer doajax request
userx meeting doajax date

Остался последний шаг — форматирование. Массивы в awk ассоциативны и могут индексироваться строками — см.здесь. Вы можете сделать следующее; здесь op (сокращение от output) инициализируется значением null. Затем мы устанавливаем op[d[1]]=d[2].

awk  '{split($7,a,"/"); split(a[3],b,"m="); split(b[2],c,"&"); split(c[2],d,"="); op["a"]="null"; op["doajax"]="null"; op["ajaxaction"]="null"; op[d[1]]=d[2];print a[2], c[1], op["a"], op["doajax"], op["ajaxaction"] }' junk.txt

[изменено на]

awk  '{split($7,a,"/"); split(a[3],b,"m="); split(b[2],c,"&"); split(c[2],d,"="); op["a"]="null"; op["doajax"]="null"; op["action"]="null"; op[d[1]]=d[2]; split(c[3],f,"="); split(f[2],g,"."); op[f[1]]=g[1]; print a[2], c[1], op["a"], op["doajax"], op["action"] }' junk.txt

Вывод следующий

userx contacts form null null
usery customer null request getContacts
userx meeting null date null

Answer

Если вы предпочитаете делать это в awk, вы можете сделать следующее. Split позволяет вам разделить строку с любым разделителем полей.

awk  '{split($7,a,"/"); split(a[3],b,"m="); split(b[2],c,"&"); split(c[2],d,"="); print a[2], c[1], d[1], d[2] }' logfile

Это сгенерирует нужные столбцы.

userx contacts a form
usery customer doajax request
userx meeting doajax date

Остался последний шаг — форматирование. Массивы в awk ассоциативны и могут индексироваться строками — см.здесь. Вы можете сделать следующее; здесь op (сокращение от output) инициализируется значением null. Затем мы устанавливаем op[d[1]]=d[2].

awk  '{split($7,a,"/"); split(a[3],b,"m="); split(b[2],c,"&"); split(c[2],d,"="); op["a"]="null"; op["doajax"]="null"; op["ajaxaction"]="null"; op[d[1]]=d[2];print a[2], c[1], op["a"], op["doajax"], op["ajaxaction"] }' junk.txt

[изменено на]

awk  '{split($7,a,"/"); split(a[3],b,"m="); split(b[2],c,"&"); split(c[2],d,"="); op["a"]="null"; op["doajax"]="null"; op["action"]="null"; op[d[1]]=d[2]; split(c[3],f,"="); split(f[2],g,"."); op[f[1]]=g[1]; print a[2], c[1], op["a"], op["doajax"], op["action"] }' junk.txt

Вывод следующий

userx contacts form null null
usery customer null request getContacts
userx meeting null date null

Question 3

perl -lane '
BEGIN {
   print $H = join "|", map { s/.*/[$&]/r } @H = qw/user module action doAjax ajaxAction/;
   pos($H) = 0;
   push(@pos, pos($H)-$p), $p=pos($H) while $H =~ /\[/g;
   $fmt = join "", map { "\%-${_}s" } @pos[1..$#pos], length($H)-$p;
}

   my(%h, %H) = $F[-1] =~ /[?&]\K([^=]+)=([^&]+)/g;
   @H{@H} = ($F[-1] =~ m|^/([^/]+)|, @h{qw/m a doajax action/});
   print sprintf $fmt, map { $H{$_} // "null" } @H;
' logfile

Полученные результаты

[user]|[module]|[action]|[doAjax]|[ajaxAction]
userx  contacts form     null     null
usery  customer null     request  getContacts
userx  meeting  null     date     null

Объяснение

Параметры Perl:

-l делаетORS = RS = \n

-aсохраняет поля в массиве @F, полученном путем разбиения текущей записи на /\s+/, например,$F[0] => $1, $F[1] => $2, ..., $F[-1] => $NF

-n устанавливает неявный цикл, который считывает входной файл построчно И не выводит никаких данных, если это не запрошено.
НАЧАЛО блока:

Сначала мы печатаем заголовок. Затем мы динамически определяем формат на основе заголовка. Для каждой прочитанной строки мы настраиваем хеш %h, ключами которого являются строки до =, а значениями — строки после =. Строка, которую нужно просмотреть, примыкает к ? или & слева и & справа. Затем мы настраиваем еще один хеш %H, ключами которого являются переименованные версии хеша %h. Затем мы печатаем хеш на основе формата, который мы вычислили в блоке BEGIN.

Answer

perl -lane '
BEGIN {
   print $H = join "|", map { s/.*/[$&]/r } @H = qw/user module action doAjax ajaxAction/;
   pos($H) = 0;
   push(@pos, pos($H)-$p), $p=pos($H) while $H =~ /\[/g;
   $fmt = join "", map { "\%-${_}s" } @pos[1..$#pos], length($H)-$p;
}

   my(%h, %H) = $F[-1] =~ /[?&]\K([^=]+)=([^&]+)/g;
   @H{@H} = ($F[-1] =~ m|^/([^/]+)|, @h{qw/m a doajax action/});
   print sprintf $fmt, map { $H{$_} // "null" } @H;
' logfile

Полученные результаты

[user]|[module]|[action]|[doAjax]|[ajaxAction]
userx  contacts form     null     null
usery  customer null     request  getContacts
userx  meeting  null     date     null

Объяснение

Параметры Perl:

-l делаетORS = RS = \n

-aсохраняет поля в массиве @F, полученном путем разбиения текущей записи на /\s+/, например,$F[0] => $1, $F[1] => $2, ..., $F[-1] => $NF

-n устанавливает неявный цикл, который считывает входной файл построчно И не выводит никаких данных, если это не запрошено.
НАЧАЛО блока:

Сначала мы печатаем заголовок. Затем мы динамически определяем формат на основе заголовка. Для каждой прочитанной строки мы настраиваем хеш %h, ключами которого являются строки до =, а значениями — строки после =. Строка, которую нужно просмотреть, примыкает к ? или & слева и & справа. Затем мы настраиваем еще один хеш %H, ключами которого являются переименованные версии хеша %h. Затем мы печатаем хеш на основе формата, который мы вычислили в блоке BEGIN.

Получить конкретную информацию из файла журнала

решение1

решение2

решение3

Полученные результаты

Объяснение

Связанный контент