Подсчет почасовых данных из файла журнала

Подсчет почасовых данных из файла журнала

Я хочу получить количество записей за каждый час из файла журнала. Вот пример данных;

001:2017-05-23 00:00:01 002:10.10.10.63
001:2017-05-23 00:00:03 002:10.10.10.63
001:2017-05-23 00:00:05 002:10.10.10.63
001:2017-05-23 00:00:07 002:10.10.10.63
001:2017-05-23 00:00:09 002:10.10.10.63
001:2017-05-23 01:00:12 002:10.10.10.63
001:2017-05-23 01:00:14 002:10.10.10.63

из вышеизложенного вывод данных должен быть:

00 = 5
01 = 2

решение1

cut -f2 -d' ' logfile
| cut -f1 -d:
| sort
| uniq -c
| sed 's/ *\([0-9]\+\) \([0-9][0-9]\)/\2 = \1/'
| sort
  1. выводит только время.
  2. извлекает только часы.
  3. сортировка вывода - требуется по следующей строке
  4. подсчитывает количество событий каждого часа, выводитcount hour
  5. исправляет форматирование
  6. сортирует по часам

решение2

Вы можете использовать findатрибут -printf, как показано ниже. Я использовал его в своей повседневной работе:

find /path/ -type f -printf '%TY-%Tm-%Td-%TH\n' | sort | uniq -c

решение3

Есть много решений, одно из них —

log_file=/var/log/messages                        # log file for extract
d=2022-10-28                                      # start date
while [ "$d" != 2022-11-04 ]; do                  # loop for date range
  echo $d                                         # echo ACTUAL date
  for h in {00..24}; do                           # loop for hours
    act=$(date -d "$d" +'%b %d')" $h:"            # create date for ACTUAL date in requested format: %b return month in Jan Feb..., %d return month number
    echo $act                                     # Print actual hour
    grep "^$act" $log_file                        # grep $ACT from beginning of line of log_file and count lines
  done
  d=$(date -I -d "$d + 1 day")                    # add +1 day for start date to the main loop
done 

Связанный контент