2 つの条件を持つ 2 つの列による一意性

2 つの条件を持つ 2 つの列による一意性

列のあるテーブルがあります。最初の列にはユーザーがログインした時間があり、2 番目の列にはユーザーの名前があります。

13:15:39  fxs1cia1qulm1lk  
13:15:39  fxs1cia1qulm1lk  
13:15:39  fxs1cia1qulm1lk  
13:15:42  faaaa2aa11111  
13:15:49  terd1sfsd11fsdf  
13:15:49  terd1sfsd11fsdf  
13:15:49  terd1sfsd11fsdf  
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab   
13:19:19  fxs1ce1iulmla   
13:19:19  fxs1ce1iulmla  
13:19:19  fxs1ce1iulmla   
13:20:42  faaa2a0a1111

では、何をすべきでしょうか。この 2 つの列を一意に更新する必要があります。ユーザーがログインした時間とユーザー名が同じ場合は、そのユーザーが 3 回以上ログインしたと判断する必要があります。短いスクリプトを作成しました。

log_file=/root/log
temp_file=/root/temp
temp_file2=/root/temp2

cat /dev/null > $temp_file
cat /dev/null > $temp_file2
cat /dev/null > $result_file

cat $log_file | awk '{print $1}' | tail -n 20 > $temp_file
cat $log_file | awk '{print $5}' | tail -n 20 > $temp_file2

for i in `uniq -c $temp_file | awk '{print $1}'`; do
for y in `uniq -c $temp_file2 | awk '{print $2}'`; do
if [ $i -gt 3 ] && [ $y -gt 3 ]; then
s=`uniq -c $temp_file2 | awk '$1 == '$i`
echo "The user $s has logged more than 3 times"
fi
done
done

このスクリプトが正しいかどうか確認してください。スクリプトを echo で出力した結果は次のようになります。

The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times

しかし、次のような出力を得たいのです:

The user       4 21erdsf123sdfsdf has logged more than 3 times
The user       4 abcasbbabadab  has logged more than 3 times

以上です。どこに間違いがあるのでしょうか? 助けてください。

答え1

これは非常に簡単な方法で行うことができますawk

awk '{ users[$2]++ }
END {
     for (user in users)
       if (users[user] > 1)
         printf "%s logged in %d times\n", user, users[user]
    }' < /root.log

このプログラムは、root.log をスキャンして、すべてのユーザーの数を含む連想配列 (ハッシュとも呼ばれます) を作成し、1 より大きい数を出力します。

答え2

つまり、唯一の問題は、同じ出力が複数回印刷されることです。なぜ uniq をパイプしないのですか? 別の一時ファイルにダンプしてから、その上で uniq を実行してください。

もしそれがあなたの質問ではないのであれば、私はいくつかの観察結果を持っています:

  • bash/sh で行区切りデータを扱うのは、たいてい手間がかかります。解決策が明らかでない限り、IFS を常にいじる必要のないスクリプト言語を使用してください。(IFS 変数がわからない場合は、行区切りデータには bash/sh を使用しないことを強くお勧めします。)
  • すでに awk を使用しているので、すべてを awk スクリプトとして実行できると思います。
  • 関心のある行は同一なので、 を実行できますsort logfile | uniq -c
  • uniq の前にファイルをソートしていないため、同一の行が隣接していない場合は uniq は機能しません。たとえば、bob と joe が同時にログインし、ログ エントリが交互に表示される場合などです。
  • grep -cは常に存在する
  • ソートコマンド、特に-d、-n、-k、-tについて読んでください。

アップデート

シェル スクリプトに関するアドバイスを求めていますか。それとも、現在 3 つ以上のセッションにログインしているユーザーを見つけるにはどうすればよいかという質問に対する実用的な回答をお探しですか。

スクリプトのアドバイス:

  • $s改行を含む文字列全体が含まれていることは確かです4 21erdsf123sdfsdf <newline> 4 abcasbbabadab。その理由はよくわかりません。
  • なぜそうするのですかawk '{print $5}'? サンプル データをコピーして実行してみましたがawk '{print $5}'、大量の改行が表示されましたが、それ以外は何も表示されませんでした。
  • の内容を確認し$temp_fileて、$temp_file2期待どおりであることを確認しましたか?
  • tail -n 20単に「最近の」エントリが欲しいだけで、どれくらい新しいかは気にしないと言っています。これは本当ですか?
  • cat /dev/null > $fileは冗長なので削除してください。
  • cat $logfilesort $logfile
  • ループをインデントする

基本的に、このスクリプトはあなたが望むことを実行しませんし、どのように動作させるつもりだったのかもわかりませんので、より具体的なアドバイスはできません。申し訳ありません。

実用的

  • @greg-tarsa の awk スクリプトを使用します (Greg さん、申し訳ありません。ユーザー名にスペースが入っていることを知りませんでした)
  • UNIX ボックスへの現在のログインについて話しているのですか?whoコマンドを試しましたか? EGwho | awk '{ print $1}' | sort | uniq -c | sort -d -rまたはlastコマンド?
  • すでに実装しようとしているソリューション (2 つの条件を持つ 2 つの列による一意性) を妨げているより具体的な質問ではなく、全体的な質問 (ログイン回数が多すぎるユーザーを見つけるにはどうすればよいですか) に対する回答を検索します。シェル スクリプトの練習に興味がある場合は、そのように質問してください。

関連情報