列のあるテーブルがあります。最初の列にはユーザーがログインした時間があり、2 番目の列にはユーザーの名前があります。
13:15:39 fxs1cia1qulm1lk
13:15:39 fxs1cia1qulm1lk
13:15:39 fxs1cia1qulm1lk
13:15:42 faaaa2aa11111
13:15:49 terd1sfsd11fsdf
13:15:49 terd1sfsd11fsdf
13:15:49 terd1sfsd11fsdf
13:15:59 21erdsf123sdfsdf
13:15:59 21erdsf123sdfsdf
13:15:59 21erdsf123sdfsdf
13:15:59 21erdsf123sdfsdf
13:17:50 abcasbbabadab
13:17:50 abcasbbabadab
13:17:50 abcasbbabadab
13:17:50 abcasbbabadab
13:19:19 fxs1ce1iulmla
13:19:19 fxs1ce1iulmla
13:19:19 fxs1ce1iulmla
13:20:42 faaa2a0a1111
では、何をすべきでしょうか。この 2 つの列を一意に更新する必要があります。ユーザーがログインした時間とユーザー名が同じ場合は、そのユーザーが 3 回以上ログインしたと判断する必要があります。短いスクリプトを作成しました。
log_file=/root/log
temp_file=/root/temp
temp_file2=/root/temp2
cat /dev/null > $temp_file
cat /dev/null > $temp_file2
cat /dev/null > $result_file
cat $log_file | awk '{print $1}' | tail -n 20 > $temp_file
cat $log_file | awk '{print $5}' | tail -n 20 > $temp_file2
for i in `uniq -c $temp_file | awk '{print $1}'`; do
for y in `uniq -c $temp_file2 | awk '{print $2}'`; do
if [ $i -gt 3 ] && [ $y -gt 3 ]; then
s=`uniq -c $temp_file2 | awk '$1 == '$i`
echo "The user $s has logged more than 3 times"
fi
done
done
このスクリプトが正しいかどうか確認してください。スクリプトを echo で出力した結果は次のようになります。
The user 4 21erdsf123sdfsdf
4 abcasbbabadab has logged more than 3 times
The user 4 21erdsf123sdfsdf
4 abcasbbabadab has logged more than 3 times
The user 4 21erdsf123sdfsdf
4 abcasbbabadab has logged more than 3 times
The user 4 21erdsf123sdfsdf
4 abcasbbabadab has logged more than 3 times
しかし、次のような出力を得たいのです:
The user 4 21erdsf123sdfsdf has logged more than 3 times
The user 4 abcasbbabadab has logged more than 3 times
以上です。どこに間違いがあるのでしょうか? 助けてください。
答え1
これは非常に簡単な方法で行うことができますawk
awk '{ users[$2]++ }
END {
for (user in users)
if (users[user] > 1)
printf "%s logged in %d times\n", user, users[user]
}' < /root.log
このプログラムは、root.log をスキャンして、すべてのユーザーの数を含む連想配列 (ハッシュとも呼ばれます) を作成し、1 より大きい数を出力します。
答え2
つまり、唯一の問題は、同じ出力が複数回印刷されることです。なぜ uniq をパイプしないのですか? 別の一時ファイルにダンプしてから、その上で uniq を実行してください。
もしそれがあなたの質問ではないのであれば、私はいくつかの観察結果を持っています:
- bash/sh で行区切りデータを扱うのは、たいてい手間がかかります。解決策が明らかでない限り、IFS を常にいじる必要のないスクリプト言語を使用してください。(IFS 変数がわからない場合は、行区切りデータには bash/sh を使用しないことを強くお勧めします。)
- すでに awk を使用しているので、すべてを awk スクリプトとして実行できると思います。
- 関心のある行は同一なので、 を実行できます
sort logfile | uniq -c
。 - uniq の前にファイルをソートしていないため、同一の行が隣接していない場合は uniq は機能しません。たとえば、bob と joe が同時にログインし、ログ エントリが交互に表示される場合などです。
- grep -cは常に存在する
- ソートコマンド、特に-d、-n、-k、-tについて読んでください。
アップデート
シェル スクリプトに関するアドバイスを求めていますか。それとも、現在 3 つ以上のセッションにログインしているユーザーを見つけるにはどうすればよいかという質問に対する実用的な回答をお探しですか。
スクリプトのアドバイス:
$s
改行を含む文字列全体が含まれていることは確かです4 21erdsf123sdfsdf <newline> 4 abcasbbabadab
。その理由はよくわかりません。- なぜそうするのですか
awk '{print $5}'
? サンプル データをコピーして実行してみましたがawk '{print $5}'
、大量の改行が表示されましたが、それ以外は何も表示されませんでした。 - の内容を確認し
$temp_file
て、$temp_file2
期待どおりであることを確認しましたか? tail -n 20
単に「最近の」エントリが欲しいだけで、どれくらい新しいかは気にしないと言っています。これは本当ですか?- 行
cat /dev/null > $file
は冗長なので削除してください。 - を
cat $logfile
sort $logfile
- ループをインデントする
基本的に、このスクリプトはあなたが望むことを実行しませんし、どのように動作させるつもりだったのかもわかりませんので、より具体的なアドバイスはできません。申し訳ありません。
実用的
- @greg-tarsa の awk スクリプトを使用します (Greg さん、申し訳ありません。ユーザー名にスペースが入っていることを知りませんでした)
- UNIX ボックスへの現在のログインについて話しているのですか?
who
コマンドを試しましたか? EGwho | awk '{ print $1}' | sort | uniq -c | sort -d -r
またはlast
コマンド? - すでに実装しようとしているソリューション (2 つの条件を持つ 2 つの列による一意性) を妨げているより具体的な質問ではなく、全体的な質問 (ログイン回数が多すぎるユーザーを見つけるにはどうすればよいですか) に対する回答を検索します。シェル スクリプトの練習に興味がある場合は、そのように質問してください。