次の csv ファイルがあります:
"V1","V2","V3","V4","V5","V6","V7","V8","V9","V10","Class"
65,Female,0.7,0.1,187,16,18,6.8,3.3,0.9,1
62,Male,10.9,5.5,699,64,100,7.5,3.2,0.74,1
62,Male,7.3,4.1,490,60,68,7,3.3,0.89,1
58,Male,1,0.4,182,14,20,6.8,3.4,1,1
72,Male,3.9,2,195,27,59,7.3,2.4,0.4,1
46,Male,1.8,0.7,208,19,14,7.6,4.4,1.3,1
私が興味があるのは、列 V1:age、V2:sex、V8:grade1、V9:grade2 だけです。
V9 が 3 に等しいデータを出力し、その出力を性別で並べ替えて女性のデータを最初に表示する bash スクリプトを作成したいと思います。
私は bash スクリプトの完全な初心者であり、シェルからこの出力を取得する方法は知っていますが、bash スクリプトのコマンドに関してはこれしか思いつきませんでした。
#!/usr/bin/env bash
INPUT=./phpOJxGL9.csv
OLDIFS=$IFS
IFS=','
[ ! -f $INPUT ] && { echo "$INPUT file not found"; exit 99; }
echo Grade2 = 3
echo Age Sex Grade2 Grade1
echo '************************'
while read V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
do
if [ $V9 -eg "3" ];
then
cut -d',' -f1,2,8,9 | sort -k2 -t','
fi
done < $INPUT
IFS=$OLDIFS
出力は次のようになります。
誰か助けてくれませんか?
答え1
独自の bash スクリプトは良いスタートです。しかし、適切なツールを使用すると作業が簡単になります。次に例を示します。サンプル入力には v9=3 が含まれていないため、コマンドを示すために v9>=3 を使用しました。
tail -n+2 your-input | awk -F, '($9>=3){print $1, $2, $8, $9}' | sort -k2 | awk 'OFS="," {print $1,$2,$3,$4}'
65,Female,6.8,3.3
58,Male,6.8,3.4
62,Male,7,3.3
62,Male,7.5,3.2
46,Male,7.6,4.4
説明: tail -n+2 はタイトル行を削除するだけです。
列の並べ替えオプションを使用する前に、タブまたはスペースで区切る必要があることに注意してください。
2番目のawkはスペースをカンマに置き換えるものです
答え2
スクリプトはほぼ完成しています。残っているのは、if 条件V9
で が に等しいかどうかをチェックすることだけです3
。女性のデータを最初に表示するには、最初の引数として性別を必要とする関数に while ループを配置し、性別ごとに関数を 1 回実行することをお勧めします。
INPUT=phpOJxGL9.csv
OLDIFS=$IFS
IFS=','
[ ! -f $INPUT ] && { echo "$INPUT file not found"; exit 99; }
function readCsv {
while read V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
do
requiredGender="$1"
if [[ "$V2" == "$requiredGender" ]]
then
if [[ "$V9" == "3" ]]
then
echo "$V1,$V2,$V8,$V9"
fi
fi
done < $INPUT
}
echo Grade2 = 3
echo Age Sex Grade2 Grade1
echo '************************'
echo
echo "Women"
echo "--------------"
readCsv "Female"
echo
echo "Men"
echo "--------------"
readCsv "Male"
IFS=$OLDIFS
スクリプトを実行するには、実行可能にする必要があります。
chmod +x script.sh
./script.sh
V9
上記で提供した csv ファイルにはが に等しい列が 1 つも含まれていないため、上記のスクリプトを実行してもデータは出力されないことに注意してください3
。次の 2 つのサンプル列を追加しました。
50,Female,,,,,,1,3,,
50,Male,,,,,,1,3,,
スクリプトの出力は次のようになります。
Grade2 = 3
Age Sex Grade2 Grade1
************************
Women
--------------
50,Female,1,3
Men
--------------
50,Male,1,3