
0.99
私は csv ファイルを持っており、その行の最初のセルである行のインデックス で始まる数字を確認したいと考えています。
これまでのところ、次のものがあります:
cat fil.csv | grep '0\\.99'| tee > (cut -d, -f1) | tr , \\n | grep '0\\.99'
入力:
id, f1,f2,f3
f1,0.54,0.12,0.432
f2,0.1231,0.99999,0.99832
f3,0.121,nan,0.12321
f4,0.99712,0.121,0.434
望ましい出力: 理想的にはこれが欲しいのですが、ワンライナーでは複雑すぎます:
f2,0.99999,0.99832
f4,0.99712
これで満足できます。これは私が書いたコマンドに求めていたものです。
f2
0.99999
0.99832
f4
0.99712
答え1
awk の場合:
$ awk -F, '$0~"0\\.99*"{printf $1;for(i=1;i<=NF;i++){if($i~"0\\.99*"){printf ","$i}};printf "\n"}'
f2,0.99999,0.99832
f4,0.99712
より読みやすい形式では:
$ awk -F, '
$0~"0\\.99*"{
printf $1
for(i=1; i<=NF; i++){
if($i~"0\\.99*"){
printf ","$i
}
}
printf "\n"
}
'
答え2
使用できる場合perl
:
$ perl -F, -anle '
BEGIN { $, = "," }
@h = grep { /^0\.99/ } @F;
print $F[0], @h if @h;
' file
f2,0.99999,0.99832
f4,0.99712