
2 つのファイルがあります。必要なのは、両方のファイルの列 1 に基づいて共通行を見つけ、一致する場合は新しいファイル col1 (2 つのファイルに共通)、file1col2、および file2col2 に書き込むことです。
ファイル1:
col1 file1col2
10:100000525-100001560(+) 0.971465226620556
10:100001724-100002618(+) 0.940918504451204
10:100002725-100002970(+) 0.946592696189412
10:100003104-100004184(+) 0.736305487299153
10:100004450-100005051(+) 0.70823022283736
10:100005158-100005876(+) 0.969728923411704
10:100006075-100007551(+) 0.855411430976336
10:100007764-100009009(+) 0.274219271261146
10:100009146-100011362(+) 0.927057564779308
10:100011583-100011887(+) 0.883431738847249
ファイル2
col1 file2col2
10:100000525-100001560(+) 0.943385996874889
10:100001724-100002618(+) 0.981929023174133
10:100002725-100002970(+) 0.955549170283206
10:100003104-100004184(+) 0.736440826679551
10:100004450-100005051(+) 0.689045711238636
10:100005158-100005876(+) 0.964995337925152
10:100006075-100007551(+) 0.873411848029685
10:100007764-100009009(+) 0.37719743446494
10:100009146-100011362(+) 0.943862343124518
10:100011583-100011887(+) 0.902915705720447
望ましい出力
col1(common between two files) file1col2 file2col2
10:100000525-100001560(+) 0.971465227 0.943385997
10:100001724-100002618(+) 0.940918504 0.981929023
10:100002725-100002970(+) 0.946592696 0.95554917
10:100003104-100004184(+) 0.736305487 0.736440827
10:100004450-100005051(+) 0.708230223 0.689045711
10:100005158-100005876(+) 0.969728923 0.964995338
10:100006075-100007551(+) 0.855411431 0.873411848
10:100007764-100009009(+) 0.274219271 0.377197434
10:100009146-100011362(+) 0.927057565 0.943862343
10:100011583-100011887(+) 0.883431739 0.902915706
答え1
参加する+awk解決:
join --header file1 file2 | awk 'NR>1{ $2=sprintf("%1.9f",$2); $3=sprintf("%.9f",$3) }1' > result.txt
cat result.txt
col1 file1col2 file2col2
10:100000525-100001560(+) 0.971465227 0.943385997
10:100001724-100002618(+) 0.940918504 0.981929023
10:100002725-100002970(+) 0.946592696 0.955549170
10:100003104-100004184(+) 0.736305487 0.736440827
10:100004450-100005051(+) 0.708230223 0.689045711
10:100005158-100005876(+) 0.969728923 0.964995338
10:100006075-100007551(+) 0.855411431 0.873411848
10:100007764-100009009(+) 0.274219271 0.377197434
10:100009146-100011362(+) 0.927057565 0.943862343
10:100011583-100011887(+) 0.883431739 0.902915706
詳細:
参加する
--header
オプション - 各ファイルの最初の行をフィールドヘッダーとして扱い、それらをペアにせずに印刷します。NR>1
- 2番目のレコード(NR
- 現在のレコードの番号)から処理を開始する、つまり - スキップするヘッダラインsprintf("%1.9f",$2)
- 引数$2
(2列目)を小数点以下9桁の浮動小数点数としてフォーマットする