特定のパターンでファイルを分割する

Question

連想配列では、awk順序は不定です。

for (i in a)

による

n = i
for(i=1;i<=n;i++)

awkをbashスクリプトで囲むには、次のようにします。

#!/bin/bash
for file
do  awk -v file="$file" '....' "$file"
done

chmod a+rxスクリプトファイルで実行してください。また、次の行を置き換えてください。

fn="file" c;

awkスクリプトで

fn = c "_" file;

この行は、新しいファイル名の作成方法です。awk 変数には、file最初に処理されるファイルの名前が値として与えられます (構文は、awk -v 変数 = 値です)。awk 変数は新しいファイル名であり、文字とファイル名変数に連結された数値を保持するfn変数です。c_

この bash コマンドは、複数のファイルを引数として実行できます。それらのファイルは awk によって 1 つずつ処理されます。

最終結果：

#!/bin/bash
for file
do awk -v file="$file" 'function print_vals() {
   fn = c "_" file;
   print hdr > fn;
   print "REGION  chr", sn, en >> fn;
   n = i
   for(i=1;i<=n;i++)
      print a[i] >> fn;
 } NR == 1 {
   hdr=$0;
   c=0;
   next
 } NF==2 && $1 >= 1000000*c {
   if (c)
      print_vals();
   delete a;
   i=0;
   c++;
   sn=$1;
 } NF==2 {
   a[++i]=$0;
   en=$1;
 } END {
   print print_vals();
 }'  "$file"
done

Answer 1