for ループを使用して、さまざまなファイルから .extension の前の 4 つのランダムな文字を削除するにはどうすればよいでしょうか?

Question 1

次のようなことを試してください:

for forward_read_file in *_1*.fastq; do
   srr=$(echo "$forward_read_file" | cut -d_ -f1)
   rrf_array=( $(find . -name "${srr}_2_*.fastq") )

   case "${#rrf_array[@]}" in
     0) echo "Warning: No reverse read file found for $forward_read_file" > /dev/stderr ;;

     1) reverse_read_file="${rrf_array[1]}"
        perl /home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/AmbiguityFiltering.pl -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3
        ;;

     *) echo "Error: multiple reverse read files found for $forward_read_file" > /dev/stderr ;;
   esac

done

これはすべてのファイルを反復処理します_1。を使用してcutSRR サンプル ID を抽出し、それをコマンドで使用して一致するファイル findを検索します。の出力は、返される結果の数がわからないため、配列に格納されます。_2find

これは、一致なし (良くない)、正確に 1 つの一致 (良い、これが望ましい)、および 1 つ以上の一致 (これも良くない) という 3 つの結果を処理します。

結果が 1 つしかない場合は、配列から一致するファイルを抽出し、Perl スクリプトで処理します。

結果が 0 個または複数個ある場合は、警告メッセージを stderr に出力し、次のファイル名に進みます。必要に応じて、これらのケースの前に (またはエラーを処理する他のコード)_1を追加できます。; exit 1;;

これにより、先頭の SRR サンプル ID と、順方向または逆方向のペアリングファイルであることを識別する_1またはを除く、ファイル名のすべての部分が無視されます。_2

if; then; elseちなみに、これはステートメントの代わりにで実行することもできますcaseが、ゼロの場合と複数の場合を別々に処理すると便利だと思いました。例:

if [ "${#rrf_array[@]}" == 1 ]; 
  reverse_read_file="${rrf_array[1]}"
  perl /home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/AmbiguityFiltering.pl -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3
else
  echo "Warning: unknown problem with reverse read file for $forward_read_file" > /dev/stderr
fi

「問題のある」ファイルを無視したいだけの場合は、elseブロックを削除します。

ちなみに、スクリプトを読みやすくするために、スクリプトの先頭近くで次のようなことをすることをお勧めします。

AFilter='/home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/AmbiguityFiltering.pl'

以降：

perl "$AFilter" -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3

あるいは、perl スクリプトが実行可能 (#!/usr/bin/perlまたは同様のシェバン行があり、実行可能フラグがで設定されている) である場合は、 $PATH に以下chmod +xを追加するだけです。/home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/

PATH="$PATH:/home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming"

次のようにスクリプトを実行します。

AmbiguityFiltering.pl -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3

Answer