
ペア形式のデータファイルがあります。例: Sample_27931_RNAX_R1.fastq.gz & FASTQ/Sample_27931_RNAX_R2.fastq.gz は 1 つのサンプルに属します。以下に、それぞれ R1 と R2 のペアを持つ 3 つのサンプルのデータを示します。
分析を実行するために、それらのパスのリストを個別に作成します。したがって、list1 にはすべての R1 が含まれ、list2 にはすべての R2 が含まれます。
3つのサンプルのリスト1はこちら
$TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R1.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R1.fastq.gz
3つのサンプルのリスト2はこちら
$TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R2.fastq.gz
サンプルごとに設定ファイルを作成したい(合計 3 つ)。設定ファイルはサンプルごとに個別に作成する必要があります。
たとえば、サンプル設定ファイルは以下のとおりです。
**fastq1 = $TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz**
**fastq2 = $TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz**
mailto = [email protected]
thread_no = 8
detect_integration = yes # if no is provided, VirusFinder will not detect virus integrations
detect_mutation = no # if no is provided, VirusFinder will not detect viral mutations
fastq1 および fastq2 パラメータは、list1 および list2 からのパスを使用して変更する必要がありますが、残りの内容は同じままです。list1 および list2 を使用して複数の構成ファイルを作成するにはどうすればよいでしょうか。構成ファイルの名前は、Sample_27931_RNAX の場合は Sample_27931_RNAX.config.txt のように、サンプルの名前から自動的に取得されます。同様の投稿への提案やリンクがあればありがたいです。同様の投稿は見つかりませんでした。
ありがとう、
ロン
答え1
#!/bin/bash
while IFS= read -r samp1; do
b=${samp1%_R1.fastq.gz} samp2=${b}_R2.fastq.gz
cat - <<eof > "${b##*/}.cfg"
**fastq1 = $samp1**
**fastq2 = $samp2**
mailto = [email protected]
thread_no = 8
detect_integration = yes # if no is provided, VirusFinder will not detect virus integrations
detect_mutation = no # if no is provided, VirusFinder will not detect viral
eof
done < LIST1
2 番目のサンプル fastq の名前を最初のサンプル自体から移植できるため、List2 は実際には必要ありません。