
我有pairs.eg Sample_27931_RNAX_形式的資料文件R1.fastq.gz 和 FASTQ/Sample_27931_RNAX_R2.fastq.gz 屬於一個樣本。
為了執行分析,我分別建立了它們的路徑清單。
這是 3 個樣本的列表 1
$TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R1.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R1.fastq.gz
這是 3 個樣本的清單2
$TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R2.fastq.gz
我想為每個範例(共 3 個)建立設定檔。需要為每個範例單獨建立設定檔。
例如,範例設定檔如下:
**fastq1 = $TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz**
**fastq2 = $TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz**
mailto = [email protected]
thread_no = 8
detect_integration = yes # if no is provided, VirusFinder will not detect virus integrations
detect_mutation = no # if no is provided, VirusFinder will not detect viral mutations
fastq1 和 fastq2 參數需要使用 list1 和 list2 中的路徑進行更改,但其餘內容保持不變。設定檔的名稱應自動取自樣本名稱,例如 Sample_27931_RNAX 的 Sample_27931_RNAX.config.txt。任何建議或任何類似帖子的連結都會很好。
謝謝,
榮恩
答案1
#!/bin/bash
while IFS= read -r samp1; do
b=${samp1%_R1.fastq.gz} samp2=${b}_R2.fastq.gz
cat - <<eof > "${b##*/}.cfg"
**fastq1 = $samp1**
**fastq2 = $samp2**
mailto = [email protected]
thread_no = 8
detect_integration = yes # if no is provided, VirusFinder will not detect virus integrations
detect_mutation = no # if no is provided, VirusFinder will not detect viral
eof
done < LIST1
請注意,List2 實際上不是必要的,因為我們可以從第一個樣本本身嫁接第二個樣本 fastq 的名稱。