為資料建立多個設定檔

為資料建立多個設定檔

我有pairs.eg Sample_27931_RN​​AX_形式的資料文件R1.fastq.gz 和 FASTQ/Sample_27931_RN​​AX_R2.fastq.gz 屬於一個樣本。

為了執行分析,我分別建立了它們的路徑清單。

這是 3 個樣本的列表 1

$TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz 
$TMPDIR/FASTQ/Sample_28891_RNAX_R1.fastq.gz 
$TMPDIR/FASTQ/Sample_28897_RNAX_R1.fastq.gz

這是 3 個樣本的清單2

$TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R2.fastq.gz

我想為每個範例(共 3 個)建立設定檔。需要為每個範例單獨建立設定檔。

例如,範例設定檔如下:

**fastq1        = $TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz**
**fastq2        = $TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz**

mailto         = [email protected]
thread_no      = 8

detect_integration = yes   # if no is provided, VirusFinder will not detect virus integrations
detect_mutation    = no   # if no is provided, VirusFinder will not detect viral mutations

fastq1 和 fastq2 參數需要使用 list1 和 list2 中的路徑進行更改,但其餘內容保持不變。設定檔的名稱應自動取自樣本名稱,例如 Sample_27931_RN​​AX 的 Sample_27931_RN​​AX.config.txt。任何建議或任何類似帖子的連結都會很好。

謝謝,

榮恩

答案1

#!/bin/bash
while IFS= read -r samp1; do

b=${samp1%_R1.fastq.gz} samp2=${b}_R2.fastq.gz

cat - <<eof > "${b##*/}.cfg"
**fastq1        = $samp1**
**fastq2        = $samp2**

mailto         = [email protected]
thread_no      = 8

detect_integration = yes  # if no is provided, VirusFinder will not detect virus integrations
detect_mutation    = no   # if no is provided, VirusFinder will not detect viral
eof
done < LIST1

請注意,List2 實際上不是必要的,因為我們可以從第一個樣本本身嫁接第二個樣本 fastq 的名稱。

相關內容