데이터에 대한 여러 구성 파일 만들기

데이터에 대한 여러 구성 파일 만들기

pair.eg Sample_27931_RNAX_ 형식의 데이터 파일이 있습니다.R1.fastq.gz 및 FASTQ/Sample_27931_RNAX_R2.fastq.gz는 하나의 샘플에 속합니다. 아래에는 각각 R1과 R2 쌍이 있는 3개 샘플에 대한 데이터가 나와 있습니다.

분석을 실행하기 위해 경로 목록을 별도로 생성합니다. 따라서 list1에는 모든 R1이 포함되고 list2에는 모든 R2가 포함됩니다.

다음은 3개 샘플의 목록1입니다.

$TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz 
$TMPDIR/FASTQ/Sample_28891_RNAX_R1.fastq.gz 
$TMPDIR/FASTQ/Sample_28897_RNAX_R1.fastq.gz

다음은 3개 샘플에 대한 list2입니다.

$TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R2.fastq.gz

각 샘플(총 3개)에 대한 구성 파일을 생성하고 싶습니다. 구성 파일은 각 샘플마다 별도로 생성되어야 합니다.

예를 들어 샘플 구성 파일은 다음과 같습니다.

**fastq1        = $TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz**
**fastq2        = $TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz**

mailto         = [email protected]
thread_no      = 8

detect_integration = yes   # if no is provided, VirusFinder will not detect virus integrations
detect_mutation    = no   # if no is provided, VirusFinder will not detect viral mutations

fastq1 및 fastq2 매개변수는 list1 및 list2의 경로를 사용하여 변경해야 하지만 나머지 콘텐츠는 동일하게 유지됩니다. list1 및 list2를 사용하여 여러 구성 파일을 만드는 방법은 무엇입니까? 구성 파일의 이름은 Sample_27931_RNAX의 경우 Sample_27931_RNAX.config.txt와 같은 샘플 이름에서 자동으로 가져와야 합니다. 유사한 게시물에 대한 제안이나 링크가 있으면 좋을 것입니다. 유사한 게시물을 찾을 수 없습니다.

감사해요,

답변1

#!/bin/bash
while IFS= read -r samp1; do

b=${samp1%_R1.fastq.gz} samp2=${b}_R2.fastq.gz

cat - <<eof > "${b##*/}.cfg"
**fastq1        = $samp1**
**fastq2        = $samp2**

mailto         = [email protected]
thread_no      = 8

detect_integration = yes  # if no is provided, VirusFinder will not detect virus integrations
detect_mutation    = no   # if no is provided, VirusFinder will not detect viral
eof
done < LIST1

첫 번째 샘플 자체에서 두 번째 샘플 fastq의 이름을 접목할 수 있으므로 List2는 실제로 필요하지 않습니다.

관련 정보