tee in for loop não funciona como esperado

Question

cite suas variáveis
não analise ls
opcional, mas recomendado: simplifique seu script enão se repita. Você gera o nome base duas vezes com sed e acrescenta um sufixo diferente a cada vez - seria melhor gerá-lo uma vez - isso reduziria o risco de bugs e melhoraria a legibilidade (e melhoraria um pouco o desempenho - é "mais barato" fazer algo uma vez e reutilizar o resultado do que fazer exatamente a mesma operação duas ou mais vezes).
legibilidade (ou seja, a capacidade de ler eentenderum programa que você escreveu) é um dos, se nãooas coisas mais importantes ao escrever código....então, sempre que o desempenho não for absolutamente crítico, é melhor priorizar a escrita do seu código de uma forma que o torne mais fácil de entender. Isso pode significar inserir mais quebras de linha ou recuos, ou dividir comandos longos e complicados em comandos mais curtos e mais simples. Isso ajudará a escrever e depurar o script AGORA e também ajudará você a entendê-lo quando precisar revisitá-lo em X meses (ou anos).

for ea in *.bam; do
  bn="$(basename "$ea" .bam)"
  samtools mpileup -f "$ref" "$ea" |
    tee \
      >(java -jar "$varscan2" mpileup2indel --output-vcf 1 > "vcf/${bn}_mpileup2indel.vcf") \
      >(java -jar "$varscan2" mpileup2snp --output-vcf 1 > "vcf/${bn}_mpileup2snp.vcf") |
    tail -n 5
done

Observe os vários níveis de recuo. por exemplo, tee é ligeiramente recuado de samtools, então os argumentos de tee são recuados de tee, e então a cauda volta ao mesmo nível de indentação de tee. Tudo isso ajuda a entender quais argumentos pertencem a qual programa e onde você está no pipeline (ou loop, etc.) enquanto o lê.

Aliás, barras invertidas para continuar uma linha são opcionais após uma barra vertical.

ou mesmo:

outdir="vcf"

for ea in *.bam; do
  bn="$(basename "$ea" .bam)"
  indel="$outdir/${bn}_mpileup2indel.vcf"
  snp="$outdir/${bn}_mpileup2snp.vcf"

  samtools mpileup -f "$ref" "$ea" |
    tee \
      >(java -jar "$varscan2" mpileup2indel --output-vcf 1 > "$indel") \
      >(java -jar "$varscan2" mpileup2snp --output-vcf 1 > "$snp") |
    tail -n 5
done

Answer 1

cite suas variáveis
não analise ls
opcional, mas recomendado: simplifique seu script enão se repita. Você gera o nome base duas vezes com sed e acrescenta um sufixo diferente a cada vez - seria melhor gerá-lo uma vez - isso reduziria o risco de bugs e melhoraria a legibilidade (e melhoraria um pouco o desempenho - é "mais barato" fazer algo uma vez e reutilizar o resultado do que fazer exatamente a mesma operação duas ou mais vezes).
legibilidade (ou seja, a capacidade de ler eentenderum programa que você escreveu) é um dos, se nãooas coisas mais importantes ao escrever código....então, sempre que o desempenho não for absolutamente crítico, é melhor priorizar a escrita do seu código de uma forma que o torne mais fácil de entender. Isso pode significar inserir mais quebras de linha ou recuos, ou dividir comandos longos e complicados em comandos mais curtos e mais simples. Isso ajudará a escrever e depurar o script AGORA e também ajudará você a entendê-lo quando precisar revisitá-lo em X meses (ou anos).

for ea in *.bam; do
  bn="$(basename "$ea" .bam)"
  samtools mpileup -f "$ref" "$ea" |
    tee \
      >(java -jar "$varscan2" mpileup2indel --output-vcf 1 > "vcf/${bn}_mpileup2indel.vcf") \
      >(java -jar "$varscan2" mpileup2snp --output-vcf 1 > "vcf/${bn}_mpileup2snp.vcf") |
    tail -n 5
done

Observe os vários níveis de recuo. por exemplo, tee é ligeiramente recuado de samtools, então os argumentos de tee são recuados de tee, e então a cauda volta ao mesmo nível de indentação de tee. Tudo isso ajuda a entender quais argumentos pertencem a qual programa e onde você está no pipeline (ou loop, etc.) enquanto o lê.

Aliás, barras invertidas para continuar uma linha são opcionais após uma barra vertical.

ou mesmo:

outdir="vcf"

for ea in *.bam; do
  bn="$(basename "$ea" .bam)"
  indel="$outdir/${bn}_mpileup2indel.vcf"
  snp="$outdir/${bn}_mpileup2snp.vcf"

  samtools mpileup -f "$ref" "$ea" |
    tee \
      >(java -jar "$varscan2" mpileup2indel --output-vcf 1 > "$indel") \
      >(java -jar "$varscan2" mpileup2snp --output-vcf 1 > "$snp") |
    tail -n 5
done

tee in for loop não funciona como esperado

Responder1

informação relacionada