Como paralelizar dd?

Question 1

Testado no Bash:

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

Você provavelmente precisará ajustar 1000.

Answer

Testado no Bash:

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

Você provavelmente precisará ajustar 1000.

Question 2

Um sniplet de código personalizado e não testado está chegando:

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

Isso deve particionar logicamente o arquivo em quatro pedaços de 3 TB e processá-los em paralelo. ( skip=pula os blocos de entrada; seek=procura os blocos de saída.) O quarto comando irá, é claro, ler até o final do arquivo antigo, portanto o count=parâmetro não é estritamente necessário.

Answer

Um sniplet de código personalizado e não testado está chegando:

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

Isso deve particionar logicamente o arquivo em quatro pedaços de 3 TB e processá-los em paralelo. ( skip=pula os blocos de entrada; seek=procura os blocos de saída.) O quarto comando irá, é claro, ler até o final do arquivo antigo, portanto o count=parâmetro não é estritamente necessário.

Como paralelizar dd?

Responder1

Responder2

informação relacionada