¿Cómo paralelizar dd?

Question 1

Probado en Bash:

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

Probablemente necesites ajustar 1000.

Answer

Probado en Bash:

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

Probablemente necesites ajustar 1000.

Question 2

Próximamente un fragmento de código personalizado y no probado:

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

Esto debería dividir lógicamente el archivo en cuatro fragmentos de 3 TB y procesarlos en paralelo. ( skip=salta los bloques de entrada; seek=busca los bloques de salida). El cuarto comando, por supuesto, leerá hasta el final del archivo antiguo, por lo que el count=parámetro no es estrictamente necesario.

Answer

Próximamente un fragmento de código personalizado y no probado:

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

Esto debería dividir lógicamente el archivo en cuatro fragmentos de 3 TB y procesarlos en paralelo. ( skip=salta los bloques de entrada; seek=busca los bloques de salida). El cuarto comando, por supuesto, leerá hasta el final del archivo antiguo, por lo que el count=parámetro no es estrictamente necesario.

¿Cómo paralelizar dd?

Respuesta1

Respuesta2

información relacionada