Wie parallelisiert man dd?

Question 1

In Bash getestet:

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

Wahrscheinlich müssen Sie 1000 anpassen.

Answer

In Bash getestet:

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

Wahrscheinlich müssen Sie 1000 anpassen.

Question 2

Es folgt ein benutzerdefinierter, ungetesteter Codeausschnitt:

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

Dadurch sollte die Datei logisch in vier 3-TB-Blöcke aufgeteilt und parallel verarbeitet werden. ( skip=Eingabeblöcke werden übersprungen; seek=Ausgabeblöcke werden durchsucht.) Der vierte Befehl liest natürlich bis zum Ende der alten Datei, der count=Parameter ist also nicht unbedingt erforderlich.

Answer

Es folgt ein benutzerdefinierter, ungetesteter Codeausschnitt:

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

Dadurch sollte die Datei logisch in vier 3-TB-Blöcke aufgeteilt und parallel verarbeitet werden. ( skip=Eingabeblöcke werden übersprungen; seek=Ausgabeblöcke werden durchsucht.) Der vierte Befehl liest natürlich bis zum Ende der alten Datei, der count=Parameter ist also nicht unbedingt erforderlich.

Wie parallelisiert man dd?

Antwort1

Antwort2

verwandte Informationen