並列処理を使用して、多数のディレクトリをサブディレクトリに分割するか、このタスクを並列化します。

Question 1

問題は、シェル展開後にコマンドラインが取得できるバイト数の上限があることです。この制限はシステムの制限に依存します。

getconf ARG_MAX

mv {}したがって、最大制限に達すると、入力ファイル名の長さに応じて引数の数が変化することになります。

並列使用を諦めずにこの制限を回避する解決策は、タスクを2つの段階に分割することです。

ls -tr | parallel -N 100000 --pipe -k "mkdir dir_{#}; parallel -X mv -t dir_{#}"

説明

--pipe最初の段階では、stdinを指定された数に分割するオプションを使用します。小さい標準入力それぞれオプションで指定されたn行を含みます-N。この例を使用して効果を確認できます。
```
seq 1000000 | parallel -N 100000 --pipe wc -l
```
100000のマークで正確に分割されます
```
100000
100000
100000
...
```
第二段階では、内側の平行線が小さい標準入力ジョブを実行するための新しい標準入力として、-Xオプションはコマンドラインの長さが許す限り多くの引数を挿入します。
```
mkdir dir_{#}; parallel -X mv -t dir_{#}
```

Answer

問題は、シェル展開後にコマンドラインが取得できるバイト数の上限があることです。この制限はシステムの制限に依存します。

getconf ARG_MAX

mv {}したがって、最大制限に達すると、入力ファイル名の長さに応じて引数の数が変化することになります。

並列使用を諦めずにこの制限を回避する解決策は、タスクを2つの段階に分割することです。

ls -tr | parallel -N 100000 --pipe -k "mkdir dir_{#}; parallel -X mv -t dir_{#}"

説明

--pipe最初の段階では、stdinを指定された数に分割するオプションを使用します。小さい標準入力それぞれオプションで指定されたn行を含みます-N。この例を使用して効果を確認できます。
```
seq 1000000 | parallel -N 100000 --pipe wc -l
```
100000のマークで正確に分割されます
```
100000
100000
100000
...
```
第二段階では、内側の平行線が小さい標準入力ジョブを実行するための新しい標準入力として、-Xオプションはコマンドラインの長さが許す限り多くの引数を挿入します。
```
mkdir dir_{#}; parallel -X mv -t dir_{#}
```

Question 2

parallelこの問題は、大量の IO を扱っています。この状況でそれが本当に役立つかどうかは疑問です。

とにかく、「伝統的な」アプローチを検討することをお勧めします。

 mkdir dir_{1..10}
 ls -tr | nl | \
    awk '$2 !~ /^dir_/ {i=1+int($1/100000); print $2 | "xargs mv -t dir_"i}'

どこ

可能であれば、それぞれの時間も比較してください: time ....(そして結果を私たちと共有してください☺)

Answer

parallelこの問題は、大量の IO を扱っています。この状況でそれが本当に役立つかどうかは疑問です。

とにかく、「伝統的な」アプローチを検討することをお勧めします。

 mkdir dir_{1..10}
 ls -tr | nl | \
    awk '$2 !~ /^dir_/ {i=1+int($1/100000); print $2 | "xargs mv -t dir_"i}'

どこ

可能であれば、それぞれの時間も比較してください: time ....(そして結果を私たちと共有してください☺)

関連情報