Utilice paralelo para dividir muchos directorios en subdirectorios o paralelizar esta tarea

Question 1

El problema es que hay un límite superior de bytes que una línea de comando puede tomar después de la expansión del shell, este límite depende del límite del sistema.

getconf ARG_MAX

lo que hace que el número de argumentos mv {}varíe dependiendo de la longitud del nombre del archivo de entrada cada vez que alcance el límite máximo.

Una solución para evitar este límite sin renunciar al uso paralelo es dividir la tarea en dos etapas.

ls -tr | parallel -N 100000 --pipe -k "mkdir dir_{#}; parallel -X mv -t dir_{#}"

Explicación

La primera etapa utiliza la opción --pipede dividir la entrada estándar en un número determinado deentradas estándar más pequeñas, cada uno de los cuales contiene n líneas según lo especificado por la opción -N. Puedes observar el efecto usando este ejemplo.
```
seq 1000000 | parallel -N 100000 --pipe wc -l
```
lo que da una división exacta en la marca de 100000
```
100000
100000
100000
...
```
En la segunda etapa, los paralelos interiores toman elentradas estándar más pequeñascomo su nueva entrada estándar para ejecutar sus trabajos, la -Xopción inserta tantos argumentos como lo permita la longitud de la línea de comando
```
mkdir dir_{#}; parallel -X mv -t dir_{#}
```

Answer

El problema es que hay un límite superior de bytes que una línea de comando puede tomar después de la expansión del shell, este límite depende del límite del sistema.

getconf ARG_MAX

lo que hace que el número de argumentos mv {}varíe dependiendo de la longitud del nombre del archivo de entrada cada vez que alcance el límite máximo.

Una solución para evitar este límite sin renunciar al uso paralelo es dividir la tarea en dos etapas.

ls -tr | parallel -N 100000 --pipe -k "mkdir dir_{#}; parallel -X mv -t dir_{#}"

Explicación

La primera etapa utiliza la opción --pipede dividir la entrada estándar en un número determinado deentradas estándar más pequeñas, cada uno de los cuales contiene n líneas según lo especificado por la opción -N. Puedes observar el efecto usando este ejemplo.
```
seq 1000000 | parallel -N 100000 --pipe wc -l
```
lo que da una división exacta en la marca de 100000
```
100000
100000
100000
...
```
En la segunda etapa, los paralelos interiores toman elentradas estándar más pequeñascomo su nueva entrada estándar para ejecutar sus trabajos, la -Xopción inserta tantos argumentos como lo permita la longitud de la línea de comando
```
mkdir dir_{#}; parallel -X mv -t dir_{#}
```

Question 2

Este problema se refiere a IO intensas. Dudo que parallelsea realmente útil en esta situación.

De todos modos te sugiero que consideres un enfoque "tradicional":

 mkdir dir_{1..10}
 ls -tr | nl | \
    awk '$2 !~ /^dir_/ {i=1+int($1/100000); print $2 | "xargs mv -t dir_"i}'

dónde

ls -tr | nl ordena los directorios por fecha y agrega un número de directorio auxiliar
$2 !~ /^dir_/se utiliza para omitir las carpetas recién creadas.
i=1+int($1/100000)calcula el número de la carpeta en función del número de directorio
print $2 | "xargs mv -t dir_"ise mueve sin proliferación de procesos

Si es posible compara también los tiempos respectivos: time ....(y comparte los resultados con nosotros ☺)

Answer

Este problema se refiere a IO intensas. Dudo que parallelsea realmente útil en esta situación.

De todos modos te sugiero que consideres un enfoque "tradicional":

 mkdir dir_{1..10}
 ls -tr | nl | \
    awk '$2 !~ /^dir_/ {i=1+int($1/100000); print $2 | "xargs mv -t dir_"i}'

dónde

ls -tr | nl ordena los directorios por fecha y agrega un número de directorio auxiliar
$2 !~ /^dir_/se utiliza para omitir las carpetas recién creadas.
i=1+int($1/100000)calcula el número de la carpeta en función del número de directorio
print $2 | "xargs mv -t dir_"ise mueve sin proliferación de procesos

Si es posible compara también los tiempos respectivos: time ....(y comparte los resultados con nosotros ☺)

Utilice paralelo para dividir muchos directorios en subdirectorios o paralelizar esta tarea

Respuesta1

Respuesta2

información relacionada