¿Cuál es el cuello de botella en la transferencia de una gran cantidad de archivos pequeños?

Question

El problema es que es necesario acceder varias veces al catálogo del sistema de archivos, que indica dónde se encuentran los archivos en el disco duro.

Para cada archivo la copia debe hacer:

Abra el archivo fuente del catálogo fuente
Crear un archivo de destino en el catálogo de destino
Copia el archivo
Cierre el archivo fuente y marque su entrada de catálogo como leída.
Cierre el archivo de destino y marque su entrada de catálogo como creada.

Esto hace que los cabezales de los discos de origen y de destino cambien de los metadatos del archivo en el catálogo al archivo mismo varias veces durante cada copia del archivo.

En un SSD esto no importaría mucho, pero en un HDD esto puede ralentizar la copia de una gran cantidad de archivos pequeños. Básicamente, el disco duro movería principalmente los cabezales, lo cual es una operación mucho más lenta que la lectura o escritura.

Windows tampoco podría utilizar eficazmente la RAM como caché, ya que cerrar un archivo provoca que se vacíe en el disco.

Answer 1