¿Por qué el script intensivo del sistema de archivos no es más rápido en el disco RAM?

Question 1

En términos generales, todas las operaciones se realizan primero en la RAM: los sistemas de archivos se almacenan en caché. Hay excepciones a esta regla, pero estos casos bastante especiales suelen surgir de requisitos bastante específicos. Por lo tanto, hasta que comience a vaciar el caché, no podrá notar la diferencia.

Otra cosa es que el rendimiento dependemuchoen el sistema de archivos exacto: algunos apuntan a un acceso más fácil a grandes cantidades de archivos pequeños, algunos son eficientes en transferencias de datos en tiempo real hacia y desde archivos grandes (captura/transmisión multimedia), algunos enfatizan la coherencia de los datos y otros pueden diseñarse para tener pequeña huella de memoria/código.

Volviendo a su caso de uso: en una sola pasada de bucle genera alrededor de 20 procesos nuevos, la mayoría de los cuales simplemente crean un directorio/archivo (tenga en cuenta que ()crea un sub-shell y findgenera catpara cada coincidencia); el cuello de botella de hecho no es el sistema de archivos (y si su sistema utilizaASLRy no tiene una buena fuente rápida de entropía (el grupo de aleatoriedad de su sistema también se agota bastante rápido). Lo mismo ocurre con FUSE escrito en Perl: no es la herramienta adecuada para el trabajo.

Answer

En términos generales, todas las operaciones se realizan primero en la RAM: los sistemas de archivos se almacenan en caché. Hay excepciones a esta regla, pero estos casos bastante especiales suelen surgir de requisitos bastante específicos. Por lo tanto, hasta que comience a vaciar el caché, no podrá notar la diferencia.

Otra cosa es que el rendimiento dependemuchoen el sistema de archivos exacto: algunos apuntan a un acceso más fácil a grandes cantidades de archivos pequeños, algunos son eficientes en transferencias de datos en tiempo real hacia y desde archivos grandes (captura/transmisión multimedia), algunos enfatizan la coherencia de los datos y otros pueden diseñarse para tener pequeña huella de memoria/código.

Volviendo a su caso de uso: en una sola pasada de bucle genera alrededor de 20 procesos nuevos, la mayoría de los cuales simplemente crean un directorio/archivo (tenga en cuenta que ()crea un sub-shell y findgenera catpara cada coincidencia); el cuello de botella de hecho no es el sistema de archivos (y si su sistema utilizaASLRy no tiene una buena fuente rápida de entropía (el grupo de aleatoriedad de su sistema también se agota bastante rápido). Lo mismo ocurre con FUSE escrito en Perl: no es la herramienta adecuada para el trabajo.

Question 2

Una respuesta algo más larga que mi comentario acerca de que las pruebas se componen principalmente de pequeñas transacciones.

Carga de trabajo insuficiente para realizar la prueba

Si desea probar su sistema de archivos, necesitará conjuntos de trabajo más grandes.

Dependiendo de la cantidad de memoria que tenga en su caja, incluso decenas de miles de operaciones de creación de carpetas no mostrarán una diferencia notable entre las dos. Por lo tanto, modifique su carga de trabajo para probar suficientemente los sistemas de archivos, teniendo en cuenta su memoria, que se utilizará como búfer.

Hay una variedad de formas de diseñar una prueba que anule los beneficios de la memoria RAM de su sistema y otros factores que distorsionarán los resultados de la prueba.

O puede utilizar un conjunto de pruebas estandarizado, como bonnie++

Answer