por que o script intensivo do sistema de arquivos não é mais rápido no disco RAM

Question 1

De modo geral, todas as operações acontecem primeiro na RAM - os sistemas de arquivos são armazenados em cache. Há exceções a esta regra, mas estes casos bastante especiais geralmente resultam de requisitos bastante específicos. Portanto, até que você comece a liberar o cache, não será capaz de perceber a diferença.

Outra coisa é que o desempenho dependebastanteno sistema de arquivos exato - alguns visam acesso mais fácil a grandes quantidades de arquivos pequenos, alguns são eficientes em transferências de dados em tempo real de e para arquivos grandes (captura/streaming multimídia), alguns enfatizam a coerência de dados e outros podem ser projetados para ter pequena pegada de memória/código.

Voltando ao seu caso de uso: em apenas uma passagem de loop você gera cerca de 20 novos processos, a maioria dos quais apenas cria um diretório/arquivo (observe que ()cria um sub-shell e findgera catpara cada partida) - o gargalo realmente não é o sistema de arquivos (e se o seu sistema usaASLRe você não tem uma boa fonte rápida de entropia, o pool de aleatoriedade do seu sistema também se esgota rapidamente). O mesmo vale para o FUSE escrito em Perl - não é a ferramenta certa para o trabalho.

Answer

De modo geral, todas as operações acontecem primeiro na RAM - os sistemas de arquivos são armazenados em cache. Há exceções a esta regra, mas estes casos bastante especiais geralmente resultam de requisitos bastante específicos. Portanto, até que você comece a liberar o cache, não será capaz de perceber a diferença.

Outra coisa é que o desempenho dependebastanteno sistema de arquivos exato - alguns visam acesso mais fácil a grandes quantidades de arquivos pequenos, alguns são eficientes em transferências de dados em tempo real de e para arquivos grandes (captura/streaming multimídia), alguns enfatizam a coerência de dados e outros podem ser projetados para ter pequena pegada de memória/código.

Voltando ao seu caso de uso: em apenas uma passagem de loop você gera cerca de 20 novos processos, a maioria dos quais apenas cria um diretório/arquivo (observe que ()cria um sub-shell e findgera catpara cada partida) - o gargalo realmente não é o sistema de arquivos (e se o seu sistema usaASLRe você não tem uma boa fonte rápida de entropia, o pool de aleatoriedade do seu sistema também se esgota rapidamente). O mesmo vale para o FUSE escrito em Perl - não é a ferramenta certa para o trabalho.

Question 2

Uma resposta um pouco mais longa do que o meu comentário sobre os testes serem compostos principalmente por pequenas transações.

Carga de trabalho insuficiente para testar

Se você quiser testar a resistência do seu sistema de arquivos, precisará de conjuntos maiores de trabalho.

Dependendo de quanta memória você tem em sua caixa, mesmo dezenas de milhares de operações de criação de pastas não mostrarão uma diferença perceptível entre as duas. Portanto, modifique sua carga de trabalho para testar suficientemente os sistemas de arquivos, levando em consideração sua memória, que será usada como buffer.

Existem várias maneiras de elaborar um teste que anule os benefícios da memória RAM do sistema e outros fatores que distorcerão os resultados do teste.

Ou você pode usar um conjunto de testes padronizado, como bonnie++

Answer