Como os HDDs mecânicos determinam quais arquivos substituir ao copiar dados

Como os HDDs mecânicos determinam quais arquivos substituir ao copiar dados

Tamanho do disco rígido: 100 GB e continha vários arquivos de vários tamanhos de megabytes, todos adicionados em momentos diferentes e acumulados ao longo do tempo... todos foram excluídos...

Em seguida, copiei 25 GB de dados (arquivos pequenos de tamanho mbs) para a unidade vazia ...

Quais arquivos excluídos são substituídos primeiro? os adicionados por último ou os adicionados primeiro? Ou a unidade espalha todos os arquivos em um movimento disperso por todos os lugares aleatórios dentro do espaço de 100 GB.

Então, são os arquivos excluídos aleatoriamente que são substituídos independentemente da data de adição ou os primeiros arquivos excluídos adicionados são substituídos primeiro?

Responder1

Os discos rígidos, sejam HDDs ou SSDs, não entendem o conceito de arquivos. Eles armazenam apenas uma sequência de bytes e é só com isso que se importam. [1]

Os discos rígidos geralmente são particionados e as partições são formatadas com um sistema de arquivos de sua escolha (FS). [2] O sistema de arquivos que decide como e onde os arquivos são armazenados.

A resposta à sua pergunta é:depende.

O sistema de arquivos realmente não se importa quando um arquivo foi criado ou excluído. Depois de excluído, ele não existe mais, o sistema de arquivos o tratará apenas como bytes de lixo, não como um arquivo.

Além do mais, os arquivos não são armazenados continuamente: um único arquivo pode ser dividido em vários pedaços e espalhado por toda a partição. É função do sistema de arquivos remontá-lo rapidamente para que o sistema operacional não perceba que ele foi fatiado. Contra-intuitivamente, pode realmente melhorar o desempenho: a fragmentação controlada pode ser usada para facilitar o fato de que as partes externas dos pratos do HDD oferecem melhores velocidades de leitura/gravação e para evitar situações em que o FS é forçado a fragmentar um arquivo de uma forma abaixo do ideal porque não cabe em nenhuma parte desejável do disco.

A escrita de padrões para sistemas de arquivos específicos pode ser previsível para casos específicos, mas não em geral. Os tamanhos de arquivos específicos e a ordem em que você os armazena afetarão isso. Ao armazenar um novo arquivo, o sistema de arquivos não considerará se o espaço que vai utilizar foi utilizado ou não; ele não preferirá endereços usados ​​anteriormente a endereços "limpos" ou vice-versa. Depois que um arquivo é excluído, o FS trata o espaço que ele ocupava de forma idêntica ao espaço que nunca foi usado.


[1] As unidades modernas têm uma camada adicional de abstração, portanto, as regiões realmente usadas para armazenamento desses bytes podem não ser sequenciais ou contíguas (por exemplo, devido ao remapeamento de blocos defeituosos em HDDs e ao nivelamento de desgaste em SSDs). Porém, isso não importa para o escopo da questão, digamos apenas que todos os discos rígidos se expõem a outro hardware e sistema operacional como um dispositivo que pode armazenar vários bytes sequenciais endereçados de forma confiável.

[2] As versões modernas do Windows usam NTFS nas partições do sistema operacional e NTFS ou FAT32 nas partições adicionais. Os discos flash normalmente usam FAT32 ou às vezes exFAT. O Linux geralmente reside no sistema de arquivos ext4. A Apple estava usando HFS+ e agora está migrando para APFS. Existem também alguns sistemas de arquivos para casos de uso especiais, por exemplo, Btrfs e ZFS orientados para escalabilidade, que foram projetados como uma solução completa de armazenamento de dados à prova de falhas.

Responder2

Embora não seja verdadeiramente aleatório numa situação como esta, é aleatório para todos os efeitos práticos. Observe, entretanto, que mesmo que os diretórios tenham sido sobrescritos, às vezes os arquivos podem ser encontrados por programas que pesquisam todo o disco. Embora eu tenha feito essas coisas visualmente na era dos disquetes hoje em dia, isso só é viável se o arquivo tiver algum tipo de assinatura.

informação relacionada