Eu tenho um arquivo .xls com tabelas dinâmicas de 500 MB e, quando o converto para um formato .xlsx, ele cai para apenas 5 MB. Mesmo depois de clicar em Dados>Atualizar tudo, que atualiza os PivotCaches, o tamanho do arquivo permanece pequeno. A mesma redução de tamanho ocorre se eu salvar como .xlsm ou .xlsb.
A documentação da Microsoft afirma que o formato XML e o contêiner ZIP são muito mais eficientes em termos de memória do que documentos binários. Não tenho motivos para acreditar que ocorreu perda ou corrupção de dados, pois a funcionalidade permanece a mesma. A compactação é uma explicação plausível para uma redução tão drástica (90%) no tamanho do arquivo? Existe uma maneira de realmente testar se a redução do tamanho do arquivo foi causada pela compactação?
Obrigado.
Responder1
Arquivos .xlsx, como todos os seus primos do Office pós-2007, como .docx, .pptx etc., são contêineres zip.
Você pode alterar a extensão para .zip e dar uma olhada no conteúdo da estrutura de arquivos e pastas (mais interessante para documentos com mídia como arquivos do PowerPoint com imagens). Se você descompactar em uma pasta, poderá ver os tamanhos relativos.
Eu não ficaria surpreso se encontrasse uma taxa de compactação de 90% em muitas planilhas, pois há muita repetição com fórmulas semelhantes, etc. Parece que me lembro de ter lido um artigo há muito tempo (quando esses formatos eram relativamente novos) sobre o maneira como o Excel armazena pedaços de fórmulas para dar à compactação a melhor chance de economizar grandes tamanhos de arquivos.