Tengo un archivo .xls con tablas dinámicas de 500 MB de tamaño, y cuando lo convierto a formato .xlsx, se reduce a solo 5 MB. Incluso después de hacer clic en Datos>Actualizar todo, lo que actualiza los PivotCaches, el tamaño del archivo sigue siendo pequeño. Se produce la misma reducción de tamaño si guardo como .xlsm o .xlsb.
La documentación de Microsoft indica que el formato XML y el contenedor ZIP son mucho más eficientes en cuanto a memoria que los documentos binarios. No tengo ninguna razón para creer que se haya producido pérdida o corrupción de datos ya que la funcionalidad sigue siendo la misma. ¿Es la compresión una explicación plausible para una reducción tan drástica (90%) en el tamaño del archivo? ¿Hay alguna manera de probar realmente que la reducción del tamaño del archivo fue causada por la compresión?
Gracias.
Respuesta1
Los archivos .xlsx, como todos sus primos de Office posteriores a 2007, como .docx, .pptx, etc., son contenedores zip.
Puede cambiar la extensión a .zip y echar un vistazo al contenido de la estructura de archivos y carpetas (más interesante para documentos con medios como archivos de PowerPoint con imágenes). Si lo descomprime en una carpeta, debería poder ver los tamaños relativos.
No me sorprendería en absoluto encontrar una relación de compresión del 90% en muchas hojas de cálculo, ya que hay muchas repeticiones con fórmulas similares, etc. Creo recordar haber leído un artículo hace mucho tiempo (cuando estos formatos eran relativamente nuevos) sobre el forma en que Excel almacena fragmentos de fórmulas para brindar a la compresión la mejor oportunidad de ahorrar en archivos de gran tamaño.