¿Cómo encontrar la causa de la corrupción del contenido de un archivo de un solo evento?

¿Cómo encontrar la causa de la corrupción del contenido de un archivo de un solo evento?

Hace unos días copié un archivo grande (56 GB) de una estación de trabajo a un servidor de archivos. Después de revisar la copia descubrí que tenía algunos bytes diferentes al original.

Detalles:

  • sistema fuente:
  • sistema de destino:
    • HP ProLiant MicroServer N36L, RAM ECC
    • Estándar del servidor 2012 R2 de Windows
    • ReFS en el espejo bidireccional de Storage Spaces

El archivo se copió arrastrando y soltando en la estación de trabajo desde el disco local a la carpeta compartida de la red (en el servidor). El tamaño del archivo es 56886041991 bytes.

Una segunda copia hecha de la misma manera un día después estuvo bien (comprobada por md5sum). La comparación revela que hay 97 bytes que difieren. (ver más abajo) El único patrón que veo es que los bytes rotos se agrupan en tres grupos donde se cambia cada 128 bytes.

¿Qué puedo hacer? ¿Por dónde empezar a buscar la causa? No pueden ser los discos en el servidor, ya que informarían un error de lectura en caso de corrupción, e incluso si no, ReFS no notaría la suma de verificación incorrecta y leería el sector del otro disco y si ese también está dañado, informaría (debería) un error de lectura. SATA tiene CRC. La RAM tiene ECC. La red tiene 2 capas de sumas de verificación. La estación de trabajo no tiene memoria ECC. ¿Quizás errores en los controladores de red?

Salida de cmp -l:mira aquí


Pruebas adicionales realizadas mientras tanto:

  • 24 horas dememtest86+ v5.01en ambas PC, sin errores
  • 24 horas dememtest86 v4.3.7en ambas PC, sin errores
  • ELEGANTEprueba largaen todos los discos duros: sin errores (excepto en uno que sé que tiene algunos sectores defectuosos, están fuera de las particiones activas)
  • md5sum /dev/sdXen un bucle: ejecutado 5 veces en el disco de 5 TB, más de 20 veces en otros; no se detectaron errores
  • repitió la operación de copia de la misma manera que originalmente 10 veces, resultado comprobado: sin errores

Supongo que fue un rayo cósmico solitario...

información relacionada