Hace unos días copié un archivo grande (56 GB) de una estación de trabajo a un servidor de archivos. Después de revisar la copia descubrí que tenía algunos bytes diferentes al original.
Detalles:
- sistema fuente:
- Medion Akoya P5350D
- Windows 8.1 Pro de 64 bits
- Disco duro SATA (NTFS)
- sistema de destino:
- HP ProLiant MicroServer N36L, RAM ECC
- Estándar del servidor 2012 R2 de Windows
- ReFS en el espejo bidireccional de Storage Spaces
El archivo se copió arrastrando y soltando en la estación de trabajo desde el disco local a la carpeta compartida de la red (en el servidor). El tamaño del archivo es 56886041991 bytes.
Una segunda copia hecha de la misma manera un día después estuvo bien (comprobada por md5sum). La comparación revela que hay 97 bytes que difieren. (ver más abajo) El único patrón que veo es que los bytes rotos se agrupan en tres grupos donde se cambia cada 128 bytes.
¿Qué puedo hacer? ¿Por dónde empezar a buscar la causa? No pueden ser los discos en el servidor, ya que informarían un error de lectura en caso de corrupción, e incluso si no, ReFS no notaría la suma de verificación incorrecta y leería el sector del otro disco y si ese también está dañado, informaría (debería) un error de lectura. SATA tiene CRC. La RAM tiene ECC. La red tiene 2 capas de sumas de verificación. La estación de trabajo no tiene memoria ECC. ¿Quizás errores en los controladores de red?
Salida de cmp -l
:mira aquí
Pruebas adicionales realizadas mientras tanto:
- 24 horas dememtest86+ v5.01en ambas PC, sin errores
- 24 horas dememtest86 v4.3.7en ambas PC, sin errores
- ELEGANTEprueba largaen todos los discos duros: sin errores (excepto en uno que sé que tiene algunos sectores defectuosos, están fuera de las particiones activas)
md5sum /dev/sdX
en un bucle: ejecutado 5 veces en el disco de 5 TB, más de 20 veces en otros; no se detectaron errores- repitió la operación de copia de la misma manera que originalmente 10 veces, resultado comprobado: sin errores
Supongo que fue un rayo cósmico solitario...