Ein seltsames Problem im Zusammenhang mit ext4/lvm/raid-5 nach der Partitionswiederherstellung

Question

Es gibt ein paar Dinge, die passiert sein könnten. Erstens haben Sie nicht erwähnt, dass Sie sdc7 ausgehängt haben, bevor Sie das Image der Festplatte erstellt haben. Es könnte also sein, dass die Daten zu diesem Zeitpunkt geschrieben wurden. Ich gehe jedoch davon aus, dass dies nicht der Fall war, sonst würden Sie nicht fragen. Ich kann Ihre Reaktion „als Erstes das Image der Festplatte erstellen“ nicht bemängeln, das ist eine ziemlich gute Reaktion. Ich stelle jedoch fest, dass der Kernel vor dem Neustart noch die Partitionstabelle im Speicher hatte, überprüfen Sie /proc/partitions.

Als erstes sollten Sie nach Speicherfehlern suchen. Möglicherweise ist Ihr RAM defekt. Ihre Daten sind zweifellos mehrmals durch den RAM gegangen. Ich gehe davon aus, dass Sie keinen ECC-Speicher haben, der dies wahrscheinlich erkennen würde.

Festplatten haben auch Fehler. Wenn man sich die Datenblätter einiger Festplatten für Verbraucher ansieht, steht dort 1 pro 100 Tbit. Sie haben 1,2 TB mindestens ein paar Mal kopiert (von der Quelle lesen, vom Ziel lesen), das sind also etwa 19 Tbit Lesevorgänge. Dass da ein Bitfehler drin ist, ist glaubhaft. (Leider wird in den Datenblättern keine Fehlerrate für Schreibvorgänge angegeben.)

Gab es irgendeinen Sinn oder Zweck hinter den Einzelbyte-Beschädigungen? cmp -lIch kann Ihnen die Bytes nennen, die variieren. Wenn es beispielsweise immer der gleiche Offset auf einer Seite wäre (Ihre Seitengröße beträgt wahrscheinlich 4 KB) und immer das gleiche Bit, würde das fast eindeutig auf defekten RAM hinweisen. Selbst wenn es nur immer das gleiche Bit oder der gleiche Offset wäre, wäre das ziemlich eindeutig (Und hatten Sie CRC32 für alle vier Dateien oder nur für eine?)

Answer 1

Es gibt ein paar Dinge, die passiert sein könnten. Erstens haben Sie nicht erwähnt, dass Sie sdc7 ausgehängt haben, bevor Sie das Image der Festplatte erstellt haben. Es könnte also sein, dass die Daten zu diesem Zeitpunkt geschrieben wurden. Ich gehe jedoch davon aus, dass dies nicht der Fall war, sonst würden Sie nicht fragen. Ich kann Ihre Reaktion „als Erstes das Image der Festplatte erstellen“ nicht bemängeln, das ist eine ziemlich gute Reaktion. Ich stelle jedoch fest, dass der Kernel vor dem Neustart noch die Partitionstabelle im Speicher hatte, überprüfen Sie /proc/partitions.

Als erstes sollten Sie nach Speicherfehlern suchen. Möglicherweise ist Ihr RAM defekt. Ihre Daten sind zweifellos mehrmals durch den RAM gegangen. Ich gehe davon aus, dass Sie keinen ECC-Speicher haben, der dies wahrscheinlich erkennen würde.

Festplatten haben auch Fehler. Wenn man sich die Datenblätter einiger Festplatten für Verbraucher ansieht, steht dort 1 pro 100 Tbit. Sie haben 1,2 TB mindestens ein paar Mal kopiert (von der Quelle lesen, vom Ziel lesen), das sind also etwa 19 Tbit Lesevorgänge. Dass da ein Bitfehler drin ist, ist glaubhaft. (Leider wird in den Datenblättern keine Fehlerrate für Schreibvorgänge angegeben.)

Gab es irgendeinen Sinn oder Zweck hinter den Einzelbyte-Beschädigungen? cmp -lIch kann Ihnen die Bytes nennen, die variieren. Wenn es beispielsweise immer der gleiche Offset auf einer Seite wäre (Ihre Seitengröße beträgt wahrscheinlich 4 KB) und immer das gleiche Bit, würde das fast eindeutig auf defekten RAM hinweisen. Selbst wenn es nur immer das gleiche Bit oder der gleiche Offset wäre, wäre das ziemlich eindeutig (Und hatten Sie CRC32 für alle vier Dateien oder nur für eine?)

Ein seltsames Problem im Zusammenhang mit ext4/lvm/raid-5 nach der Partitionswiederherstellung

Antwort1

verwandte Informationen