Software-RAID MDADM fügt kein Ersatzteil hinzu

Question 1

Mir ist nicht klar, ob Sie die ausgefallenen Laufwerke tatsächlich ersetzt haben. Denn Ihre Symptome würden für mich Sinn ergeben, wenn Sie das fehlerhafte Laufwerk erneut hinzugefügt hätten. In diesem Fall besteht eine gute Chance, dass das Laufwerk blockiert ist. Wenn Sie das fehlerhafte Laufwerk erneut hinzugefügt haben, gibt es anschließende Fehler in /var/log/messages oder dmesg?

(Übrigens rate ich dringend davon ab, ein fehlerhaftes Laufwerk jemals wieder zu einem RAID-Array hinzuzufügen. Wenn der Fehler Daten auf der Platte beschädigt hat, kann es sein, dass beim erneuten Hinzufügen zum Array die beschädigte Datei durch die Neusynchronisierung auf der Platte verbleibt und es beim nächsten Lesen der Dateien reines Glücksspiel ist, ob Sie gute oder schlechte Daten erhalten, je nachdem, welche Platte zuerst reagiert; ich habe das in der Praxis schon erlebt.)

Answer

Mir ist nicht klar, ob Sie die ausgefallenen Laufwerke tatsächlich ersetzt haben. Denn Ihre Symptome würden für mich Sinn ergeben, wenn Sie das fehlerhafte Laufwerk erneut hinzugefügt hätten. In diesem Fall besteht eine gute Chance, dass das Laufwerk blockiert ist. Wenn Sie das fehlerhafte Laufwerk erneut hinzugefügt haben, gibt es anschließende Fehler in /var/log/messages oder dmesg?

(Übrigens rate ich dringend davon ab, ein fehlerhaftes Laufwerk jemals wieder zu einem RAID-Array hinzuzufügen. Wenn der Fehler Daten auf der Platte beschädigt hat, kann es sein, dass beim erneuten Hinzufügen zum Array die beschädigte Datei durch die Neusynchronisierung auf der Platte verbleibt und es beim nächsten Lesen der Dateien reines Glücksspiel ist, ob Sie gute oder schlechte Daten erhalten, je nachdem, welche Platte zuerst reagiert; ich habe das in der Praxis schon erlebt.)

Question 2

Mit mdadm --details wird ein Laufwerk während des Wiederaufbaus als Ersatzlaufwerk aufgeführt. Nach Abschluss des Wiederaufbaus wird es nicht mehr als Ersatzlaufwerk angezeigt.

[ 6348.303711] sd 1:0:0:0: [sdb] Add. Sense: Unrecovered read error - auto reallocate failed
[ 6348.303716] end_request: I/O error, dev sdb, sector 586065095
[ 6348.303753] ata2: EH complete
[ 6348.303776] raid1: sdb: unrecoverable I/O read error for block 586065024
[ 6348.305625] md: md0: recovery done.

In der ersten Zeile heißt es, dass es einen Neuzuweisungsfehler gab und die Daten nicht gelesen wurden. Die folgenden drei Zeilen weisen darauf hin, dass die Daten nicht gelesen werden konnten, und listen die Sektoren auf, die nicht lesbar sind.

Wie Rodger betonte, ist das Laufwerk defekt. Fügen Sie es nicht erneut hinzu. Es ist nie eine gute Idee, ein defektes Laufwerk erneut hinzuzufügen. Ziehen Sie das Laufwerk heraus und ersetzen Sie es. Wenn Sie möchten, führen Sie eine Diagnose für das defekte Laufwerk durch, aber erst, nachdem es herausgezogen und ersetzt wurde.

Answer

Mit mdadm --details wird ein Laufwerk während des Wiederaufbaus als Ersatzlaufwerk aufgeführt. Nach Abschluss des Wiederaufbaus wird es nicht mehr als Ersatzlaufwerk angezeigt.

[ 6348.303711] sd 1:0:0:0: [sdb] Add. Sense: Unrecovered read error - auto reallocate failed
[ 6348.303716] end_request: I/O error, dev sdb, sector 586065095
[ 6348.303753] ata2: EH complete
[ 6348.303776] raid1: sdb: unrecoverable I/O read error for block 586065024
[ 6348.305625] md: md0: recovery done.

In der ersten Zeile heißt es, dass es einen Neuzuweisungsfehler gab und die Daten nicht gelesen wurden. Die folgenden drei Zeilen weisen darauf hin, dass die Daten nicht gelesen werden konnten, und listen die Sektoren auf, die nicht lesbar sind.

Wie Rodger betonte, ist das Laufwerk defekt. Fügen Sie es nicht erneut hinzu. Es ist nie eine gute Idee, ein defektes Laufwerk erneut hinzuzufügen. Ziehen Sie das Laufwerk heraus und ersetzen Sie es. Wenn Sie möchten, führen Sie eine Diagnose für das defekte Laufwerk durch, aber erst, nachdem es herausgezogen und ersetzt wurde.

Question 3

Erstens: Entfernen Sie alle Datenträger, die Lesefehler verursachen, die in der Protokolldatei landen. Dies bedeutet, dass die fehlerhafte Blockverschiebung fehlgeschlagen ist und/oder das Laufwerk kurz vor dem Absturz steht.

Ich empfehle zur Rettung Ihrer Daten eine Linux-Rettungs-CD wiehttp://ubuntu-rescue-remix.org/um ddrescue zu verwenden. Dies kann eine Image-Kopie auf die Partition einer neuen Festplatte erstellen und wird viele Wiederholungsversuche usw. durchführen, um zu versuchen, Ihre Partition wiederherzustellen. Mounten Sie ein USB-Laufwerk oder eine andere Partition

mkdir /tmp/x und mount /dev/sdd1 /tmp/x

um die ddrescue-Protokolldatei zu speichern. Anschließend können Sie ddrescue stoppen (Strg+C) und später an derselben Stelle neu starten.

Erstellen Sie auf der neuen Festplatte eine Partition, die etwas größer ist als die alte. Sie müssen nicht die ganze Festplatte verwenden!

Booten Sie die Rettungs-CD mit "nodmraid" als Kernel-Boot-Parameter. Wenn Sie eine Ubuntu-Live-CD verwenden, installieren Sie RAID und LVM, falls Sie es verwenden.

apt-get installiere mdadm lvm2 gddrescue

Sie müssen mit dem Internet verbunden sein, damit dies funktioniert. Andernfalls verwenden Sie die Ubuntu-Rettungs-CD für den ddrescue-Schritt. Ich habe zwischen der Rettungs-CD für ddrescue-Läufe und der Live-CD für die Arbeit mit Grub und fsck gewechselt.

Angenommen, /dev/sdb ist Ihre fehlerhafte Quellfestplatte, /dev/sdx ist Ihre neue Festplatte und /mnt/x ist ein USB-Stick oder eine Partition auf einer anderen Festplatte, die gemountet wurde. Siebrauchendie ddrescue-Protokolldatei, wirklich! Da sie den Fortschritt von ddrescue verfolgt und eine Unterbrechung zulässt.

Gemäßhttp://www.forensicswiki.org/wiki/Ddrescue

ddrescue --no-split /dev/sdb /dev/sdX Imagedatei /mnt/x/Logdatei

Dann

ddrescue --direct --max-retries=3 /dev/sdb /dev/sdX /mnt/x/logfile

Dann

ddrescue --direct --retrim --max-retries=3 /dev/sdb /dev/sdX /mnt/x/logfile

Scheuen Sie sich nicht, den Vorgang mit Strg+C zu beenden, wenn die Wiederherstellung eines einzelnen Sektors Stunden dauert. Fahren Sie einfach mit dem nächsten Schritt fort (Schritt 1 sollte auf jeden Fall erfolgreich sein). Der letzte Schritt versucht, die letzten Krümel verwertbarer Daten wiederherzustellen.

Sie müssen auch

mdadm --create /dev/md99 --level-1 --raid-devices=2 fehlt /dev/sdX

um ein neues RAID-Array mit der neuen Festplatte zu erstellen, wird ein neuer RAID-Superblock auf die Partition geschrieben (in den letzten 64 KB bis 128 KB am Ende der Partition).

Entfernen Sie Ihre alte, fehlerhafte Festplatte /dev/sdb aus dem System, sodass sie für Linux nicht sichtbar ist.

Machen Sie Ihre Quell-RAID-Festplatte zugänglich. Möglicherweise müssen Sie den Parameter "nodmraid" für den Kernel verwenden, der den Kernel startet, da ich Probleme mit der Ubuntu-Rettungs-CD hatte und schließlich die Ubuntu-Live-CD (10.4) verwendete, auf der sich nodmraid in den F6-Optionen befindet. Sie müssen nur Folgendes verwenden:

mdadm --assemble /dev/md99 /dev/sdX

Führen Sie dann fsck oder eine andere erforderliche Prüfung der Daten auf dem md99-RAID-Array durch (ich habe vgscan verwendet und konnte dann die LVM-LVs sehen, an denen die Prüfung durchgeführt werden sollte). Ich verwende XFS für MythTV, aber der Befehl xfs_check hat mein System zum Absturz gebracht, aber xfs_repair war in Ordnung.

Mounten Sie das /boot-Verzeichnis von Ihrem neuen /dev/sdX

mount /dev/mapper/my_vg/root_lv /tmp/x

Legen Sie dann einen neuen GRUB-Bootdatensatz auf der neuen /dev/sdX-RAID-Festplatte an (nur, wenn Sie von RAID booten!)

grub-setup -d /tmp/x/boot/grub /dev/sdX

jetzt haben Sie ein (fast) bootfähiges RAID-Array. Sie können das Setup auch mit GRUB selbst durchführen oder mit dd die ersten 446 Bytes von /dev/sdb nach /dev/sdX kopieren. NUR die ersten 446 Bytes, der Rest des 1. Sektors ist Ihre Partitionstabelle, die Sie gewaltig verstopfen werden, wenn Sie mehr kopieren! Möglicherweise müssen Sie dasselbe auch für den 1. Sektor in Ihrer Partition /dev/sdX1 (sagen wir) tun. Sichern Sie alle Sektoren, die Sie überschreiben möchten, ebenfalls mit dd.

Wenn Sie grub2 verwenden und von RAID booten, werden Sie feststellen, dass sich die UUID des RAID-Arrays geändert hat, sodass Ihr Bootvorgang fehlschlägt. Bearbeiten Sie die Boot-Befehlszeile (e im Grub-Startfenster), um Splash und Quiet zu entfernen, damit Sie sehen können, was passiert. Nach dem fehlgeschlagenen Bootvorgang befinden Sie sich dann in initramfs.

mdadm --assemble /dev/md99 /dev/sdX

Überprüfen Sie dann /proc/mdstat, um sicherzustellen, dass das Array vorhanden ist. Wenn dies der Fall ist, beenden Sie einfach das Array und hoffentlich funktioniert Ihr GRUB-Boot-Abschnitt einwandfrei (meiner war auf die Verwendung von LVM eingestellt, sodass er die LVs auf dem RAID-Gerät einfach gefunden hat, sobald ein RAID-Gerät vorhanden war, und einfach nach dem LV gesucht hat). Sobald Sie hochgefahren sind, sind Sie fast fertig.

Die initrd-Image-Datei (gzippte cpio-Datei) enthält eine Kopie von mdadm.conf, die während des Bootvorgangs verwendet wird und während des Bootvorgangs als /etc/mdadm/mdamdm.conf sichtbar und editierbar ist. Wenn Sie Ihr System normal booten können, aktualisieren Sie einfach das initramfs mit

update-initramfs -u

Wenn Sie das System aufgrund der nicht übereinstimmenden UUID in der Datei mdadm.conf nicht booten können

Beachten Sie, dass Ihr Zielgerät /dev/sdX möglicherweise als /dev/sdY angezeigt wird, wenn Sie auf eine andere Art booten (Grub, Rescue, Real Boot).

Übrigens, es sei denn, Sie verwenden RAID5 und sind wirklich an Blockausrichtung interessiert, würde ich eine Partition für Ihr RAID-Array verwenden. Sie müssen nicht eine ganze Festplatte verwenden (insbesondere, wenn Sie eine 1-TB-Festplatte durch eine 2-TB-Festplatte ersetzen). Sie können später immer noch eine weitere Partition und ein zweites RAID-Array hinzufügen, um die gesamten 2 TB zu nutzen.

Puh! Fertig!

Answer

Erstens: Entfernen Sie alle Datenträger, die Lesefehler verursachen, die in der Protokolldatei landen. Dies bedeutet, dass die fehlerhafte Blockverschiebung fehlgeschlagen ist und/oder das Laufwerk kurz vor dem Absturz steht.

Ich empfehle zur Rettung Ihrer Daten eine Linux-Rettungs-CD wiehttp://ubuntu-rescue-remix.org/um ddrescue zu verwenden. Dies kann eine Image-Kopie auf die Partition einer neuen Festplatte erstellen und wird viele Wiederholungsversuche usw. durchführen, um zu versuchen, Ihre Partition wiederherzustellen. Mounten Sie ein USB-Laufwerk oder eine andere Partition

mkdir /tmp/x und mount /dev/sdd1 /tmp/x

um die ddrescue-Protokolldatei zu speichern. Anschließend können Sie ddrescue stoppen (Strg+C) und später an derselben Stelle neu starten.

Erstellen Sie auf der neuen Festplatte eine Partition, die etwas größer ist als die alte. Sie müssen nicht die ganze Festplatte verwenden!

Booten Sie die Rettungs-CD mit "nodmraid" als Kernel-Boot-Parameter. Wenn Sie eine Ubuntu-Live-CD verwenden, installieren Sie RAID und LVM, falls Sie es verwenden.

apt-get installiere mdadm lvm2 gddrescue

Sie müssen mit dem Internet verbunden sein, damit dies funktioniert. Andernfalls verwenden Sie die Ubuntu-Rettungs-CD für den ddrescue-Schritt. Ich habe zwischen der Rettungs-CD für ddrescue-Läufe und der Live-CD für die Arbeit mit Grub und fsck gewechselt.

Angenommen, /dev/sdb ist Ihre fehlerhafte Quellfestplatte, /dev/sdx ist Ihre neue Festplatte und /mnt/x ist ein USB-Stick oder eine Partition auf einer anderen Festplatte, die gemountet wurde. Siebrauchendie ddrescue-Protokolldatei, wirklich! Da sie den Fortschritt von ddrescue verfolgt und eine Unterbrechung zulässt.

Gemäßhttp://www.forensicswiki.org/wiki/Ddrescue

ddrescue --no-split /dev/sdb /dev/sdX Imagedatei /mnt/x/Logdatei

Dann

ddrescue --direct --max-retries=3 /dev/sdb /dev/sdX /mnt/x/logfile

Dann

ddrescue --direct --retrim --max-retries=3 /dev/sdb /dev/sdX /mnt/x/logfile

Scheuen Sie sich nicht, den Vorgang mit Strg+C zu beenden, wenn die Wiederherstellung eines einzelnen Sektors Stunden dauert. Fahren Sie einfach mit dem nächsten Schritt fort (Schritt 1 sollte auf jeden Fall erfolgreich sein). Der letzte Schritt versucht, die letzten Krümel verwertbarer Daten wiederherzustellen.

Sie müssen auch

mdadm --create /dev/md99 --level-1 --raid-devices=2 fehlt /dev/sdX

um ein neues RAID-Array mit der neuen Festplatte zu erstellen, wird ein neuer RAID-Superblock auf die Partition geschrieben (in den letzten 64 KB bis 128 KB am Ende der Partition).

Entfernen Sie Ihre alte, fehlerhafte Festplatte /dev/sdb aus dem System, sodass sie für Linux nicht sichtbar ist.

Machen Sie Ihre Quell-RAID-Festplatte zugänglich. Möglicherweise müssen Sie den Parameter "nodmraid" für den Kernel verwenden, der den Kernel startet, da ich Probleme mit der Ubuntu-Rettungs-CD hatte und schließlich die Ubuntu-Live-CD (10.4) verwendete, auf der sich nodmraid in den F6-Optionen befindet. Sie müssen nur Folgendes verwenden:

mdadm --assemble /dev/md99 /dev/sdX

Führen Sie dann fsck oder eine andere erforderliche Prüfung der Daten auf dem md99-RAID-Array durch (ich habe vgscan verwendet und konnte dann die LVM-LVs sehen, an denen die Prüfung durchgeführt werden sollte). Ich verwende XFS für MythTV, aber der Befehl xfs_check hat mein System zum Absturz gebracht, aber xfs_repair war in Ordnung.

Mounten Sie das /boot-Verzeichnis von Ihrem neuen /dev/sdX

mount /dev/mapper/my_vg/root_lv /tmp/x

Legen Sie dann einen neuen GRUB-Bootdatensatz auf der neuen /dev/sdX-RAID-Festplatte an (nur, wenn Sie von RAID booten!)

grub-setup -d /tmp/x/boot/grub /dev/sdX

jetzt haben Sie ein (fast) bootfähiges RAID-Array. Sie können das Setup auch mit GRUB selbst durchführen oder mit dd die ersten 446 Bytes von /dev/sdb nach /dev/sdX kopieren. NUR die ersten 446 Bytes, der Rest des 1. Sektors ist Ihre Partitionstabelle, die Sie gewaltig verstopfen werden, wenn Sie mehr kopieren! Möglicherweise müssen Sie dasselbe auch für den 1. Sektor in Ihrer Partition /dev/sdX1 (sagen wir) tun. Sichern Sie alle Sektoren, die Sie überschreiben möchten, ebenfalls mit dd.

Wenn Sie grub2 verwenden und von RAID booten, werden Sie feststellen, dass sich die UUID des RAID-Arrays geändert hat, sodass Ihr Bootvorgang fehlschlägt. Bearbeiten Sie die Boot-Befehlszeile (e im Grub-Startfenster), um Splash und Quiet zu entfernen, damit Sie sehen können, was passiert. Nach dem fehlgeschlagenen Bootvorgang befinden Sie sich dann in initramfs.

mdadm --assemble /dev/md99 /dev/sdX

Überprüfen Sie dann /proc/mdstat, um sicherzustellen, dass das Array vorhanden ist. Wenn dies der Fall ist, beenden Sie einfach das Array und hoffentlich funktioniert Ihr GRUB-Boot-Abschnitt einwandfrei (meiner war auf die Verwendung von LVM eingestellt, sodass er die LVs auf dem RAID-Gerät einfach gefunden hat, sobald ein RAID-Gerät vorhanden war, und einfach nach dem LV gesucht hat). Sobald Sie hochgefahren sind, sind Sie fast fertig.

Die initrd-Image-Datei (gzippte cpio-Datei) enthält eine Kopie von mdadm.conf, die während des Bootvorgangs verwendet wird und während des Bootvorgangs als /etc/mdadm/mdamdm.conf sichtbar und editierbar ist. Wenn Sie Ihr System normal booten können, aktualisieren Sie einfach das initramfs mit

update-initramfs -u

Wenn Sie das System aufgrund der nicht übereinstimmenden UUID in der Datei mdadm.conf nicht booten können

Beachten Sie, dass Ihr Zielgerät /dev/sdX möglicherweise als /dev/sdY angezeigt wird, wenn Sie auf eine andere Art booten (Grub, Rescue, Real Boot).

Übrigens, es sei denn, Sie verwenden RAID5 und sind wirklich an Blockausrichtung interessiert, würde ich eine Partition für Ihr RAID-Array verwenden. Sie müssen nicht eine ganze Festplatte verwenden (insbesondere, wenn Sie eine 1-TB-Festplatte durch eine 2-TB-Festplatte ersetzen). Sie können später immer noch eine weitere Partition und ein zweites RAID-Array hinzufügen, um die gesamten 2 TB zu nutzen.

Puh! Fertig!

Software-RAID MDADM fügt kein Ersatzteil hinzu

Antwort1

Antwort2

Antwort3

verwandte Informationen