SSD 搞砸了 - 不知道如何在 Linux 上修復它

SSD 搞砸了 - 不知道如何在 Linux 上修復它

我被我的上網筆電 (Dell Latitude 3380) 困住了。使用一年了:效果很好。我購買並安裝了新的 SSD,並在其上安裝了 Kubuntu 18.04。幾個小時以來,效果非常好。然後,當我從外部硬碟複製檔案並執行一些操作時,它凍結了。然後它運行得非常慢,所以我想嘗試 19.04。現在,我想,這是一個很大的錯誤:我手動更改了分區表。以前有一個 ext4 分割區安裝為 /,第二個安裝為 /home 和 swap。我刪除了第一個,一開始創建了200MB EFI,剩下的再次格式化為ext4,/。我離開 /home 並交換而沒有格式化。

系統安裝時沒有錯誤或警告,但重新啟動後只有 grub rescue。我可以用它從 Live USB 啟動 Linux(這就是我寫的方式)——所以模組檔案就在那裡並且可以讀取。 (當然,我可以透過 BIOS 直接從 USB 啟動)。 GRUB 看到該磁碟上的分割區。 /dev/sda1(EFI 分割區)設定為 BOOT,但係統本身和 GRUB 檔案位於 /dev/sda7 上。我想這是一個問題。

但是,任何從 Ubuntu Live 或 System Rescue CD Live 在我的 /dev/sda 上使用 gparted、fdisk、wipefs 或 fsck 的嘗試都會以奇怪的錯誤結束。每隔兩分鐘我就會收到以下訊息:

INFO: task fsck.ext2:6081 blocked for more than 120 seconds.
Not tainted 4.19.34-1-lts #1

ctrl+c 沒有幫助。我必須進行硬重置。 Kubuntu 安裝程式向我顯示錯誤訊息,"/dev/sda1/" cannot be accessed因此我無法繼續進行時區設定。我的 BIOS 有一個擦除內部磁碟的選項。我運行它,但它以錯誤結束並且沒有詳細信息。我做到了

dd if=/dev/zero of=/dev/sda

並離開電腦過夜。工作沒有錯誤,寫入了大約 512GB 的零,但沒有真正改變;P 分區仍然在那裡,正如我從 grub 救援中看到的那樣。我能夠運行 fdisk -l 一次並看到分區表。然後我嘗試 fsck /dev/sda ,它再次產生「未污染」的情況。

這裡發生了什麼事?這是SSD故障嗎?似乎不是,因為在我第一次安裝時,我能夠正常使用它。 SMART 也沒有顯示任何錯誤。顯然,我不關心磁碟上的任何資料。我只想盡一切努力來全新安裝新的 Kubuntu(或 Mint 或其他)。

這是blkid輸出:

/dev/sda1: UUID="D66B-BF6C" TYPE="vfat" PARTUUID="b9d3b90b-01"
/dev/sda5: UUID="eec4f953-b9ba-4579-95f4-8f9a8d6821a3" TYPE="ext4" PARTUUID="b9d3b90b-05"
/dev/sda7: UUID="8b9d60f7-fa03-459a-9d34-784d4259338a" TYPE="ext4" PARTUUID="b9d3b90b-07"

一些附加資訊:我的上網本在 Kubuntu 16.04 上工作正常一年了,只是偶爾會因一些 I/O 錯誤而掛起,訊息還包含 HDD 的扇區號。 (如果您認為相關,我可以提供更詳細的描述)

我的新 SSD 是 Goodram CX400 512GB。

每當我使用 Kubuntu 18.04、19.04、Mint 19.1 或 Fedora 30 KDE 啟動 USB 時,我都會看到這樣的訊息(在 Kubuntu 16.04 上沒有看到它們):

May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 6: ee2000000040110a
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR fef1ce80 MISC 43880014086 
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: PROCESSOR 0:806e9 TIME 1559025486 SOCKET 0 APIC 0 microcode 9a
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: Machine check events logged
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 7: ee2000000040110a
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR fef1cec0 MISC 47880014086 
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: PROCESSOR 0:806e9 TIME 1559025486 SOCKET 0 APIC 0 microcode 9a

我發現人們在戴爾筆記型電腦上遇到類似問題,並聲稱這些是誤報(例子1,例子2)。

幾次通過後的 Memtest 根本不會產生任何錯誤。

答案1

由於所有寫入操作都會失敗且資料會保留,因此聽起來好像驅動器已將自身設為唯讀,這可能是由於錯誤情況(過熱、電湧等)造成的。

向製造商技術支援發送郵件並解釋問題。他們可能會幫助修復/重置或可能更換驅動器。

[電子郵件受保護]

相關內容