web-dev-qa-db-ja.com

NVMEディスクの障害によりブートパーティションが破損し、不良スーパーブロックエラーが発生する

最近、Ubuntu 18.04 ServerをPCのnvmeドライブにインストールしました。インストール中に、GPTとEXT4を使用することを選択しました。数週間正常に動作した後、システムにディスク障害が発生し、OSを直接起動できなくなりました。

OSの起動は、BIOSからnvmeドライブを起動ディスクとして選択することによってのみ可能になりました。その後、別のディスク障害が発生するまで、システムは正常に動作します。

トラブルシューティングのために、fsck:Sudo fsck /dev/nvme0n1を実行してみました。エラーThe superblock could not be read or does not describe a valid ext2/ext3/ext4 filesystemが発生します。

ただし、特定のパーティションをfsckした場合、結果は同じエラーまたはクリーンなfsckレポートになります。

  • パーティション1(/dev/nvme0n1p1)は1MBのブートパーティションです。 fsckingすると、スーパーブロックエラーが発生します。
  • パーティション2(/dev/nvme0n1p2)は、残りのドライブ領域を使用します。 fsckingすると、クリーンな結果が得られます。

私の質問は:

  1. パーティション1はEXT4ではない可能性があるため、fsckは機能しません。ブートパーティションの一般的なファイルシステムまたは編成スキームは何ですか?
  2. 定期的なディスク障害を修正しようとしています。スーパーブロックの問題はそれと何か関係がありますか?そうでない場合は、さらにトラブルシューティングを行う必要がありますか?
  3. システムがOSで起動しなくなったため、ブートパーティションが破損していると思います。どうすれば修正できますか?これはディスク障害に関連していますか?

これはlsblk -o NAME,FSTYPE,LABEL,MOUNTPOINT,SIZE,MODEL | egrep -v "^loop"からの出力です

NAME        FSTYPE   LABEL                           MOUNTPOINT            SIZE MODEL
sda                                                                        1.8T ST2000DM008-2FR1
└─sda1      ext4                                                           1.8T 
sdb         iso9660  Ubuntu-Server 18.04.2 LTS AMD64 /cdrom               14.9G USB Flash Drive 
├─sdb1      iso9660  Ubuntu-Server 18.04.2 LTS AMD64                       834M 
└─sdb2      vfat     Ubuntu-Server 18.04.2 LTS AMD64                       2.4M 
nvme0n1                                                                  465.8G Samsung SSD 970 EVO Plus 500GB          
├─nvme0n1p1                                                                  1M 
└─nvme0n1p2 ext4                                                         465.8G 

これがSudo parted -lの出力です

Model: ATA ST2000DM008-2FR1 (scsi)
Disk /dev/sda: 2000GB
Sector size (logical/physical): 512B/4096B
Partition Table: gpt
Disk Flags: 

Number  Start   End     Size    File system  Name  Flags
 1      1049kB  2000GB  2000GB  ext4


Model: Samsung SSD 970 EVO Plus 500GB (nvme)
Disk /dev/nvme0n1: 500GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt
Disk Flags: 

Number  Start   End     Size    File system  Name  Flags
 1      1049kB  2097kB  1049kB                     bios_grub
 2      2097kB  500GB   500GB   ext4
2
qnkxsovc

古いカーネルを使用している場合、新しいカーネルmightが問題を解決します。しかし Arch Linuxソリッドステートドライブ/ NVMe では、

Linux 4.10でのSamsungドライブエラー

Linux 4.10では、ドライブエラーが発生し、システムが不安定になる可能性があります。これは、ドライブが使用できない省電力状態の結果のようです。カーネルパラメータnvme_core.default_ps_max_latency_us=5500は、最も低い省電力状態を無効にし、書き込みエラーを防ぎます。

これはあなたの最善の第一歩のように聞こえます。


コメントに返信する

私のSamsung 960 ProはSamsung 970 EVOに似ています。参考として、私は自分のシステムを含めますが、あなたのシステムは修復後も同じように見えます:

$ lsblk -o NAME,FSTYPE,LABEL,MOUNTPOINT,SIZE,MODEL | egrep -v "^loop"

NAME         FSTYPE LABEL            MOUNTPOINT   SIZE MODEL
nvme0n1                                           477G Samsung SSD 960 PRO 512GB               
├─nvme0n1p9  swap                    [SWAP]       7.9G 
├─nvme0n1p7  ext4   Old_Ubuntu_16.04 /mnt/old    23.1G 
├─nvme0n1p5  ntfs                                 859M 
├─nvme0n1p3                                        16M 
├─nvme0n1p1  ntfs                                 450M 
├─nvme0n1p8  ntfs   Shared_WSL+Linux /mnt/e         9G 
├─nvme0n1p10 ext4   Ubuntu_18.04     /mnt/clone  27.2G 
├─nvme0n1p6  ext4   New_Ubuntu_16.04 /           45.1G 
├─nvme0n1p4  ntfs   NVMe_Win10       /mnt/c     363.2G 
└─nvme0n1p2  vfat                    /boot/efi     99M 
sr0                                              1024M DVD+/-RW DW316  
sda                                             931.5G HGST HTS721010A9
├─sda4       ntfs   WINRETOOLS                    450M 
├─sda2                                            128M 
├─sda5       ntfs   Image                        11.4G 
├─sda3       ntfs   HGST_Win10       /mnt/d       919G 
└─sda1       vfat   ESP                           500M 
2