私は午前中ずっと、トレーニング モデルで使用するためにフォルダーから比較的大きな画像 (1 MB) を読み込む TensorFlow コードを正常に実行していました。
これが関係があるかどうかはわかりませんが、以前、4 つの GPU をすべて起動したときに停電が発生しました。システムは正常に再起動しました。しかし、それ以来、システム全体が何をするにも遅くなりました。特にフォルダーを開くのが遅くなりました。画像 (150、1 MB の画像) を含むフォルダーは信じられないほど遅いです。フォルダーを開いたときの画像自体は、画像がゆっくりと読み込まれていることを示しています (非常に遅い - 画像 1 つあたり約 1 分)
メモリ使用量を確認しました(上部、ターミナルから、これらは上位のいくつかです)
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
297 root 20 0 0 0 0 R 35.9 0.0 15:10.55 md126_raid5
303 root 20 0 0 0 0 D 29.9 0.0 9:15.02 md126_resy+
1387 root 20 0 800764 331476 97912 S 9.3 0.3 4:22.46 Xorg
4300 simon 20 0 686220 49528 35004 S 5.6 0.0 1:56.81 gnome-syst+
1493 root -51 0 0 0 0 S 4.0 0.0 0:23.52 irq/76-nvi+
2583 simon 20 0 1898420 436948 92080 S 3.0 0.3 2:00.12 compiz
1498 root -51 0 0 0 0 S 2.0 0.0 0:22.59 irq/78-nvi+
1495 root -51 0 0 0 0 S 1.0 0.0 0:27.90 irq/77-nvi+
3065 simon 20 0 663544 41244 28168 S 0.7 0.0 0:06.64 gnome-term+
私のシステムには、128 GB の RAM、8T の HD、3.2Ghz プロセッサ、4 つの 1080ti GPU が搭載されています。
これをデバッグする方法がわかりません。BleachBit をダウンロードし、それを使用して未使用のファイルと古いファイルをすべて削除しました。
どうすればこの問題の真相を突き止めることができるでしょうか? - 私は Ubuntu を使い始めたばかりです。
編集:
glxinfo | grep renderer
与える
OpenGL renderer string: GeForce GTX 1080 Ti/PCIe/SSE2
そして
cat /proc/mdsat
与える
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10]
md126 : active raid5 sdb[2] sdc[1] sdd[0]
7814032384 blocks super external:/md127/0 level 5, 128k chunk, algorithm 0 [3/3] [UUU]
[=================>...] resync = 89.7% (3507217748/3907016320) finish=59.0min speed=112852K/sec
md127 : inactive sdb[2](S) sdd[1](S) sdc[0](S)
6780 blocks super external:imsm
unused devices: <none>
答え1
RAID が再同期中のようです。ハードドライブのサイズを考えると、かなり長い時間がかかる可能性があります。