No AMD Ryzen 2700X + RTX 2080 + Ubuntu 18.04, o congelamento do sistema de pilha ocorre regularmente

No AMD Ryzen 2700X + RTX 2080 + Ubuntu 18.04, o congelamento do sistema de pilha ocorre regularmente

Eu uso a configuração mencionada acima para cálculos de aprendizado profundo usando python MXNet.

Quando eu estava usando o Unity/gnome, antes das falhas journactlrelatavam algo assim (sempre o processo relacionado ao gnome travava primeiro):

Kov. 28 14:04:51 emil-NNNgine gnome-control-c [19370]: g_object_unref: afirmação 'G_IS_OBJECT (objeto)' falhou
Kov. 28 14:04:51 emil-NNNgine gnome-control-c [19370]: g_object_unref: afirmação 'G_IS_OBJECT (objeto)' falhou
Kov. 28 14:04:51 emil-NNNgine gnome-control-c [19370]: g_object_unref: afirmação 'G_IS_OBJECT (objeto)' falhou
Kov. 28 14:04:51 emil-NNNgine gnome-control-c [19370]: g_object_unref: afirmação 'G_IS_OBJECT (objeto)' falhou
Kov. 28 14:04:51 emil-NNNgine gnome-control-c [19370]: g_object_unref: afirmação 'G_IS_OBJECT (objeto)' falhou
Kov. 28 14:17:01 emil-NNNgine CRON[22454]: pam_unix(cron:session): sessão aberta para o usuário root por (uid=0)
Kov. 28 14:17:01 emil-NNNgine CRON[22455]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Kov. 28 14:17:01 emil-NNNgine CRON[22454]: pam_unix(cron:session): sessão fechada para o usuário root
Kov. 28 14:20:03 emil-NNNgine gnome-shell [1564]: Objeto .Gjs_AppIndicatorIconActor__1 (0x563d31d7d9d0), já foi finalizado. Impossível
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: == Rastreamento de pilha para contexto 0x563d2cba9330 ==
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #0 0x7ffd571eb540 b recurso:///org/gnome/gjs/modules/_legacy.js:83 (0x7f1288
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #1 0x563d2d043948 i /usr/share/gnome-shell/extensions/ubuntu-appindicators@ub
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #2 0x7ffd571ec8a0 b recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f1288
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #3 0x7ffd571ec960 b auto-hospedado:916 (0x7f12886f12b8 @ 367)
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #4 0x7ffd571eca50 b recurso:///org/gnome/gjs/modules/signals.js:128 (0x7f128
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #5 0x563d2d0438c0 i /usr/share/gnome-shell/extensions/ubuntu-appindicators@ub
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #6 0x7ffd571eddb0 b recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f1288
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #7 0x563d2d043818 i /usr/share/gnome-shell/extensions/ubuntu-appindicators@ub
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #8 0x7ffd571ef110 b recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f1288
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #9 0x563d2d0437a0 i /usr/share/gnome-shell/extensions/ubuntu-appindicators@ub
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #10 0x563d2d0436e0 i resource:///org/gnome/shell/ui/extensionSystem.js:82 (0x
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #11 0x563d2d043660 i resource:///org/gnome/shell/ui/extensionSystem.js:344 (0
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #12 0x7ffd571efe80 ​​b auto-hospedado:251 (0x7f12886c4ab0 @ 223)
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #13 0x563d2d0435e0 i resource:///org/gnome/shell/ui/extensionSystem.js:343 (0
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #14 0x563d2d043560 i resource:///org/gnome/shell/ui/extensionSystem.js:361 (0
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #15 0x7ffd571f1380 b recurso:///org/gnome/gjs/modules/signals.js:128 (0x7f12
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #16 0x7ffd571f1b90 b recurso:///org/gnome/shell/ui/sessionMode.js:205 (0x7f1
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #17 0x7ffd571f2870 I recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f128
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #18 0x563d2d043420 i resource:///org/gnome/shell/ui/sessionMode.js:167 (0x7f1
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #19 0x7ffd571f3450 ​​I recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f128
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #20 0x563d2d043378 i resource:///org/gnome/shell/ui/screenShield.js:1282 (0x7
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #21 0x7ffd571f4030 I recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f128
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #22 0x563d2d0432f0 i resource:///org/gnome/shell/ui/screenShield.js:902 (0x7f
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #23 0x7ffd571f4c10 I recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f128
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #24 0x7ffd571f53b0 b auto-hospedado:916 (0x7f12886f12b8 @ 367)
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #25 0x7ffd571f54a0 b recurso:///org/gnome/gjs/modules/signals.js:128 (0x7f12
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #26 0x563d2d043270 i resource:///org/gnome/shell/ui/lightbox.js:186 (0x7f1288
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #27 0x7ffd571f6940 b recurso:///org/gnome/gjs/modules/tweener/tweener.js:208
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #28 0x7ffd571f7190 b recurso:///org/gnome/gjs/modules/tweener/tweener.js:337
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #29 0x7ffd571f7240 b recurso:///org/gnome/gjs/modules/tweener/tweener.js:350
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #30 0x7ffd571f72d0 b recurso:///org/gnome/gjs/modules/tweener/tweener.js:365
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #31 0x7ffd571f7350 I recurso:///org/gnome/gjs/modules/signals.js:128 (0x7f12
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #32 0x7ffd571f7400 b recurso:///org/gnome/shell/ui/tweener.js:244 (0x7f12886
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #33 0x7ffd571f7470 I recurso:///org/gnome/gjs/modules/_legacy.js:82 (0x7f128
Kov. 28 14:20:03 emil-NNNgine org.gnome.Shell.desktop[1564]: #34 0x7ffd571f7470 I recurso:///org/gnome/shell/ui/tweener.js:219 (0x7f12886
Kov. 28 14:20:03 emil-NNNgine gnome-software [1966]: nenhum aplicativo para alteração[e-mail protegido]
Kov. 28 14:20:03 emil-NNNgine gnome-software [1966]: nenhum aplicativo para alteração[e-mail protegido]
-- Reinício --
Kov. 28 14:26:03 kernel emil-NNNgine: Linux versão 4.18.0-16-generic (buildd@lcy01-amd64-

-- Reboot --foi quando percebi que o sistema congelou e pressionei o botão reiniciar.

Agora mudei para o gerenciador de desktop xfce4. Funcionou por uma longa hora e fiz um teste durante a noite. Quando voltei ao PC, a tela mostrava manchas coloridas retangulares aleatórias. A última linha journalctldiz:

snapd[911]: stateengine.go:102: erro de garantia de estado: não é possível atualizar a declaração de snap para "core": Obtenha https://api.snapcraft.io/api/v1/snaps/assertions/snap-declaration/16/ *******?max-format=3: disque tcp: lookup api.snapcraft.io: tal host não existe

Não tenho certeza se o problema é realmente o gerenciador de desktop do Ubuntu não se comunicar corretamente com a NVidia, ou são problemas de driver da NVidia, ou são problemas de Ryzen ...

Talvez alguém tenha algumas pistas?

ATUALIZAÇÃO IMPORTANTE: em todos os casos em que foi possível rastrear, ocorreu um travamento durante a operação np.loadtxt(...) de um arquivo muito grande (conjunto de dados de treinamento, na verdade).

informação relacionada