
Я слежу за демоном Python в экземпляре EC2, наблюдая за входящими заданиями и выполняя на них выводы PyTorch вЭластичный вывод.
Когда нет работы, явпадать в спячкуэкземпляр. Когда есть задания, экземпляр пробуждается, и скрипт Python продолжает свой цикл с того места, где он был заморожен.
Когда скрипт пытается выполнить вывод после выхода из спящего режима, он выдает следующую ошибку:
EI Error Code: [1, 4, 1]
EI Error Description: Internal error
EI Request ID: PT-1F304B24-DCB7-48A0-8ABB-0D30XXXXXXXX -- EI Accelerator ID: eia-7646efb5xxxxxxxxxxxxxxxxxxxxxxxx
EI Client Version: 1.7.0
Если не переходить в спящий режим (либо работать непрерывно, либо делать полную остановку/запуск), то все в порядке.
Я предпочитаю режим гибернации, так как после пробуждения работа возобновляется гораздо быстрее, чем при холодном запуске.
Как устранить указанную выше проблему?
Я предполагаю, что есть некая связь процесса/памяти с ускорителем EI, когда скрипт запущен, и она теряется при гибернации. Нет ли способа сделать так, чтобы она сохранялась?