AWS Elastic Inference не работает после выхода из спящего режима

AWS Elastic Inference не работает после выхода из спящего режима

Я слежу за демоном Python в экземпляре EC2, наблюдая за входящими заданиями и выполняя на них выводы PyTorch вЭластичный вывод.

Когда нет работы, явпадать в спячкуэкземпляр. Когда есть задания, экземпляр пробуждается, и скрипт Python продолжает свой цикл с того места, где он был заморожен.

Когда скрипт пытается выполнить вывод после выхода из спящего режима, он выдает следующую ошибку:

EI Error Code: [1, 4, 1]
EI Error Description: Internal error
EI Request ID: PT-1F304B24-DCB7-48A0-8ABB-0D30XXXXXXXX  --  EI Accelerator ID: eia-7646efb5xxxxxxxxxxxxxxxxxxxxxxxx
EI Client Version: 1.7.0

Если не переходить в спящий режим (либо работать непрерывно, либо делать полную остановку/запуск), то все в порядке.

Я предпочитаю режим гибернации, так как после пробуждения работа возобновляется гораздо быстрее, чем при холодном запуске.

Как устранить указанную выше проблему?

Я предполагаю, что есть некая связь процесса/памяти с ускорителем EI, когда скрипт запущен, и она теряется при гибернации. Нет ли способа сделать так, чтобы она сохранялась?

Связанный контент