Google Cloud의 일부 이벤트/트리거를 기반으로 인스턴스(vm)를 자동으로 시작/중지하는 방법은 무엇입니까?

Google Cloud의 일부 이벤트/트리거를 기반으로 인스턴스(vm)를 자동으로 시작/중지하는 방법은 무엇입니까?

머신러닝 관련 서비스를 실행하기 위해 Google Cloud에서 GPU 인스턴스를 사용하고 있습니다. Google Cloud에는 GPU 인스턴스에 대해 예정되지 않은 유지 관리 계획이 있습니다. 유지 관리를 위해 인스턴스가 종료되기 전에 Google Cloud API는 인스턴스가 종료되기 1시간 전에 이 인스턴스에 알림을 보냅니다.

GPU 인스턴스 이름이 "vm1"이라고 가정합니다. "vm1"이 나중에 유지 관리가 진행될 것이라는 알림을 받으면 백업 GPU 인스턴스 "vm1-duplicate"를 스핀업하여 클라이언트에 대한 서비스가 이번 유지보수의 영향을 받습니다. 그리고 "vm1"에 대한 유지 관리가 완료되면 추가 비용이 발생하지 않도록 "vm1-duplicate"를 중지합니다.

일부 조건/트리거/이벤트에 따라 자동 VM 시작/중지를 프로그래밍하는 우아한 방법이 Google Cloud에 있습니까?

답변1

매우 빠른 솔루션: vm에 gcloud를 설치하고(이미 존재해야 함) 서비스 계정을 생성하고[1] 작은 쉘 스크립트를 생성하고 15/30분마다 cron에서 실행합니다.

스크립트는 이벤트 http 엔드포인트[2]를 모니터링하고 gcloud cmd 줄을 통해 VM 내에서 새 VM을 다시 생성합니다. 자동 재시작을 중지하고 새 VM을 계속 실행하세요.

작동하는 경우 이미 스크립트가 있고 cron이 구성되어 있는 자체 이미지를 파생시키는 것을 고려하십시오. 그러면 부활이 더 쉬워질 것입니다.

[1] 필수는 아닙니다. VM에 자격 증명을 넣지 않기 위한 것입니다.

[2]https://cloud.google.com/compute/docs/gpus/gpu-host-maintenance

관련 정보