GCP의 VM이 선점형으로 인해 종료되지 않았는지 어떻게 확인할 수 있나요? (이후에는 Stackdriver를 사용하여)

GCP의 VM이 선점형으로 인해 종료되지 않았는지 어떻게 확인할 수 있나요? (이후에는 Stackdriver를 사용하여)

GCP VM에서 선점 이벤트를 생성하는 Stackdriver에 대한 쿼리를 찾고 있습니다.

왜? 노드에서 포드가 사라지기 때문입니다. 분명히 해당 노드는 워크로드 누락 및 자동 확장 활성화로 인해 나중에 종료됩니다. 따라서 모든 것이 포드가 먼저 죽고 자동 확장 처리가 정상적으로 작동하고 노드를 종료하는 것처럼 보입니다. 그래도 선점형 VM/노드를 피하면 그런 일이 발생하지 않는 것 같습니다.

답변1

이 질문을 한 후 제가 발견한 것은 바로https://cloud.google.com/logging/docs/audit/#system_event

따라서 필터링을 통해 logName="projects/<my-project-name>/logs/cloudaudit.googleapis.com%2Fsystem_event"몇 가지 선점이 발생하는 것으로 나타났습니다. 선점된 리소스가 자동으로 다시 생성된다는 사실을 몰랐습니다. 이것이 포드가 사라지고 노드가 비어 있다는 인상을 받은 이유를 설명합니다. (또한보십시오선점된 후 다시 생성된 노드의 Pod가 ContainerCreating에서 멈추는 이유는 무엇입니까?)

답변2

이 인스턴스의 선점 로그는 다음 Stackdriver 고급 필터 [1]를 사용하여 찾을 수 있습니다.고급 로그 쿼리.

이 필터의 마지막 줄을 [2]로 변경하여 마지막으로 시작된 시간을 확인할 수 있습니다. 또는 VM에서 "uptime"과 같은 명령을 실행하여 VM이 얼마나 오랫동안 작동했는지 확인할 수 있습니다.

[1]

resource.type="gce_instance"
resource.labels.instance_id="[INSTANCE ID]"
jsonPayload.event_subtype="compute.instances.preempted"

[2]jsonPayload.event_subtype="compute.instances.start"

관련 정보