¿Cómo puedo estar seguro de que una máquina virtual en GCP no se apagó por ser interrumpible? (después del hecho, usando stackdriver)

¿Cómo puedo estar seguro de que una máquina virtual en GCP no se apagó por ser interrumpible? (después del hecho, usando stackdriver)

Estoy buscando una consulta para stackdriver que generará eventos de preferencia en las máquinas virtuales de GCP.

¿Por qué? Porque tengo vainas que desaparecen de los nodos. Aparentemente, esos nodos se cancelan más tarde debido a que faltan cargas de trabajo y se habilita el escalado automático. Entonces todo parece que los pods mueren primero y el escalador automático actúa como debería y apaga los nodos. Aún así, no parece suceder cuando evito las máquinas virtuales/nodos interrumpibles.

Respuesta1

Poco después de hacer esta pregunta encontréhttps://cloud.google.com/logging/docs/audit/#system_event

Entonces, el filtrado logName="projects/<my-project-name>/logs/cloudaudit.googleapis.com%2Fsystem_event"mostró que se estaban produciendo un par de apropiaciones. No sabía que los recursos apropiados se recrean automáticamente. Esto explica por qué tuve la impresión de que los pods desaparecen, mientras que los nodos quedan vacíos. (ver también¿Por qué los pods de un nodo que se recreó después de haber sido reemplazado se atascan en ContainerCreating?)

Respuesta2

Los registros de preferencia en esta instancia se pueden encontrar usando el siguiente filtro avanzado de Stackdriver [1] enConsultas de registros avanzados.

Puede cambiar la última línea de este filtro a [2] para comprobar cuándo se inició por última vez. Alternativamente, puede ejecutar comandos como "uptime" en la VM para ver cuánto tiempo ha estado activa.

[1]

resource.type="gce_instance"
resource.labels.instance_id="[INSTANCE ID]"
jsonPayload.event_subtype="compute.instances.preempted"

[2]jsonPayload.event_subtype="compute.instances.start"

información relacionada