Faltan registros en Stackdriver de implementaciones de Kubernetes usando GKE

Faltan registros en Stackdriver de implementaciones de Kubernetes usando GKE

Actualmente se están ejecutando más de 28 implementaciones bajo GKE, registrando en Stackdriver usando la colección automática de fluentd.

Versión Master K8s:1.10.6-gke.2
Versión del nodo:1.10.6-gke.2

Registro de aproximadamente 200 cadenas JSON por minuto repartidas en varios pods.

Estamos experimentando lagunas intermitentes en la ingesta de registros en Stackdriver. Al verificar los registros, kubectlpodemos ver claramente que los registros se generan en el formato de registro estructurado correcto. La eliminación/redistribución de pods parece reanudar momentáneamente la ingestión.

Revisé los registros de fluentd y su escalador automático en busca de errores, pero parece estar funcionando normalmente.

La página de cuotas de la API de Stackdriver en la consola de la nube indica que algunas solicitudes a la API de registro fallaron, aunque no tengo idea de cómo sacar a la luz los errores que produce Stackdriver al usar la ingesta automática de registros de GKE. La tasa de error reportada en la página de cuotas tampoco es suficiente para explicar las brechas que a veces estamos viendo de más de 24 horas.

Respuesta1

Este no es un comportamiento esperado, si tieneapoyo, abra un caso para una mayor investigación; de lo contrario, abra un informe de erroraquí.

información relacionada