Atualmente executando mais de 28 implantações no registro do GKE no Stackdriver usando a coleta automática fluentd.
Versão Mestre K8s:1.10.6-gke.2
Versão do nó:1.10.6-gke.2
Registrando aproximadamente 200 strings JSON por minuto espalhadas por vários pods.
Estamos enfrentando lacunas intermitentes na ingestão de registros no Stackdriver. Ao verificar os logs usando, kubectl
podemos ver claramente os logs sendo produzidos no formato de log estruturado correto. A exclusão/reimplementação de pods parece retomar momentaneamente a ingestão.
Verifiquei os logs do fluentd e do escalonador automático em busca de erros, mas ele parece estar funcionando normalmente.
A página de cotas da API do Stackdriver no console da nuvem indica que algumas solicitações para a API de registro falharam, embora eu não tenha ideia de como revelar os erros produzidos pelo Stackdriver ao usar a ingestão automática de registros do GKE. A taxa de erro relatada na página de cotas também não é suficiente para explicar os intervalos, às vezes de mais de 24 horas, que estamos vendo.