В настоящее время выполняется более 28 развертываний с регистрацией GKE в Stackdriver с использованием автоматического сбора данных fluentd.
Версия Master K8s:1.10.6-гке.2
Версия узла:1.10.6-гке.2
Регистрация примерно 200 строк JSON в минуту, распределенных по нескольким модулям.
Мы испытываем периодические пробелы в приеме журналов в Stackdriver. При проверке журналов с помощью kubectl
мы можем ясно видеть, что журналы производятся в правильном структурированном формате журналирования. Удаление pods / повторное развертывание, похоже, на мгновение возобновляет прием.
Я проверил журналы fluentd и его автомасштабирования на наличие ошибок, но, похоже, все работает нормально.
Страница квот API Stackdriver в облачной консоли показывает, что некоторые запросы к API ведения журналов не были выполнены, хотя я понятия не имею, как выявить ошибки, которые выдает Stackdriver при использовании автоматического приема журналов GKE. Частота ошибок, указанная на странице квот, также недостаточна для объяснения иногда наблюдаемых нами разрывов в 24 часа и более.
решение1
Это не ожидаемое поведение, если у вас естьподдерживать, пожалуйста, откройте дело для дальнейшего расследования, в противном случае, пожалуйста, откройте отчет об ошибкездесь.