Журналы AWS RDS Slow Query, General и Audit исчезли. Расширенный мониторинг не может быть включен

Журналы AWS RDS Slow Query, General и Audit исчезли. Расширенный мониторинг не может быть включен

У меня был включен расширенный мониторинг AWS RDS в наших базах данных Production и UAT RDS. Они подключены к экземпляру ERP.

Я пошел искать медленные запросы во время отладки проблемы пользователя, иЖурналы аудита, общие и медленные запросы исчезли.

Они были и есть включены. Они были в CloudWatch. Ни одного не осталось, хотя у нас > 1 года хранения.

Если я зайду в панель управления и нажму на гиперссылку «Опубликованные журналы», CloudWatch скажет:

There was an error filtering log events
The specified log group does not exist

введите описание изображения здесь

Журналы ошибок существуют и не содержат никаких ошибок регистрации.

Я также пробовал отключать другие журналы, оставляя настройки, а затем включать их. Другие журналы (медленный SQL и т. д.) по-прежнему отсутствуют.

Эти журналы для производства критически важны для бизнеса - я имею в виду, если ваш журнал аудита внезапно исчезнет, ​​сложно создать оповещения, верно? Я не могу поверить, что нет даже ошибки об исчезновении этих журналов.

Я увидел, что «Расширенный мониторинг» отключен, поэтому я включил его и получил следующее:

Amazon RDS не удалось настроить расширенный мониторинг на вашем экземпляре: uat, и эта функция была отключена. Вероятно, это связано с тем, что rds-monitoring-role отсутствует и не настроена правильно в вашей учетной записи. Для получения дополнительных сведений см. раздел устранения неполадок в документации Amazon RDS.

Такая роль существует и не менялась с 2019 года.

rds-monitoring-role, доверительные отношения:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "",
            "Effect": "Allow",
            "Principal": {
                "Service": "monitoring.rds.amazonaws.com"
            },
            "Action": "sts:AssumeRole"
        }
    ]
}

Еще одно: я установил процедуру CloudWatch интеграции DataDog с AWS около двух недель назад. Это могло бы быть примерно тогда, когда все логи исчезли, но я думаю, что это больше совпадение, иначе я бы открыл тикет с ними. Я удалил их стек CloudWatch, и логи не вернулись.

Этот вопросупоминаются параметры журнала, но я проверил, и наши не изменились.

решение1

Я настроил экземпляр Amazon RDS для регистрации запросов Audit, Error, General и Slow. Хотя эти журналы были видны в конфигурации RDS, я столкнулся с ошибкой при проверке CloudWatch.

Чтобы решить эту проблему, я последовал рекомендации службы RDS и изменил параметр log_output на FILE. После внесения этой корректировки журнал медленных запросов начал отображаться в CloudWatch. Кроме того, я мог установить long_query_time на 0, чтобы захватывать все запросы, а slow_query_log на 1.

Связанный контент