AWS RDS 慢查詢、常規和審核日誌已消失。無法開啟增強監控

AWS RDS 慢查詢、常規和審核日誌已消失。無法開啟增強監控

我在生產和 UAT RDS 資料庫中啟用了 AWS RDS 增強監控。它們連接到 ERP 實例。

我在調試用戶問題時尋找緩慢的查詢,並且審核、常規和慢查詢日誌已消失。

它們過去和現在都已啟用。他們曾經在 CloudWatch 中。即使我們保留了超過 1 年,也沒有留下任何人。

如果我通過控制面板並單擊“已發布日誌”中的超鏈接,CloudWatch 會顯示

There was an error filtering log events
The specified log group does not exist

在此輸入影像描述

錯誤日誌確實存在,並且不顯示任何日誌記錄錯誤。

我還嘗試關閉其他日誌,讓設定保留,然後打開它們。其他日誌(慢SQL等)仍然不存在。

這些生產日誌對業務至關重要 - 我的意思是,如果您的審核日誌突然消失,就很難建立警報,對吧?我不敢相信這些日誌消失甚至沒有錯誤。

我確實看到“增強監控”已關閉,所以我將其打開,並獲得以下資訊:

Amazon RDS 無法在您的執行個體上設定增強監控:uat 且此功能已停用。請參閱 Amazon RDS 文件中的故障排除部分以了解更多詳細資訊。

該角色確實存在,並且自 2019 年以來沒有變化。

rds-monitoring-role,信任關係:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "",
            "Effect": "Allow",
            "Principal": {
                "Service": "monitoring.rds.amazonaws.com"
            },
            "Action": "sts:AssumeRole"
        }
    ]
}

另一件事:大約兩週前我確實安裝了 DataDog 的 AWS 整合 CloudWatch 例程。大概就是在所有日誌消失的時候,但我認為這更巧合,或者我會向他們開一張票。我刪除了他們的 CloudWatch 堆疊,但日誌還沒回來。

這個問題提到日誌參數,但我檢查了,我們的沒有改變。

答案1

我設定了一個 Amazon RDS 實例來記錄審核、錯誤、常規和慢速查詢。雖然這些日誌在 RDS 配置中可見,但我在檢查 CloudWatch 時遇到了錯誤。

為了解決這個問題,我遵循了 RDS 服務建議,並將 log_output 參數更改為 FILE。進行此調整後,慢查詢日誌開始顯示在 CloudWatch 中。此外,我可能將 long_query_time 設為 0 以捕獲所有查詢,並將 Slow_query_log 設為 1。

相關內容