
我在生產和 UAT RDS 資料庫中啟用了 AWS RDS 增強監控。它們連接到 ERP 實例。
我在調試用戶問題時尋找緩慢的查詢,並且審核、常規和慢查詢日誌已消失。
它們過去和現在都已啟用。他們曾經在 CloudWatch 中。即使我們保留了超過 1 年,也沒有留下任何人。
如果我通過控制面板並單擊“已發布日誌”中的超鏈接,CloudWatch 會顯示
There was an error filtering log events
The specified log group does not exist
錯誤日誌確實存在,並且不顯示任何日誌記錄錯誤。
我還嘗試關閉其他日誌,讓設定保留,然後打開它們。其他日誌(慢SQL等)仍然不存在。
這些生產日誌對業務至關重要 - 我的意思是,如果您的審核日誌突然消失,就很難建立警報,對吧?我不敢相信這些日誌消失甚至沒有錯誤。
我確實看到“增強監控”已關閉,所以我將其打開,並獲得以下資訊:
Amazon RDS 無法在您的執行個體上設定增強監控:uat 且此功能已停用。請參閱 Amazon RDS 文件中的故障排除部分以了解更多詳細資訊。
該角色確實存在,並且自 2019 年以來沒有變化。
rds-monitoring-role,信任關係:
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "",
"Effect": "Allow",
"Principal": {
"Service": "monitoring.rds.amazonaws.com"
},
"Action": "sts:AssumeRole"
}
]
}
另一件事:大約兩週前我確實安裝了 DataDog 的 AWS 整合 CloudWatch 例程。大概就是在所有日誌消失的時候,但我認為這更巧合,或者我會向他們開一張票。我刪除了他們的 CloudWatch 堆疊,但日誌還沒回來。
這個問題提到日誌參數,但我檢查了,我們的沒有改變。
答案1
我設定了一個 Amazon RDS 實例來記錄審核、錯誤、常規和慢速查詢。雖然這些日誌在 RDS 配置中可見,但我在檢查 CloudWatch 時遇到了錯誤。
為了解決這個問題,我遵循了 RDS 服務建議,並將 log_output 參數更改為 FILE。進行此調整後,慢查詢日誌開始顯示在 CloudWatch 中。此外,我可能將 long_query_time 設為 0 以捕獲所有查詢,並將 Slow_query_log 設為 1。