AWS RDS with Postgres: OOMキラーが設定されているか

Question 1

OOM キラーが動作しなかったとしても (おそらく動作したでしょう)、CPU 使用率が 100% のままで空きメモリが非常に少ないと、パフォーマンスが低下します。

より大きなインスタンスサイズを使用して、問題が解決するかどうかを確認します。制御している非 RDS Postgres でより小さいサイズをテストし、OOM キラーが怒るかどうかを確認します。

接続数は必ずしもメモリ消費の主な要因ではありません。共有メモリは他の用途に使用され、すべてのクエリが大量のメモリを使用するわけではありません。次の会話も参照してください。PostgreSqlは接続ごとにメモリを割り当てます。

DBインスタンスのRAMの推奨事項

Amazon RDS のパフォーマンスのベストプラクティスは、ワーキングセットがほぼ完全にメモリ内に存在するように十分な RAM を割り当てることです。ワーキングセットがほぼすべてメモリ内にあるかどうかを確認するには、DB インスタンスに負荷がかかっているときに ReadIOPS メトリクス (Amazon CloudWatch を使用) を確認します。ReadIOPS の値は小さく安定している必要があります。DB インスタンスクラスをスケールアップして、より多くの RAM を持つクラスにすると、ReadIOPS が大幅に低下する場合、ワーキングセットはほぼ完全にメモリ内にあったわけではありません。スケーリング操作後に ReadIOPS が大幅に低下しなくなるまで、または ReadIOPS が非常に小さな量に減少するまで、スケールアップを続けます。

パフォーマンス指標の評価

解放可能なメモリ – DB インスタンスで使用可能な RAM の量 (メガバイト単位)。[モニタリング] タブのメトリクスの赤い線は、CPU、メモリ、ストレージメトリクスの 75% でマークされています。インスタンスのメモリ消費量が頻繁にその線を超える場合は、ワークロードを確認するか、インスタンスをアップグレードする必要があることを示しています。

Answer

OOM キラーが動作しなかったとしても (おそらく動作したでしょう)、CPU 使用率が 100% のままで空きメモリが非常に少ないと、パフォーマンスが低下します。

より大きなインスタンスサイズを使用して、問題が解決するかどうかを確認します。制御している非 RDS Postgres でより小さいサイズをテストし、OOM キラーが怒るかどうかを確認します。

接続数は必ずしもメモリ消費の主な要因ではありません。共有メモリは他の用途に使用され、すべてのクエリが大量のメモリを使用するわけではありません。次の会話も参照してください。PostgreSqlは接続ごとにメモリを割り当てます。

追加のアドバイスAmazon RDS のベストプラクティス

DBインスタンスのRAMの推奨事項

Amazon RDS のパフォーマンスのベストプラクティスは、ワーキングセットがほぼ完全にメモリ内に存在するように十分な RAM を割り当てることです。ワーキングセットがほぼすべてメモリ内にあるかどうかを確認するには、DB インスタンスに負荷がかかっているときに ReadIOPS メトリクス (Amazon CloudWatch を使用) を確認します。ReadIOPS の値は小さく安定している必要があります。DB インスタンスクラスをスケールアップして、より多くの RAM を持つクラスにすると、ReadIOPS が大幅に低下する場合、ワーキングセットはほぼ完全にメモリ内にあったわけではありません。スケーリング操作後に ReadIOPS が大幅に低下しなくなるまで、または ReadIOPS が非常に小さな量に減少するまで、スケールアップを続けます。

パフォーマンス指標の評価

解放可能なメモリ – DB インスタンスで使用可能な RAM の量 (メガバイト単位)。[モニタリング] タブのメトリクスの赤い線は、CPU、メモリ、ストレージメトリクスの 75% でマークされています。インスタンスのメモリ消費量が頻繁にその線を超える場合は、ワークロードを確認するか、インスタンスをアップグレードする必要があることを示しています。

Question 2

私は Postgres の経験があまりありませんが、同じ状況で、RDS MySql インスタンスが完全に再起動する傾向があることがわかりました。基盤となるシステムにアクセスできない場合でも、Web コンソールから Postgres ログを取得できるはずです。再起動を探すと、デーモンが終了して起動していることを示すはずです。

とにかく、危険ゾーンで作業している場合、できることはあまりありません。より多くの RAM / CPU が利用可能なインスタンスに移動する必要があります。

Answer

私は Postgres の経験があまりありませんが、同じ状況で、RDS MySql インスタンスが完全に再起動する傾向があることがわかりました。基盤となるシステムにアクセスできない場合でも、Web コンソールから Postgres ログを取得できるはずです。再起動を探すと、デーモンが終了して起動していることを示すはずです。

とにかく、危険ゾーンで作業している場合、できることはあまりありません。より多くの RAM / CPU が利用可能なインスタンスに移動する必要があります。

AWS RDS with Postgres: OOMキラーが設定されているか

答え1

DBインスタンスのRAMの推奨事項

パフォーマンス指標の評価

答え2

関連情報