mySQL のランダム CPU スパイクの診断

mySQL のランダム CPU スパイクの診断

私たちの組織には、かなり高度な(多くの可動部分がある)Web アプリケーションがあり、最近まで問題なく動作していましたが、目立った変更は行われていませんでした。

Apache Web サーバー、mySQL サーバー (データ処理)、そしてパブリックの繰り返しリクエストを処理する別の mySQL サーバーがあります。メイン Web サーバーへのトラフィックの流入は、セカンダリ SQL サーバーにのみほぼ影響します。繰り返しリクエスト サーバーはデータ処理サーバーのスレーブですが、繰り返しリクエスト サーバー (読み取り専用) には書き込みクエリは送信されません。

私が直面している問題は、データ処理 MySQL サーバーが、通常は 15 ~ 20% で動作しているのに、高負荷時でも CPU 使用率がランダムに 100% に急上昇するように見えることです。CPU 使用率が 100% の状態は約 8 秒間続き、2 ~ 3 分ごとに突然上昇して、その後ランダムに消えます。

100% のときに処理が試行されるクエリを除き、スロー クエリ ログにはクエリはありません。ログに記録されるクエリは、ランダム スパイクが発生する前に通常問題なく実行されているクエリと同じです。

HTOP によって表示されるアクティビティは mySQL のみで、このサーバーでは cron もスケジュールされておらず、この時間帯に他のクエリ アクティビティが増加することもありません。オープン接続スレッド アカウントは 3 ~ 5 程度で安定しており、PROCESS LIST にも、その前、最中、または後に 3 ~ 5 個のクエリのみが含まれています。

SELECT * FROM audio
WHERE associated_incident IS null
AND archive IS NULL
AND temp_skip IS null
AND length >= 3
AND (locked <> 1 or locked IS NULL)
AND timestamp > (NOW() - INTERVAL 4 HOUR)
ORDER BY `audio`.`id` DESC
LIMIT 1;

UPDATE audio SET locked=1, lockexpr = '$ulockexpr', lockuser = '$ulockuser' WHERE id = $audio_id;

上記のクエリは、当社のスタッフが使用するソフトウェアで繰り返し実行されますが、特定の時点では 1 秒あたり 1 ~ 2 回しか実行されません。ただし、これが問題を絞り込むための最も近い方法です。このクエリは、スパイクが高いときに slow_query_log にも表示されます。ただし、念のため明確にしておくと、このクエリは 1 日中使用されるため、常にこれらの問題が発生するわけではありません。

このクエリを使用してサーバーのストレス テストを実行し、5 秒以内に 100 回実行しても、戻り時間の平均結果は 0.002 ~ 0.005 秒になります。

/var/log/mysql には 8.2Gb の mysql-bin ファイルがあります。

my.cnf への変更は可能

key_buffer_size         = 16M
myisam-recover-options  = BACKUP
log_error = /var/log/mysql/error.log
slow_query_log          = 1
slow_query_log_file     = /var/log/mysql/mysql-slow.log
long_query_time = 2

 server-id              = 1
 log_bin                        = /var/log/mysql/mysql-bin.log
max_binlog_size   = 100M
binlog_do_db            = incident_log

その他はすべて未指定またはコメントアウトされています。

MySQL チューナー

 >>  MySQLTuner 2.1.1
         * Jean-Marie Renouard <[email protected]>
         * Major Hayden <[email protected]>
 >>  Bug reports, feature requests, and downloads at http://mysqltuner.pl/
 >>  Run with '--help' for additional options and output filtering

[--] Skipped version check for MySQLTuner script
[OK] Logged in using credentials from Debian maintenance account.

[OK] Currently running supported MySQL version 8.0.32-0ubuntu0.20.04.2
[OK] Operating on 64-bit architecture

-------- Log file Recommendations ------------------------------------------------------------------
[OK] Log file /var/log/mysql/error.log exists
[--] Log file: /var/log/mysql/error.log (0B)
[--] Log file /var/log/mysql/error.log is empty. Assuming log-rotation. Use --server-log={file} for explicit file

-------- Storage Engine Statistics -----------------------------------------------------------------
[--] Status: +ARCHIVE +BLACKHOLE +CSV -FEDERATED +InnoDB +MEMORY +MRG_MYISAM +MyISAM +PERFORMANCE_SCHEMA
[--] Data in InnoDB tables: 1.5G (Tables: 107)
[OK] Total fragmented tables: 0

-------- Analysis Performance Metrics --------------------------------------------------------------
[--] innodb_stats_on_metadata: OFF
[OK] No stat updates during querying INFORMATION_SCHEMA.

-------- Views Metrics -----------------------------------------------------------------------------

-------- Triggers Metrics --------------------------------------------------------------------------

-------- Routines Metrics --------------------------------------------------------------------------

-------- Security Recommendations ------------------------------------------------------------------
[--] Skipped due to unsupported feature for MySQL 8.0+

-------- CVE Security Recommendations --------------------------------------------------------------
[--] Skipped due to --cvefile option undefined

-------- Performance Metrics -----------------------------------------------------------------------
[--] Up for: 12h 41m 34s (3M q [73.289 qps], 1M conn, TX: 5G, RX: 445M)
[--] Reads / Writes: 81% / 19%
[--] Binary logging is enabled (GTID MODE: OFF)
[--] Physical Memory     : 1.9G
[--] Max MySQL memory    : 10.1G
[--] Other process memory: 0B
[--] Total buffers: 176.0M global + 65.9M per thread (151 max threads)
[--] Performance_schema Max memory usage: 239M
[--] Galera GCache Max memory usage: 0B
[!!] Maximum reached memory usage: 10.2G (528.62% of installed RAM)
[!!] Maximum possible memory usage: 10.1G (525.28% of installed RAM)
[!!] Overall possible memory usage with other process exceeded memory
[OK] Slow queries: 0% (3/3M)
[!!] Highest connection usage: 100% (152/151)
[OK] Aborted connections: 0.09% (1203/1391547)
[!!] Name resolution is active: a reverse name resolution is made for each new connection which can reduce performance
[--] Query cache has been removed since MySQL 8.0
[OK] Sorts requiring temporary tables: 0% (0 temp sorts / 10K sorts)
[!!] Joins performed without indexes: 5915
[OK] Temporary tables created on disk: 0% (0 on disk / 8K total)
[OK] Thread cache hit rate: 94% (75K created / 1M connections)
[OK] Table cache hit rate: 99% (1M hits / 1M requests)
[OK] table_definition_cache (2000) is greater than number of tables (434)
[OK] Open file limit used: 0% (3/10K)
[OK] Table locks acquired immediately: 100% (1K immediate / 1K locks)
[OK] Binlog cache memory access: 100.00% (346520 Memory / 346520 Total)

-------- Performance schema ------------------------------------------------------------------------
[--] Performance_schema is activated.
[--] Memory used by Performance_schema: 239.2M
[--] Sys schema is installed.

-------- ThreadPool Metrics ------------------------------------------------------------------------
[--] ThreadPool stat is disabled.

-------- MyISAM Metrics ----------------------------------------------------------------------------
[--] MyISAM Metrics are disabled since MySQL 8.0.

-------- InnoDB Metrics ----------------------------------------------------------------------------
[--] InnoDB is enabled.
[--] InnoDB Thread Concurrency: 0
[OK] InnoDB File per table is activated
[!!] InnoDB buffer pool / data size: 128.0M / 1.5G
[!!] Ratio InnoDB log file size / InnoDB Buffer pool size (75%): 48.0M * 2 / 128.0M should be equal to 25%
[OK] InnoDB buffer pool instances: 1
[--] Number of InnoDB Buffer Pool Chunk: 1 for 1 Buffer Pool Instance(s)
[OK] Innodb_buffer_pool_size aligned with Innodb_buffer_pool_chunk_size & Innodb_buffer_pool_instances
[OK] InnoDB Read buffer efficiency: 99.87% (403976971 hits / 404504329 total)
[!!] InnoDB Write Log efficiency: 59.62% (1713194 hits / 2873563 total)
[OK] InnoDB log waits: 0.00% (0 waits / 1160369 writes)

-------- Aria Metrics ------------------------------------------------------------------------------
[--] Aria Storage Engine not available.

-------- TokuDB Metrics ----------------------------------------------------------------------------
[--] TokuDB is disabled.

-------- XtraDB Metrics ----------------------------------------------------------------------------
[--] XtraDB is disabled.

-------- Galera Metrics ----------------------------------------------------------------------------
[--] Galera is disabled.

-------- Replication Metrics -----------------------------------------------------------------------
[--] Galera Synchronous replication: NO
[--] No replication slave(s) for this server.
[--] Binlog format: ROW
[--] XA support enabled: ON
[--] Semi synchronous replication Master: Not Activated
[--] Semi synchronous replication Slave: Not Activated
[--] This is a standalone server

-------- Recommendations ---------------------------------------------------------------------------
General recommendations:
    MySQL was started within the last 24 hours: recommendations may be inaccurate
    Reduce your overall MySQL memory footprint for system stability
    Dedicate this server to your database for highest performance.
    Reduce or eliminate persistent connections to reduce connection usage
    Configure your accounts with ip or subnets only, then update your configuration with skip-name-resolve=1
    We will suggest raising the 'join_buffer_size' until JOINs not using indexes are found.
             See https://dev.mysql.com/doc/internals/en/join-buffer-size.html
             (specially the conclusions at the bottom of the page).
    Buffer Key MyISAM set to 0, no MyISAM table detected
    Before changing innodb_log_file_size and/or innodb_log_files_in_group read this: https://bit.ly/2TcGgtU
Variables to adjust:
  *** MySQL's maximum memory usage is dangerously high ***
  *** Add RAM before increasing MySQL buffer variables ***
    max_connections (> 151)
    wait_timeout (< 28800)
    interactive_timeout (< 28800)
    skip-name-resolve=1
    join_buffer_size (> 256.0K, or always use indexes with JOINs)
    key_buffer_size=0
    innodb_buffer_pool_size (>= 1.5G) if possible.
    innodb_log_file_size should be (=16M) if possible, so InnoDB total log file size equals 25% of buffer pool size.

あらゆるアドバイスを歓迎します。

編集:

mysql> SHOW TABLE STATUS WHERE name LIKE "audio";

| Name  | Engine | Version | Row_format | Rows   | Avg_row_length | Data_length | Max_data_length | Index_length | Data_free | Auto_increment | Create_time         | Update_time         | Check_time | Collation          | Checksum | Create_options | Comment |

| audio | InnoDB |      10 | Dynamic    | 969276 |            164 |   159039488 |               0 |     90898432 |   7340032 |        1644653 | 2023-04-13 14:41:27 | 2023-04-17 14:56:21 | NULL       | utf8mb4_0900_ai_ci |     NULL |                |         |

PHP の

$sql = "SELECT * FROM audio
WHERE associated_incident IS null
AND archive IS NULL
AND temp_skip IS null
AND length >= 3
AND (locked <> 1 or locked IS NULL)
ORDER BY `audio`.`id` DESC
LIMIT 1;
";

$result = mysqli_query($conn, $sql) or die(mysqli_error());
$audio = mysqli_fetch_assoc($result);
if ($audio) {
    $audio_id = $audio['id'];
    $audio_timestamp = $audio['timestamp'];
    $audio_hash = $audio['hash'];
    $audio_length = $audio['length'];

$ulockexpr = date("Y-m-d H:i:s", strtotime('+ 5min'));
$ulockuser = $_SESSION['login_user'];
$sql_lock = "UPDATE audio SET locked=1, lockexpr = '$ulockexpr', lockuser = '$ulockuser' WHERE id = $audio_id";

答え1

変更しますinnodb_buffer_pool_size = 500M- 古いデフォルトの 128M は非常に低いです。

SELECT作業する行を見つけるためにそれを実行し、それを実行する場合はUPDATE、トランザクションを使用します。

START TRANSACTION;
SELECT ... FROM audio ... FOR UPDATE;
... process ...
UPDATE audio SET ... WHERE id = ...;
COMMIT;

これSTART - FOR UPDATE - COMMITにより、2 つのスレッドが同じアイテムを取得して処理することがなくなります。

ORDER BY timestamp DESCの代わりにを使用することを検討してくださいORDER BY id DESC

問題のあるステートメントを確認するには、この設定が必要になる場合があります。

log_slow_admin_statements = ON

テーブルにはどのようなインデックスがありますか? 提供してくださいSHOW CREATE TABLE

max_connectionsだけ下げます[はい、下げます] 50そしてApache の設定を下げて、40 を超える同時子プロセスが生成されないようにします。Max_used_connectionsヒットすることがわかりますmax_connections。 これが発生すると、問題が解決するまで MySQL はスラッシング状態になります。 制限を下げると、より早く解決が始まります。

関連情報