
Я проверил журналы медленных запросов и за 2 часа получил всего 4 запроса, и все они были похожи на этот:
"SELECT HEX(uhash) AS uhash, vehid, IF(deleted = 0 AND follow_price_drop = 1, 1, 0) AS follow_price_drop, email, deleted
FROM wp_ product_favorite_count AS cfc
INNER JOIN wp_ product_favorite_user AS cfu ON cfc. product_favorite_user_uhash = cfu.uhash
WHERE cfc.updated > '2021-09-23 12:49:02' OR cfu.updated > '2021-09-23 12:49:02'"
Я проверил top и htop и часто получаю 100% загрузку процессора на всех 6 ядрах процессора.
Большая часть использования ЦП приходится на mysqld, поэтому я зарегистрировал базу данных:
iostat -xm 5 3 выдал мне:
avg-cpu: %user %nice %system %iowait %steal %idle
11.34 0.01 1.80 1.13 0.08 85.65
Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
xvda 39.75 720.61 79.81 192.29 0.99 3.57 34.30 0.02 0.09 0.19 0.04 0.09 2.53
^[[A^[[A^[[Aavg-cpu: %user %nice %system %iowait %steal %idle
84.15 0.00 6.16 0.05 0.03 9.61
Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
xvda 0.80 31.00 14.40 19.80 0.65 0.20 50.95 0.02 0.73 0.93 0.58 0.43 1.48
^[[A^[[Bavg-cpu: %user %nice %system %iowait %steal %idle
84.54 0.00 4.95 0.10 0.05 10.36
Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
xvda 0.00 2.40 22.60 1.60 1.77 0.02 151.40 0.02 1.02 1.04 0.75 0.64 1.56
ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 128341
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 10240
cpu time (seconds, -t) unlimited
max user processes (-u) 128341
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
Я проверил общий журнал запросов после проверки журнала медленных запросов и был удивлен, что получил так много запросов. Когда трафик обычный, я получил: 136235 запросов, большинство из которых являются запросами SELECT через 10 минут. А когда трафик высокий, я получил: 195650 запросов за 10 минут. Я сомневаюсь, что это 195650 посетителей, но по какой-то причине вызовы находятся внутри general_log. В slow_query_log было всего 4 запроса, и они не выглядели как неоптимизированные запросы. Есть ли что-то еще, на что мне следует обратить внимание, или этого достаточно, чтобы предположить, что это из-за трафика, и нам следует обновить сервер?
top выглядит примерно так, я не смог запечатлеть это вовремя, но когда загрузка процессора достигла 95%+, экран стал выглядеть так:
top - 13:04:51 up 1140 days, 19:59, 2 users, load average: 26.57, 16.21, 8.92
Tasks: 429 total, 12 running, 421 sleeping, 0 stopped, 0 zombie
Cpu(s): 91.3%us, 1.6%sy, 0.0%ni, 65.7%id, 3.1%wa, 0.0%hi, 0.2%si, 0.1%st
Mem: 32877280k total, 31367584k used, 1509696k free, 3960824k buffers
Swap: 0k total, 0k used, 0k free, 3980580k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
14576 mysql 20 0 12.9g 8.5g 8424 S 951.6 27.2 18841:47 mysqld
6032 martind 20 0 510m 65m 9160 S 61.4 0.2 2:49.40 php-fpm
7329 martind 20 0 498m 63m 5556 R 57.6 0.2 0:47.15 php-fpm
7321 martind 20 0 487m 52m 5532 R 46.1 0.2 0:45.18 php-fpm
7160 martind 20 0 488m 52m 5540 R 44.1 0.2 1:02.67 php-fpm
6031 martind 20 0 511m 67m 8076 S 42.2 0.2 2:50.87 php-fpm
6696 martind 20 0 498m 63m 5700 S 38.4 0.2 1:36.38 php-fpm
7283 martind 20 0 494m 59m 5268 S 34.5 0.2 0:46.19 php-fpm
7314 martind 20 0 490m 55m 5536 R 33.0 0.2 0:44.22 php-fpm
7330 martind 20 0 496m 60m 5436 R 26.4 0.2 0:46.82 php-fpm
7305 martind 20 0 494m 58m 5572 R 25.4 0.2 0:48.85 php-fpm
6706 martind 20 0 507m 62m 8060 S 13.7 0.2 1:40.55 php-fpm
7276 martind 20 0 498m 63m 5264 S 7.7 0.2 0:49.89 php-fpm
17464 redis 20 0 4328m 2.3g 888 R 7.7 7.3 7827:30 redis-server
6402 martind 20 0 511m 67m 8056 S 5.8 0.2 2:15.21 php-fpm
6405 martind 20 0 512m 69m 9204 S 5.8 0.2 2:14.32 php-fpm
6703 martind 20 0 513m 67m 8056 S 5.8 0.2 1:39.40 php-fpm
6705 martind 20 0 513m 68m 9040 S 5.8 0.2 1:36.18 php-fpm
7303 martind 20 0 493m 57m 6556 S 5.8 0.2 0:47.04 php-fpm
7304 martind 20 0 494m 59m 5264 S 5.8 0.2 0:48.70 php-fpm
7323 martind 20 0 511m 67m 7772 S 5.8 0.2 0:45.53 php-fpm
24515 nginx 20 0 123m 66m 2452 S 5.8 0.2 7231:17 nginx
6039 martind 20 0 507m 63m 8200 S 3.8 0.2 2:48.39 php-fpm
6400 martind 20 0 511m 68m 8204 S 3.8 0.2 2:13.54 php-fpm
6401 martind 20 0 510m 66m 9052 S 3.8 0.2 2:13.36 php-fpm
6404 martind 20 0 512m 68m 9048 S 3.8 0.2 2:12.75 php-fpm
Так что, поскольку есть так много SQL-запросов, когда он имеет тенденцию сильно замедляться, я думаю, что это вызвано высоким трафиком. Я проверил cronjobs (wordpress cronjobs и php cronjobs), и, похоже, ничего не запускается, когда он замедляется, может быть, есть процесс rsync, работающий в то же время, но процесс rsync работает все время, поэтому я сомневаюсь, что это вызвано этим. Есть что-то, что я могу проверить?
решение1
Анализ ГЛОБАЛЬНОГО СТАТУСА и ПЕРЕМЕННЫХ:
Наблюдения:
- Версия: 10.4.12-MariaDB
- 32 ГБ оперативной памяти
- Время работы = 19д 23:11:43
- Похоже, вы используете и MyISAM, и InnoDB.
- 240 QPS
Более важные вопросы:
Измените long_query_time
на 1
, чтобы вы могли поймать больше запросов в slowlog. (У вас сейчас 10 секунд; это, вероятно, объясняет, почему вы нашли только 4 запроса.) Есть несколько признаков того, что некоторые запросы работают неэффективно. Вот способ найти такие запросы: http://mysql.rjweb.org/doc.php/mysql_analysis#slow_queries_and_slowlog
Почему вы используете MyISAM? Значения сбивают с толку — как будто вы [пере]строили индекс для большой таблицы MyISAM, но ничего больше не сделали. В большинстве случаев лучше использовать InnoDB.
innodb_buffer_pool_size
вероятно, можно увеличить для повышения скорости запросов InnoDB.
Будьте осторожны general_log
— диск заполняется довольно быстро.
«Кэш запросов» работает неэффективно. Рекомендую полностью его отключить: query_cache_type=off
и query_cache_size=0
.
Max_used_connections
достиг 152, что указывает на то, что одновременно подключено много пользователей. (Это не означает, что одновременно выполнялось 152 запроса.)
Подробности и другие наблюдения:
Преобразование из MyISAM в InnoDB
( Key_blocks_used * 1024 / key_buffer_size ) = 460 * 1024 / 128M = 0.35%
-- Процент использования key_buffer. Верхний предел. -- Уменьшите key_buffer_size (теперь 134217728), чтобы избежать ненужного использования памяти.
( (key_buffer_size / 0.20 + innodb_buffer_pool_size / 0.70) ) = ((128M / 0.20 + 8192M / 0.70)) / 32768M = 37.7%
-- Большую часть доступной оперативной памяти следует выделить для кэширования. --http://mysql.rjweb.org/doc.php/memory
( general_log ) = general_log = ON
-- Журнал (ФАЙЛ или ТАБЛИЦА) всех выполненных запросов. -- Отключайте general_log (сейчас ВКЛ), когда он не используется. Этот журнал может очень быстро заполнить диск.
( innodb_buffer_pool_size ) = 8,192 / 32768M = 25.0%
-- % оперативной памяти, используемой для InnoDB buffer_pool -- Установите значение около 70% от доступной оперативной памяти. (Слишком низкое значение менее эффективно; слишком высокое значение приводит к риску подкачки.)
( (key_buffer_size / 0.20 + innodb_buffer_pool_size / 0.70) ) = ((128M / 0.20 + 8192M / 0.70)) / 32768M = 37.7%
-- (метрика для оценки использования оперативной памяти)
( innodb_lru_scan_depth * innodb_page_cleaners ) = 1,024 * 4 = 4,096
-- Объем работы для очистки страниц каждую секунду. -- "InnoDB: page_cleaner: 1000ms expected loop took ..." можно исправить, уменьшив lru_scan_depth: рассмотрите 1000 / innodb_page_cleaners (теперь 4). Также проверьте подкачку.
( innodb_lru_scan_depth ) = 1,024
-- "InnoDB: page_cleaner: предполагаемый цикл занял 1000 мс ..." можно исправить, уменьшив lru_scan_depth
( innodb_io_capacity ) = 200
-- При промывке используйте указанное количество IOP. -- Чтение может быть медленным или резким.
( Innodb_log_writes ) = 43,856,157 / 1725103 = 25 /sec
( Innodb_os_log_written / (Uptime / 3600) / innodb_log_files_in_group / innodb_log_file_size ) = 137,804,939,264 / (1725103 / 3600) / 2 / 48M = 2.86
-- Соотношение -- (см. протокол)
( Uptime / 60 * innodb_log_file_size / Innodb_os_log_written ) = 1,725,103 / 60 * 48M / 137804939264 = 10.5
-- Минуты между ротациями журнала InnoDB Начиная с версии 5.6.8, это можно изменять динамически; не забудьте также изменить my.cnf. -- (Рекомендация 60 минут между ротациями несколько произвольна.) Отрегулируйте innodb_log_file_size (теперь 50331648). (Нельзя изменить в AWS.)
( innodb_flush_method ) = innodb_flush_method = fsync
-- Как InnoDB должна просить ОС записывать блоки. Предложите O_DIRECT или O_ALL_DIRECT (Percona), чтобы избежать двойной буферизации. (По крайней мере для Unix.) См. chrischandler для предостережений относительно O_ALL_DIRECT
( default_tmp_storage_engine ) = default_tmp_storage_engine =
( innodb_flush_neighbors ) = 1
-- Небольшая оптимизация при записи блоков на диск. -- Используйте 0 для SSD-накопителей; 1 для HDD.
( innodb_io_capacity ) = 200
-- Возможное количество операций ввода-вывода в секунду на диске: 100 для медленных дисков; 200 для вращающихся дисков; 1000-2000 для твердотельных накопителей; умножить на коэффициент RAID.
( innodb_adaptive_hash_index ) = innodb_adaptive_hash_index = ON
-- Обычно должно быть ВКЛ. -- В некоторых случаях лучше ВЫКЛ. См. также innodb_adaptive_hash_index_partitions (теперь 8) (после 5.7.9) и innodb_adaptive_hash_index_partitions (MariaDB и Percona). ВКЛ было связано с редкими сбоями (ошибка 73890). В версии 10.5.0 было принято решение по умолчанию ВЫКЛ.
( innodb_print_all_deadlocks ) = innodb_print_all_deadlocks = OFF
-- Регистрировать ли все взаимоблокировки. -- Если вас мучают взаимоблокировки, включите это. Внимание: если у вас много взаимоблокировок, это может привести к записи большого объема данных на диск.
( character_set_server ) = character_set_server = latin1
-- Проблемы с набором символов можно решить, установив character_set_server (теперь latin1) на utf8mb4. Это будущее значение по умолчанию.
( local_infile ) = local_infile = ON
-- local_infile (теперь ВКЛ) = ВКЛ — потенциальная проблема безопасности
( Key_blocks_used * 1024 / key_buffer_size ) = 460 * 1024 / 128M = 0.35%
-- Процент использования key_buffer. Верхний предел. -- Уменьшите key_buffer_size (теперь 134217728), чтобы избежать ненужного использования памяти.
( Key_writes / Key_write_requests ) = 19,978,377 / 40284646 = 49.6%
-- эффективность key_buffer для записи -- Если у вас достаточно оперативной памяти, имеет смысл увеличить key_buffer_size (сейчас 134217728).
( query_cache_size ) = 524,288 = 0.5MB
-- Размер QC -- Слишком маленький = не очень полезен. Слишком большой = слишком много накладных расходов. Рекомендуется 0 или не более 50M.
( Qcache_lowmem_prunes ) = 125,234,412 / 1725103 = 73 /sec
-- Недостаточно места в QC -- увеличьте query_cache_size (теперь 524288)
( Qcache_lowmem_prunes/Qcache_inserts ) = 125,234,412/146211296 = 85.7%
-- Коэффициент удаления (частота необходимости удаления из-за нехватки памяти)
( Qcache_not_cached ) = 78,413,835 / 1725103 = 45 /sec
-- SQL_CACHE предпринята, но проигнорирована -- Переосмыслить кэширование; настроить qcache
( Qcache_hits / Qcache_inserts ) = 37,201,050 / 146211296 = 0.254
-- Соотношение попаданий и вставок — высокое — хорошо. Рассмотрите возможность отключения кэширования запросов.
( Qcache_hits / (Qcache_hits + Com_select) ) = 37,201,050 / (37201050 + 282029692) = 11.7%
-- Коэффициент попаданий -- SELECT, которые использовали QC -- Рассмотрите возможность отключения кэширования запросов.
( Qcache_hits / (Qcache_hits + Qcache_inserts + Qcache_not_cached) ) = 37,201,050 / (37201050 + 146211296 + 78413835) = 14.2%
-- Частота попаданий в кэш запросов -- Вероятно, лучше отключить QC.
( (query_cache_size - Qcache_free_memory) / Qcache_queries_in_cache / query_alloc_block_size ) = (524288 - 78344) / 82 / 16384 = 0.332
-- query_alloc_block_size и формула -- Скорректируйте query_alloc_block_size (теперь 16384)
( Created_tmp_tables ) = 96,501,765 / 1725103 = 56 /sec
-- Частота создания «временных» таблиц как части сложных SELECT-ов.
( Created_tmp_disk_tables ) = 23,539,653 / 1725103 = 14 /sec
-- Частота созданиядиск"temp" таблицы как часть сложных SELECT-ов -- увеличьте tmp_table_size (теперь 16777216) и max_heap_table_size (теперь 16777216). Проверьте правила для временных таблиц, когда MEMORY используется вместо MyISAM. Возможно, незначительные изменения схемы или запроса позволят избежать MyISAM. Более эффективные индексы и переформулирование запросов, скорее всего, помогут.
( Created_tmp_disk_tables / Questions ) = 23,539,653 / 414140316 = 5.7%
-- Процент запросов, которым требовалась таблица tmp на диске. -- Лучшие индексы / Никаких блобов / и т. д.
( Select_full_join / Com_select ) = 30,333,225 / 282029692 = 10.8%
-- % выборок, которые являются безиндексными соединениями -- Добавить подходящий(ие) индекс(ы) к таблицам, используемым в соединениях.
( Com_insert + Com_delete + Com_delete_multi + Com_replace + Com_update + Com_update_multi ) = (87669877 + 27242 + 0 + 0 + 1452911 + 0) / 1725103 = 52 /sec
-- записывает/сек -- 50 записей/сек + сбросы журнала, вероятно, максимизируют емкость ввода-вывода записи HDD-дисков. Если у вас SSD, то эта метрика, вероятно, подойдет.
( binlog_format ) = binlog_format = MIXED
-- ЗАЯВЛЕНИЕ/СТРОКА/СМЕШАННАЯ. -- СТРОКА предпочитается 5.7 (10.3)
( long_query_time ) = 10
-- Отсечка (секунды) для определения «медленного» запроса. -- Предложить 2
( Max_used_connections / max_connections ) = 152 / 151 = 100.7%
-- Пиковый % подключений -- увеличьте max_connections (теперь 151) и/или уменьшите wait_timeout (теперь 28800). Или ускорьте запросы.
( Connections ) = 11,987,448 / 1725103 = 6.9 /sec
-- Подключения -- Увеличить wait_timeout (теперь 28800); использовать пул?
( Connection_errors_accept + Connection_errors_internal + Connection_errors_peer_address + Connection_errors_select + Connection_errors_tcpwrap ) = 0 + 26 + 0 + 0 + 0 = 26
-- Ошибки подключения, отличные от max_connections. -- Для получения дополнительной информации см. ПОКАЗ ГЛОБАЛЬНОГО СОСТОЯНИЯ, КАК 'Connection_errors%'
Аномально маленький:
Created_tmp_files = 0.094 /HR
innodb_spin_wait_delay = 4
Аномально большой:
Aria_pagecache_writes = 34 /sec
Aria_transaction_log_syncs = 25,641
Com_show_warnings = 40 /HR
Connection_errors_internal = 0.054 /HR
Handler_read_key = 85109 /sec
Handler_tmp_update = 839 /sec
Innodb_buffer_pool_read_requests = 675158 /sec
Innodb_buffer_pool_read_requests / (Innodb_buffer_pool_read_requests + Innodb_buffer_pool_reads ) = 100.0%
Innodb_rows_updated = 356 /sec
performance_schema_max_cond_classes = 90
Ненормальные строки:
Innodb_have_punch_hole = OFF
aria_recover_options = BACKUP,QUICK
disconnect_on_expired_password = OFF
ft_boolean_syntax = + -><()~*:
innodb_fast_shutdown = 1
log_output = TABLE
myisam_stats_method = NULLS_UNEQUAL
old_alter_table = DEFAULT
optimizer_trace = enabled=off