Замедление из-за пробок каждый день около 12 часов дня?

Замедление из-за пробок каждый день около 12 часов дня?

Я проверил журналы медленных запросов и за 2 часа получил всего 4 запроса, и все они были похожи на этот:

"SELECT HEX(uhash) AS uhash, vehid, IF(deleted = 0 AND follow_price_drop = 1, 1, 0) AS follow_price_drop, email, deleted 
       FROM wp_ product_favorite_count AS cfc 
       INNER JOIN wp_ product_favorite_user AS cfu ON cfc. product_favorite_user_uhash = cfu.uhash
       WHERE cfc.updated > '2021-09-23 12:49:02' OR cfu.updated > '2021-09-23 12:49:02'"

Я проверил top и htop и часто получаю 100% загрузку процессора на всех 6 ядрах процессора.

Большая часть использования ЦП приходится на mysqld, поэтому я зарегистрировал базу данных:

https://pastebin.com/BBv7ngW5

iostat -xm 5 3 выдал мне:

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
          11.34    0.01    1.80    1.13    0.08   85.65

Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
xvda             39.75   720.61   79.81  192.29     0.99     3.57    34.30     0.02    0.09    0.19    0.04   0.09   2.53

^[[A^[[A^[[Aavg-cpu:  %user   %nice %system %iowait  %steal   %idle
          84.15    0.00    6.16    0.05    0.03    9.61

Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
xvda              0.80    31.00   14.40   19.80     0.65     0.20    50.95     0.02    0.73    0.93    0.58   0.43   1.48

^[[A^[[Bavg-cpu:  %user   %nice %system %iowait  %steal   %idle
          84.54    0.00    4.95    0.10    0.05   10.36

Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
xvda              0.00     2.40   22.60    1.60     1.77     0.02   151.40     0.02    1.02    1.04    0.75   0.64   1.56

ulimit -a

core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 128341
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 10240
cpu time               (seconds, -t) unlimited
max user processes              (-u) 128341
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

Я проверил общий журнал запросов после проверки журнала медленных запросов и был удивлен, что получил так много запросов. Когда трафик обычный, я получил: 136235 запросов, большинство из которых являются запросами SELECT через 10 минут. А когда трафик высокий, я получил: 195650 запросов за 10 минут. Я сомневаюсь, что это 195650 посетителей, но по какой-то причине вызовы находятся внутри general_log. В slow_query_log было всего 4 запроса, и они не выглядели как неоптимизированные запросы. Есть ли что-то еще, на что мне следует обратить внимание, или этого достаточно, чтобы предположить, что это из-за трафика, и нам следует обновить сервер?

top выглядит примерно так, я не смог запечатлеть это вовремя, но когда загрузка процессора достигла 95%+, экран стал выглядеть так:

top - 13:04:51 up 1140 days, 19:59,  2 users,  load average: 26.57, 16.21, 8.92
Tasks: 429 total,  12 running, 421 sleeping,   0 stopped,   0 zombie
Cpu(s): 91.3%us,  1.6%sy,  0.0%ni, 65.7%id,  3.1%wa,  0.0%hi,  0.2%si,  0.1%st
Mem:  32877280k total, 31367584k used,  1509696k free,  3960824k buffers
Swap:        0k total,        0k used,        0k free,  3980580k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                 
14576 mysql     20   0 12.9g 8.5g 8424 S 951.6 27.2  18841:47 mysqld                                                  
 6032  martind     20   0  510m  65m 9160 S 61.4  0.2   2:49.40 php-fpm                                                  
 7329  martind     20   0  498m  63m 5556 R 57.6  0.2   0:47.15 php-fpm                                                  
 7321  martind     20   0  487m  52m 5532 R 46.1  0.2   0:45.18 php-fpm                                                  
 7160  martind     20   0  488m  52m 5540 R 44.1  0.2   1:02.67 php-fpm                                                  
 6031  martind     20   0  511m  67m 8076 S 42.2  0.2   2:50.87 php-fpm                                                  
 6696  martind     20   0  498m  63m 5700 S 38.4  0.2   1:36.38 php-fpm                                                  
 7283  martind     20   0  494m  59m 5268 S 34.5  0.2   0:46.19 php-fpm                                                  
 7314  martind     20   0  490m  55m 5536 R 33.0  0.2   0:44.22 php-fpm                                                  
 7330  martind     20   0  496m  60m 5436 R 26.4  0.2   0:46.82 php-fpm                                                  
 7305  martind     20   0  494m  58m 5572 R 25.4  0.2   0:48.85 php-fpm                                                  
 6706  martind     20   0  507m  62m 8060 S 13.7  0.2   1:40.55 php-fpm                                                  
 7276  martind     20   0  498m  63m 5264 S  7.7  0.2   0:49.89 php-fpm                                                  
17464 redis     20   0 4328m 2.3g  888 R  7.7  7.3   7827:30 redis-server                                             
 6402  martind     20   0  511m  67m 8056 S  5.8  0.2   2:15.21 php-fpm                                                  
 6405  martind     20   0  512m  69m 9204 S  5.8  0.2   2:14.32 php-fpm                                                  
 6703  martind     20   0  513m  67m 8056 S  5.8  0.2   1:39.40 php-fpm                                                  
 6705  martind     20   0  513m  68m 9040 S  5.8  0.2   1:36.18 php-fpm                                                  
 7303  martind     20   0  493m  57m 6556 S  5.8  0.2   0:47.04 php-fpm                                                  
 7304  martind     20   0  494m  59m 5264 S  5.8  0.2   0:48.70 php-fpm                                                  
 7323  martind     20   0  511m  67m 7772 S  5.8  0.2   0:45.53 php-fpm                                                  
24515 nginx     20   0  123m  66m 2452 S  5.8  0.2   7231:17 nginx                                                    
 6039  martind     20   0  507m  63m 8200 S  3.8  0.2   2:48.39 php-fpm                                                  
 6400  martind     20   0  511m  68m 8204 S  3.8  0.2   2:13.54 php-fpm                                                  
 6401  martind     20   0  510m  66m 9052 S  3.8  0.2   2:13.36 php-fpm                                                  
 6404  martind     20   0  512m  68m 9048 S  3.8  0.2   2:12.75 php-fpm 

Так что, поскольку есть так много SQL-запросов, когда он имеет тенденцию сильно замедляться, я думаю, что это вызвано высоким трафиком. Я проверил cronjobs (wordpress cronjobs и php cronjobs), и, похоже, ничего не запускается, когда он замедляется, может быть, есть процесс rsync, работающий в то же время, но процесс rsync работает все время, поэтому я сомневаюсь, что это вызвано этим. Есть что-то, что я могу проверить?

решение1

Анализ ГЛОБАЛЬНОГО СТАТУСА и ПЕРЕМЕННЫХ:

Наблюдения:

  • Версия: 10.4.12-MariaDB
  • 32 ГБ оперативной памяти
  • Время работы = 19д 23:11:43
  • Похоже, вы используете и MyISAM, и InnoDB.
  • 240 QPS

Более важные вопросы:

Измените long_query_timeна 1, чтобы вы могли поймать больше запросов в slowlog. (У вас сейчас 10 секунд; это, вероятно, объясняет, почему вы нашли только 4 запроса.) Есть несколько признаков того, что некоторые запросы работают неэффективно. Вот способ найти такие запросы: http://mysql.rjweb.org/doc.php/mysql_analysis#slow_queries_and_slowlog

Почему вы используете MyISAM? Значения сбивают с толку — как будто вы [пере]строили индекс для большой таблицы MyISAM, но ничего больше не сделали. В большинстве случаев лучше использовать InnoDB.

innodb_buffer_pool_sizeвероятно, можно увеличить для повышения скорости запросов InnoDB.

Будьте осторожны general_log— диск заполняется довольно быстро.

«Кэш запросов» работает неэффективно. Рекомендую полностью его отключить: query_cache_type=offи query_cache_size=0.

Max_used_connectionsдостиг 152, что указывает на то, что одновременно подключено много пользователей. (Это не означает, что одновременно выполнялось 152 запроса.)

Подробности и другие наблюдения:

Преобразование из MyISAM в InnoDB ( Key_blocks_used * 1024 / key_buffer_size ) = 460 * 1024 / 128M = 0.35%-- Процент использования key_buffer. Верхний предел. -- Уменьшите key_buffer_size (теперь 134217728), чтобы избежать ненужного использования памяти.

( (key_buffer_size / 0.20 + innodb_buffer_pool_size / 0.70) ) = ((128M / 0.20 + 8192M / 0.70)) / 32768M = 37.7%-- Большую часть доступной оперативной памяти следует выделить для кэширования. --http://mysql.rjweb.org/doc.php/memory

( general_log ) = general_log = ON-- Журнал (ФАЙЛ или ТАБЛИЦА) всех выполненных запросов. -- Отключайте general_log (сейчас ВКЛ), когда он не используется. Этот журнал может очень быстро заполнить диск.

( innodb_buffer_pool_size ) = 8,192 / 32768M = 25.0%-- % оперативной памяти, используемой для InnoDB buffer_pool -- Установите значение около 70% от доступной оперативной памяти. (Слишком низкое значение менее эффективно; слишком высокое значение приводит к риску подкачки.)

( (key_buffer_size / 0.20 + innodb_buffer_pool_size / 0.70) ) = ((128M / 0.20 + 8192M / 0.70)) / 32768M = 37.7%-- (метрика для оценки использования оперативной памяти)

( innodb_lru_scan_depth * innodb_page_cleaners ) = 1,024 * 4 = 4,096-- Объем работы для очистки страниц каждую секунду. -- "InnoDB: page_cleaner: 1000ms expected loop took ..." можно исправить, уменьшив lru_scan_depth: рассмотрите 1000 / innodb_page_cleaners (теперь 4). Также проверьте подкачку.

( innodb_lru_scan_depth ) = 1,024 -- "InnoDB: page_cleaner: предполагаемый цикл занял 1000 мс ..." можно исправить, уменьшив lru_scan_depth

( innodb_io_capacity ) = 200-- При промывке используйте указанное количество IOP. -- Чтение может быть медленным или резким.

( Innodb_log_writes ) = 43,856,157 / 1725103 = 25 /sec

( Innodb_os_log_written / (Uptime / 3600) / innodb_log_files_in_group / innodb_log_file_size ) = 137,804,939,264 / (1725103 / 3600) / 2 / 48M = 2.86-- Соотношение -- (см. протокол)

( Uptime / 60 * innodb_log_file_size / Innodb_os_log_written ) = 1,725,103 / 60 * 48M / 137804939264 = 10.5-- Минуты между ротациями журнала InnoDB Начиная с версии 5.6.8, это можно изменять динамически; не забудьте также изменить my.cnf. -- (Рекомендация 60 минут между ротациями несколько произвольна.) Отрегулируйте innodb_log_file_size (теперь 50331648). (Нельзя изменить в AWS.)

( innodb_flush_method ) = innodb_flush_method = fsync-- Как InnoDB должна просить ОС записывать блоки. Предложите O_DIRECT или O_ALL_DIRECT (Percona), чтобы избежать двойной буферизации. (По крайней мере для Unix.) См. chrischandler для предостережений относительно O_ALL_DIRECT

( default_tmp_storage_engine ) = default_tmp_storage_engine =

( innodb_flush_neighbors ) = 1-- Небольшая оптимизация при записи блоков на диск. -- Используйте 0 для SSD-накопителей; 1 для HDD.

( innodb_io_capacity ) = 200-- Возможное количество операций ввода-вывода в секунду на диске: 100 для медленных дисков; 200 для вращающихся дисков; 1000-2000 для твердотельных накопителей; умножить на коэффициент RAID.

( innodb_adaptive_hash_index ) = innodb_adaptive_hash_index = ON-- Обычно должно быть ВКЛ. -- В некоторых случаях лучше ВЫКЛ. См. также innodb_adaptive_hash_index_partitions (теперь 8) (после 5.7.9) и innodb_adaptive_hash_index_partitions (MariaDB и Percona). ВКЛ было связано с редкими сбоями (ошибка 73890). В версии 10.5.0 было принято решение по умолчанию ВЫКЛ.

( innodb_print_all_deadlocks ) = innodb_print_all_deadlocks = OFF-- Регистрировать ли все взаимоблокировки. -- Если вас мучают взаимоблокировки, включите это. Внимание: если у вас много взаимоблокировок, это может привести к записи большого объема данных на диск.

( character_set_server ) = character_set_server = latin1 -- Проблемы с набором символов можно решить, установив character_set_server (теперь latin1) на utf8mb4. Это будущее значение по умолчанию.

( local_infile ) = local_infile = ON -- local_infile (теперь ВКЛ) = ВКЛ — потенциальная проблема безопасности

( Key_blocks_used * 1024 / key_buffer_size ) = 460 * 1024 / 128M = 0.35%-- Процент использования key_buffer. Верхний предел. -- Уменьшите key_buffer_size (теперь 134217728), чтобы избежать ненужного использования памяти.

( Key_writes / Key_write_requests ) = 19,978,377 / 40284646 = 49.6%-- эффективность key_buffer для записи -- Если у вас достаточно оперативной памяти, имеет смысл увеличить key_buffer_size (сейчас 134217728).

( query_cache_size ) = 524,288 = 0.5MB-- Размер QC -- Слишком маленький = не очень полезен. Слишком большой = слишком много накладных расходов. Рекомендуется 0 или не более 50M.

( Qcache_lowmem_prunes ) = 125,234,412 / 1725103 = 73 /sec-- Недостаточно места в QC -- увеличьте query_cache_size (теперь 524288)

( Qcache_lowmem_prunes/Qcache_inserts ) = 125,234,412/146211296 = 85.7%-- Коэффициент удаления (частота необходимости удаления из-за нехватки памяти)

( Qcache_not_cached ) = 78,413,835 / 1725103 = 45 /sec-- SQL_CACHE предпринята, но проигнорирована -- Переосмыслить кэширование; настроить qcache

( Qcache_hits / Qcache_inserts ) = 37,201,050 / 146211296 = 0.254-- Соотношение попаданий и вставок — высокое — хорошо. Рассмотрите возможность отключения кэширования запросов.

( Qcache_hits / (Qcache_hits + Com_select) ) = 37,201,050 / (37201050 + 282029692) = 11.7%-- Коэффициент попаданий -- SELECT, которые использовали QC -- Рассмотрите возможность отключения кэширования запросов.

( Qcache_hits / (Qcache_hits + Qcache_inserts + Qcache_not_cached) ) = 37,201,050 / (37201050 + 146211296 + 78413835) = 14.2%-- Частота попаданий в кэш запросов -- Вероятно, лучше отключить QC.

( (query_cache_size - Qcache_free_memory) / Qcache_queries_in_cache / query_alloc_block_size ) = (524288 - 78344) / 82 / 16384 = 0.332-- query_alloc_block_size и формула -- Скорректируйте query_alloc_block_size (теперь 16384)

( Created_tmp_tables ) = 96,501,765 / 1725103 = 56 /sec-- Частота создания «временных» таблиц как части сложных SELECT-ов.

( Created_tmp_disk_tables ) = 23,539,653 / 1725103 = 14 /sec-- Частота созданиядиск"temp" таблицы как часть сложных SELECT-ов -- увеличьте tmp_table_size (теперь 16777216) и max_heap_table_size (теперь 16777216). Проверьте правила для временных таблиц, когда MEMORY используется вместо MyISAM. Возможно, незначительные изменения схемы или запроса позволят избежать MyISAM. Более эффективные индексы и переформулирование запросов, скорее всего, помогут.

( Created_tmp_disk_tables / Questions ) = 23,539,653 / 414140316 = 5.7%-- Процент запросов, которым требовалась таблица tmp на диске. -- Лучшие индексы / Никаких блобов / и т. д.

( Select_full_join / Com_select ) = 30,333,225 / 282029692 = 10.8%-- % выборок, которые являются безиндексными соединениями -- Добавить подходящий(ие) индекс(ы) к таблицам, используемым в соединениях.

( Com_insert + Com_delete + Com_delete_multi + Com_replace + Com_update + Com_update_multi ) = (87669877 + 27242 + 0 + 0 + 1452911 + 0) / 1725103 = 52 /sec-- записывает/сек -- 50 записей/сек + сбросы журнала, вероятно, максимизируют емкость ввода-вывода записи HDD-дисков. Если у вас SSD, то эта метрика, вероятно, подойдет.

( binlog_format ) = binlog_format = MIXED-- ЗАЯВЛЕНИЕ/СТРОКА/СМЕШАННАЯ. -- СТРОКА предпочитается 5.7 (10.3)

( long_query_time ) = 10-- Отсечка (секунды) для определения «медленного» запроса. -- Предложить 2

( Max_used_connections / max_connections ) = 152 / 151 = 100.7%-- Пиковый % подключений -- увеличьте max_connections (теперь 151) и/или уменьшите wait_timeout (теперь 28800). Или ускорьте запросы.

( Connections ) = 11,987,448 / 1725103 = 6.9 /sec-- Подключения -- Увеличить wait_timeout (теперь 28800); использовать пул?

( Connection_errors_accept + Connection_errors_internal + Connection_errors_peer_address + Connection_errors_select + Connection_errors_tcpwrap ) = 0 + 26 + 0 + 0 + 0 = 26-- Ошибки подключения, отличные от max_connections. -- Для получения дополнительной информации см. ПОКАЗ ГЛОБАЛЬНОГО СОСТОЯНИЯ, КАК 'Connection_errors%'

Аномально маленький:

Created_tmp_files = 0.094 /HR
innodb_spin_wait_delay = 4

Аномально большой:

Aria_pagecache_writes = 34 /sec
Aria_transaction_log_syncs = 25,641
Com_show_warnings = 40 /HR
Connection_errors_internal = 0.054 /HR
Handler_read_key = 85109 /sec
Handler_tmp_update = 839 /sec
Innodb_buffer_pool_read_requests = 675158 /sec
Innodb_buffer_pool_read_requests / (Innodb_buffer_pool_read_requests + Innodb_buffer_pool_reads ) = 100.0%
Innodb_rows_updated = 356 /sec
performance_schema_max_cond_classes = 90

Ненормальные строки:

Innodb_have_punch_hole = OFF
aria_recover_options = BACKUP,QUICK
disconnect_on_expired_password = OFF
ft_boolean_syntax = + -><()~*:
innodb_fast_shutdown = 1
log_output = TABLE
myisam_stats_method = NULLS_UNEQUAL
old_alter_table = DEFAULT
optimizer_trace = enabled=off

Связанный контент