Galera が設定されたサーバーが 1 台、mariadb が設定されたサーバーが 4 台、haproxy が設定されたサーバーが 1 台あります。
しかし、どのサーバーでも更新を実行しようとすると、「デッドロック: wsrep がトランザクションを中止しました」または「wsrep_max_ws_rows を超えました」というエラーが発生します (時々)。
サーバーは 32 GB のメモリと 24 個の CPU (VmWare) を備えた強力なものです。
gard.conf (ip 1.1.1.110):
GALERA_NODES="1.1.1.111:4567 1.1.1.112:4567 1.1.1.113:4567 1.1.1.114:4567"
GALERA_GROUP="mariadb_cluster"
GALERA_OPTIONS="pc.wait_prim=no"
LOG_FILE="/var/log/garbd.log"
cluster.cnf (4 台のサーバー mariadb ip 1.1.1.111 ~ 1.1.1.114):
[mysqld]
query_cache_size=0
binlog_format=ROW
default-storage-engine=innodb
innodb_autoinc_lock_mode=2
query_cache_type=0
bind-address=0.0.0.0
innodb_file_per_table
collation-server = utf8_general_ci
init-connect = 'SET NAMES utf8'
character-set-server = utf8
join_buffer_size = 1M
wsrep_on=ON
wsrep_provider=/usr/lib/galera/libgalera_smm.so
wsrep_cluster_name="mariadb_cluster"
wsrep_cluster_address="gcomm://1.1.1.111,1.1.1.112,1.1.1.113,1.1.1.114"
wsrep_sst_method=rsync
wsrep_node_address="1.1.1.111"
wsrep_node_name="mysqlcl0X"
wsrep_max_ws_rows=2048
wsrep_max_ws_size=8G
wsrep_provider_options = "gcs.fc_limit = 2048; gcs.fc_factor = 0.99; gcs.fc_master_slave = yes"
アップデート時のエラーは各サーバーのクライアント上で直接行われるため、エラーは haproxy ではなく、念のため設定を入れただけです。
haproxy.cfg:
listen galera
bind *:3306
mode tcp
timeout client 60000ms
timeout server 60000ms
balance leastconn
server 1.1.1.111 1.1.1.111:3306 check
server 1.1.1.112 1.1.1.112:3306 check
server 1.1.1.113 1.1.1.113:3306 check
server 1.1.1.114 1.1.1.114:3306 check
設定で何が欠けているのでしょうか?
すでにありがとうございます!
答え1
https://mariadb.com/kb/en/galera-cluster-system-variables/#wsrep_max_ws_rows
おそらく=0
問題の少なくとも一部は解決するでしょう。
問題が本当にトランザクション内の行が「多すぎる」ことである場合は、トランザクションについて話し合い、より効率的な方法を探しましょう。
答え2
私はこのオプションで解決しました:
wsrep-retry-autocommit = 100
これは正しいやり方ではないと思います。実行には時間がかかりますが、機能します。
失敗し続けます。
1213 Deadlock: wsrep aborted transaction