web-dev-qa-db-ja.com

MySQLレプリケーションバイナリリレーログの転送が遅すぎる

マスターサーバー

MySQL 5.6.28

Ubuntu 14.04

8コアCPU

スレーブサーバー

スレーブ:MySQL 5.7.22

Ubuntu 18.04

16コアCPU

どちらも64GBのRAM=と十分なディスク容量があります。

これまでにやったこと

マスターデータベースのダンプを作成し、それをスレーブサーバーにコピーして、そこにスレーブデータベースを設定しました。複製は機能しますが、遅すぎます。

スレーブは約開始しました。最初のダンプから2.5日後、追いつきません。リレーログファイルを見ると、ファイルの充填が遅すぎるようです(数秒ごとに約1MB)。これは100GB以上のデータベース上にあります。

私はもう試した

iotopを使用してディスクioを確認しました-マスターとスレーブの両方で問題ありません。 SSDではありませんが、ボトルネックにはならないようです。

bmonでネットワーク速度を確認しました-表面をかろうじて引っ掻いているだけです。どちらのマシンもギガビットネットワーク上にあります。 scpを実行してみました(レプリケーションが進行中)。最大100MB/sの転送を取得しています。リレーログは1MB/s未満で転送されているようです。

[〜#〜] cpu [〜#〜]を確認しました-どちらのサーバーにも余裕があります。

innodbの設定が両方のサーバーで同じであることを確認しました。すべてのテーブルはinnodbです。

SHOW SLAVE STATUS\Gを見ると、新しいリレーログが転送されるのを待つのにほとんどの時間が費やされていることがわかります。 SQL側に遅延はなく、常に追いついています。

binlog_formatROWであることを言及する価値があります。

tl; dr:

十分な帯域幅、CPU、およびディスクI/Oがまだ利用可能である場合、binlogがマスターからスレーブにリレーされる速度を制限しているのは何ですか?

編集1:

SHOW SLAVE STATUSの結果:

Slave_IO_State: Waiting for master to send event Master_Host: master.server Master_User: sqlslave Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.285479 Read_Master_Log_Pos: 87535361 Relay_Log_File: slave-relay-bin.001588 Relay_Log_Pos: 87535479 Relay_Master_Log_File: mysql-bin.285479 Slave_IO_Running: Yes Slave_SQL_Running: Yes Replicate_Do_DB: Replicate_Ignore_DB: Replicate_Do_Table: Replicate_Ignore_Table: Replicate_Wild_Do_Table: Replicate_Wild_Ignore_Table: Last_Errno: 0 Last_Error: Skip_Counter: 0 Exec_Master_Log_Pos: 87535282 Relay_Log_Space: 87535812 Until_Condition: None Until_Log_File: Until_Log_Pos: 0 Master_SSL_Allowed: No Master_SSL_CA_File: Master_SSL_CA_Path: Master_SSL_Cert: Master_SSL_Cipher: Master_SSL_Key: Seconds_Behind_Master: 0 Master_SSL_Verify_Server_Cert: No Last_IO_Errno: 0 Last_IO_Error: Last_SQL_Errno: 0 Last_SQL_Error: Replicate_Ignore_Server_Ids: Master_Server_Id: 41260 Master_UUID: 2b9b59f9-4290-11e5-bf92-0cc47a02cb8e Master_Info_File: /var/lib/mysql/master.info SQL_Delay: 0 SQL_Remaining_Delay: NULL Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates Master_Retry_Count: 86400 Master_Bind: Last_IO_Error_Timestamp: Last_SQL_Error_Timestamp: Master_SSL_Crl: Master_SSL_Crlpath: Retrieved_Gtid_Set: Executed_Gtid_Set: Auto_Position: 0 Replicate_Rewrite_DB: Channel_Name: Master_TLS_Version:

編集2:

ディスクまたはネットワークの組み合わせに傾いているので、iostatiotopを実行しています。マスターでバイナリログが書き込まれるディスクは、常に100%近くの使用率ですが、「待機」は約10msです。それでも、scpを実行すると高速に実行されるため、binlogの転送が約200倍遅くなる理由がわかりません。

スレーブ側にもエラーはありません。ログを監視しています。スレーブではバイナリログが無効になり、圧縮されたバイナリログが有効になります。

スレーブでのクエリは高速に実行されています。転送される新しいリレーログを待ち続けるだけです。

2
Nick Zinger

私の場合、制約はディスクI/Oでした。 binlogはハードディスクに書き込まれ、全体の動作が少し遅くなります。

最初にこれを確認できなかった理由は、MySQLプロセスの設定または「素晴らしさ」が原因で、MySQLがディスクI/Oを最大限に活用していないためです。

結局、スレーブが追いつくのに数日かかりましたが、今では大丈夫です。しかし、将来的には、より優れたソリューションとなる可能性があります。

  • BinlogsをSSDに書き込み、ディスクI/Oによる遅延を削減
  • sysvar_innodb_io_capacityなどのMySQLオプションを変更してみてください https://dev.mysql.com/doc/refman/5.5/en/innodb-parameters.html#sysvar_innodb_io_capacity
  • ハードディスクに書き込むが、RAIDセットアップにあるもの
  • MysqlプロセスのNice値を増やして、優先順位を付けます。
  • STATEMENTベースのbinlog形式に切り替えて、binlogのサイズを小さくします。

上記の1つまたは多くは、同様の問題の修正に役立つ可能性があります。

1
Nick Zinger