web-dev-qa-db-ja.com

MySQL:InnoDBがクラッシュし続けます-どのように回復しますか?

# free -m
             total       used       free     shared    buffers     cached
Mem:         48289      35288      13000          0        347      30399
-/+ buffers/cache:       4541      43747
Swap:         8189         51       8137

MySQLは/var/log/mysqld.logの以下のエラーで開始できません: http://fpaste.org/4VMB/

innodb_force_recovery = 1my.cnfに追加するときにのみ開始できますが、サーバーの起動時に別のエラーが発生します。 http://fpaste.org/6azJ/

このサーバーは以前はマスターでしたが、スレーブを新しいマスターに昇格させることができました。現在、この障害が発生したマスターを新しいスレーブとして設定しようとしていますが、開始できません。

私は今どうすればいい?


UPDATE Thu Jul 19 23:50:17 ICT 2012:

innodb_force_recovery=2で正常に開始されましたが、MySQLはDROP TABLEを実行すると消えます:

mysql> drop table reportingdb.bigdata_banner_scheduler;
ERROR 2013 (HY000): Lost connection to MySQL server during query

これがログです: http://fpaste.org/M82a


UPDATE Fri Jul 20 08:02:57 ICT 2012:

Percona Xtrabackup を使用してレプリケーションを再構築しようとしています。初めて、innobackupexでコピーすると this バグが発生します。 innodb_log_file_sizeを1GBに増やすことを提案する@DTestに感謝します。問題はありません。

以下のエラーが発生したくない場合は、innodb_*設定をマスターからスレーブにコピーし、スレーブでinnobackupex --apply-log /path/to/datadirを実行する必要があります。

120720  6:18:50  InnoDB: Error: page 3670052 log sequence number 8078993744933
InnoDB: is in the future! Current system log sequence number 8078561559052.
InnoDB: Your database may be corrupt or you may have copied the InnoDB
InnoDB: tablespace but not the InnoDB log files. See
InnoDB: http://dev.mysql.com/doc/refman/5.5/en/forcing-innodb-recovery.html
InnoDB: for more information.
InnoDB: Error: trying to access page number 2175909760 in space 0,
InnoDB: space name ./ibdata1,
InnoDB: which is outside the tablespace bounds.
InnoDB: Byte offset 0, len 16384, i/o type 10.
InnoDB: If you get this error at mysqld startup, please check that
InnoDB: your my.cnf matches the ibdata files that you have in the
InnoDB: MySQL server.
120720  6:18:50  InnoDB: Assertion failure in thread 47633462918272 in file fil0fil.c line 4434
InnoDB: We intentionally generate a memory trap.
InnoDB: Submit a detailed bug report to http://bugs.mysql.com.
InnoDB: If you get repeated assertion failures or crashes, even
InnoDB: immediately after the mysqld startup, there may be
InnoDB: corruption in the InnoDB tablespace. Please refer to
InnoDB: http://dev.mysql.com/doc/refman/5.5/en/forcing-innodb-recovery.html
InnoDB: about forcing recovery.
23:18:50 UTC - mysqld got signal 6 ;
This could be because you hit a bug. It is also possible that this binary
or one of the libraries it was linked against is corrupt, improperly built,
or misconfigured. This error can also be caused by malfunctioning hardware.
We will try our best to scrape up some info that will hopefully help
diagnose the problem, but since we have already crashed, 
something is definitely wrong and this may fail.

しかし、ゲームは終了していません:スレーブは数分後にクラッシュし続けます:

120720  7:58:28 [Warning] Slave SQL: Could not execute Write_rows event on table reportingdb.ox_banners; Duplicate entry '14
5928' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log mysql-bin.000999, end
_log_pos 337836040, Error_code: 1062
120720  7:58:28 [Warning] Slave SQL: Could not execute Write_rows event on table reportingdb.selfserving_img_signatures; Dup
licate entry '145928' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log mysql
-bin.000999, end_log_pos 337843612, Error_code: 1062
120720  7:58:28 [Warning] Slave SQL: Could not execute Write_rows event on table reportingdb.selfserving_email_log; Duplicat
e entry '173213' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log mysql-bin.
000999, end_log_pos 337844062, Error_code: 1062
00:58:29 UTC - mysqld got signal 11 ;
This could be because you hit a bug. It is also possible that this binary
or one of the libraries it was linked against is corrupt, improperly built,
or misconfigured. This error can also be caused by malfunctioning hardware.
We will try our best to scrape up some info that will hopefully help
diagnose the problem, but since we have already crashed, 
something is definitely wrong and this may fail.

key_buffer_size=1048576
read_buffer_size=1048576
max_used_connections=4
max_threads=2000
thread_count=2
connection_count=2
It is possible that mysqld could use up to 
key_buffer_size + (read_buffer_size + sort_buffer_size)*max_threads = 4119820 K  bytes of memory
Hope that's ok; if not, decrease some variables in the equation.

Thread pointer: 0x11cc5f20
Attempting backtrace. You can use the following information to find out
where mysqld died. If you see no messages after this, something went
terribly wrong...
stack_bottom = 40c73a78 thread_stack 0x40000
/usr/libexec/mysqld(my_print_stacktrace+0x2e)[0x7af52e]
/usr/libexec/mysqld(handle_fatal_signal+0x3e2)[0x67c242]
/lib64/libpthread.so.0[0x3fed00ebe0]
/usr/libexec/mysqld(_ZN13st_select_Lex17mark_as_dependentEPS_+0x4d)[0x568a3d]
/usr/libexec/mysqld[0x68cc02]
/usr/libexec/mysqld(_ZN10Item_field15fix_outer_fieldEP3THDPP5FieldPP4Item+0x670)[0x690c90]
/usr/libexec/mysqld(_ZN10Item_field10fix_fieldsEP3THDPP4Item+0x351)[0x691361]
/usr/libexec/mysqld(_ZN9Item_func10fix_fieldsEP3THDPP4Item+0x1d3)[0x6cb433]
/usr/libexec/mysqld(_Z11setup_condsP3THDP10TABLE_LISTS2_PP4Item+0x1a5)[0x53aae5]
/usr/libexec/mysqld(_Z20mysql_prepare_updateP3THDP10TABLE_LISTPP4ItemjP8st_order+0x118)[0x5df3e8]
/usr/libexec/mysqld(_Z12mysql_updateP3THDP10TABLE_LISTR4ListI4ItemES6_PS4_jP8st_ordery15enum_duplicatesbPySB_+0x2b4)[0x5e0134]
/usr/libexec/mysqld(_Z21mysql_execute_commandP3THD+0x239b)[0x575c5b]
/usr/libexec/mysqld(_Z11mysql_parseP3THDPcjP12Parser_state+0x10a)[0x57994a]
/usr/libexec/mysqld(_ZN15Query_log_event14do_apply_eventEPK14Relay_log_infoPKcj+0xc57)[0x734757]
/usr/libexec/mysqld(_Z26apply_event_and_update_posP9Log_eventP3THDP14Relay_log_info+0x16e)[0x516fce]
/usr/libexec/mysqld[0x51e631]
/usr/libexec/mysqld(handle_slave_sql+0xc46)[0x51f946]
/lib64/libpthread.so.0[0x3fed00677d]
/lib64/libc.so.6(clone+0x6d)[0x3fec8d325d]

Trying to get some variables.
Some pointers may be invalid and cause the dump to abort.
Query (128380d7): UPDATE `ox_banners` A
        SET A.locationAd=@locCP 
        WHERE A.zoneId = NAME_CONST('_zoneid',2452)
Connection ID (thread ID): 2061
Status: NOT_KILLED

slave-skip-errors = 1062が機能していないようです。

mysqldumpを使用してマスターのスナップショットを撮ります。クラッシュの問題を解決できることを願っています。

3
quanta

チャットディスカッションの最初のエラーは、ファイル./reportingdb/bigdata_banner_scheduler.ibdがないためです。ただし、マスターからこのファイルをコピーするだけでは機能しません。テーブルをスレーブにドロップしてから、マスターからテーブルをダンプする必要があります。

しかし、そのアサートエラーは別の問題です。 force_recoveryモード1から開始できますが、何かがmysqldプロセスを強制終了しており、メモリではないように見えます(設定ミス)。

これを最近昇格したマスターのスレーブとして設定しようとしているので、実際にデータを消去し、MySQLを再インストールして、マスターの新しいコピーから開始します。

何らかの理由で、マスター全体をダンプせずにそれを機能させたい場合(推奨しません)、私の手順は次のようになります。

  • My.cnfにskip-slave-startを入れて、スレーブが自動的に起動しないようにします
  • My.cnfからinnodb-force-recoveryを取り出します
  • すべてのファイルをdatadirからスレーブサーバー上の別の場所にコピーします
  • Mysqlを再インストールします(この手順はOSによって異なります)
  • mysqlおよびperformance_schemaディレクトリを古いインストールからコピーして、新しくインストールしたdatadirに戻します。
  • Mysqlサーバーを起動して、サーバーが問題なく正常に起動することを確認します。
  • その場合は、サーバーを再度停止して、これらの手順を続行します
  • My.cnfでinnodb-force-recoveryを1に設定します
  • 他のすべてのファイルをバックアップからdatadirにコピーして戻します。
  • サーバーを起動します。これにより、不足している./reportingdb/bigdata_banner_scheduler.ibdテーブルをDROPできる状態になります。
  • DROP TABLE reportingdb.bigdata_banner_scheduler
  • サーバーを停止します
  • My.cnfからinnodb-force-recoveryを削除します
  • サーバーを起動します。

この時点で、すべてが順調であれば、reportingdb.bigdata_banner_schedulerテーブルのない「スレーブ」サーバーが稼働しているはずです。スレーブはまだ無効になっているはずです(マスターのバイナリログからの読み取りではありません)。

テーブルをスレーブに戻すために私が行う手順は次のとおりです。

  • マスターから、テーブル構造とデータのダンプを取得します:mysqldump -u.. -p reportingdb bigdata_banner_scheduler > reportingBigData.sql
  • ダンプをスレーブにコピーする
  • ダンプをスレーブにインポートします:mysql -u... -p reportingdb < reportingBigData.sql
  • 次に、スレーブを開始して、不足しているbinlogイベントに追いつくようにします。
5
Derek Downey