web-dev-qa-db-ja.com

cassandra nodetoolドレインが数日間実行されている

修復の実行中のタイムアウトまたは大規模な削除に関して、クラスターのパフォーマンスに問題があります。私が受けたアドバイスの1つは、casssandraバージョンを2.0.17から2.2に更新することでした。アップグレードを開始するためにノードの1つをドレインしていますが、ドレインは2日間実行されています。ログには、次のようなログのみが表示されることがあります。

INFO [ScheduledTasks:1] 2016-04-06 08:17:10,987 ColumnFamilyStore.Java (line 808) Enqueuing flush of Memtable-sstable_activity@1382334976(15653/226669 serialized/live bytes, 6023 ops)
 INFO [FlushWriter:1468] 2016-04-06 08:17:10,988 Memtable.Java (line 362) Writing Memtable-sstable_activity@1382334976(15653/226669 serialized/live bytes, 6023 ops)
 INFO [ScheduledTasks:1] 2016-04-06 08:17:11,004 ColumnFamilyStore.Java (line 808) Enqueuing flush of Memtable-compaction_history@1425848386(1599/15990 serialized/live bytes, 51 ops)
 INFO [FlushWriter:1468] 2016-04-06 08:17:11,012 Memtable.Java (line 402) Completed flushing /var/lib/cassandra/data/system/sstable_activity/system-sstable_activity-jb-4826-Data.db (6348 bytes) for commitlog position ReplayPosition(segmentId=1458540068021, position=1198022)
 INFO [FlushWriter:1468] 2016-04-06 08:17:11,012 Memtable.Java (line 362) Writing Memtable-compaction_history@1425848386(1599/15990 serialized/live bytes, 51 ops)
 INFO [FlushWriter:1468] 2016-04-06 08:17:11,039 Memtable.Java (line 402) Completed flushing /var/lib/cassandra/data/system/compaction_history/system-compaction_history-jb-3491-Data.db (730 bytes) for commitlog position ReplayPosition(segmentId=1458540068021, position=1202850)

待つか、ノードを停止して移行を開始する必要がありますか?

1
ftrujillo

問題は、2.1より前のバージョンのバグに関連しています( https://issues.Apache.org/jira/browse/CASSANDRA-5911 )。フラッシュ後、コミットログは削除されません。

2
ftrujillo

他に実行中のnodetoolプロセスがあるかどうかを確認します。スナップショットプロセスがバックアップされているときに、ドレインがハングしました。それらをすべて停止し、Cassandraを再起動して、正常であることを確認してから、ドレインが機能しました。

0
Dave