私のホスティングプロバイダーは、ネットワーク経由でファイルをプッシュするclBackup
というツールを使用してサーバーのバックアップを作成します。以下は、私たちが取得してプロバイダーに報告した1つのps
出力です。
top - 10:06:24 up 25 days, 3:47, 5 users, load average: 6.63, 4.79, 4.23
Tasks: 357 total, 1 running, 355 sleeping, 0 stopped, 1 zombie
Cpu(s): 25.0%us, 0.6%sy, 0.0%ni, 72.5%id, 1.2%wa, 0.5%hi, 0.1%si, 0.0%st
Mem: 49447692k total, 49314632k used, 133060k free, 79628k buffers
Swap: 2097144k total, 288k used, 2096856k free, 40614172k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
20621 root 16 0 455m 65m 34m S 612.7 0.1 144:53.17 clBackup
そのツールが原因で、これらのサーバーでホストされている本番Webサイトでパフォーマンスの問題が発生しています。人々が私たちのウェブサイトが遅いと不平を言ってチェックボックスをオンにするときはいつでも、そのプロセスを殺すときはいつでもウェブサイトが再びうまく機能しているのを見ることができるので、私たちはこれを確かに知っています。
どうやらclBackup
は、CPU(およびメモリ)を使い果たすのがいくらか得意です。これらの問題に遭遇したのは私たちだけではないようです( リンク1 、 リンク2 、 リンク )。
このパフォーマンスの問題は許容できないことをホスティングプロバイダーに理解させ、CPU使用率が高いのは正常ではない(600%以上)ことを指摘しようとしていますが、受け取ったアドバイスは、本当にバックアップする必要はありません。
私たちはこの応答にあまり満足していません(私たちは私たちが支払うサービスのバックアップツールを収容するためにリソースを費やしたくありません、バックアップツールはこの状況を処理するように設計されるべきだと信じています)そして助けを探していますServerFaultコミュニティからの独立した客観的な回答の形式であり、これがプロバイダーにそれについてより多くのことを行うよう説得するのに役立つことを願っています。
この質問をすべての人に役立つようにするために、経験豊富なシステム管理者が回答できることを願って、私たちの問題に関連するいくつかの一般的な質問を提起したいと思います。
Q1:あなた自身の経験から、500GB
が使用されている290GB
ファイルシステムをバックアップするのに許容できる時間はどれくらいですか?
Q2:あなた自身の経験から、この種のバックアップユーティリティの許容可能なCPU使用率はどれくらいですか?
Q3:clBackup
で同様の問題が発生し、プロセスの再調整やその他の緩和策が役に立ちましたか?
ええ、それはかなり貧弱です-バックアッププログラムはそれが仕事をするために6コアを食べてはいけません。私はプロバイダーに長く、大声で、そして難しいと不平を言います、そして彼らがそれを直さなければ吸わないプロバイダーのために去る準備ができています。
あなたの質問に答えるには:
ええ、私たち自身も同じ問題にぶつかっています。私たちが見つけた唯一の解決策は、ホストに一時的にオフにするように指示することです。その後、長い問題のスレッドを実行します。通常、ディレクトリを除外するように指示されますが、これは実際には解決策ではありません。
申し訳ありませんが、解決策はありません。あなたが一人ではないことをお知らせしたかっただけです。