web-dev-qa-db-ja.com

RackspaceLinuxサーバーのクラッシュ

私は最近、個人的な使用のためにベアメタルサーバーからクラウドに移行しましたが、これ以上幸せなことはありませんでした。 1つを除いて:私のサーバーは週に1回程度クラッシュします

Rackspaceは本当に素晴らしく、非常に役に立ちました。私は彼らと一緒にいて、他の人に勧めたいと思っています。しかし、この問題で、サーバーのメモリが不足していると言われました。サーバーを調べる必要があります。私はそれで問題なく、これは私の問題のように思えますが、Linuxマシンがメモリ不足でクラッシュするという話は聞いたことがありません。私の経験では、最悪のシナリオでは、実行が非常に遅くなるか、カーネルがプロセスを強制終了し始めます。

いくつかの詳細:

  • Gentoo Linuxの実行(最新)
  • 512MB RAM、1Gスワップ
  • インストールおよび実行中のサービス:
    • 2つのApache2 proc(1つは最小、静的/キャッシュリソースの提供とプロキシ用、2つ目はcgi、mod_Perl、mod_jk)
    • 2つのTomcatインスタンス(1つには私が作成した2つのアプリがあり、もう1つはNexus専用です)
    • Mysql
  • クラッシュが発生したとき:
    • サーバーにpingを実行できます
    • ssh接続が無期限にハングする
    • コンソールはユーザー名を許可しますが、パスワードプロンプトは表示されません。 60秒後にタイムアウトになり、別のログインプロンプトが表示されます。繰り返す。
    • サービス(http、Tomcat、mysql)に接続できません。接続がハングし、404、サーバーが見つからないなどのレポートが表示されません。
    • ソフトブートは機能しません。ハードブートは頻繁に複数回実行する必要があります(再起動の試行の間に30分の待機がある場合でも)

私はこれと同じセットアップを何年にもわたってサーバーで実行してきましたが、RAMは256MBしかありません。ここでの唯一の違いは、私が仮想マシンを使用していることです。

私の質問は次の2つの形式のいずれかを取ることができます:Rackspaceクラウドまたは他のクラウドホストで同様の問題が発生した人はいますか?(もしそうなら、解決策は何でしたか?)または; 問題を追跡するための良い方法は何ですか?次のクラッシュ後に調べることができるように、毎分uptimefreeをファイルに出力するcronをセットアップしますしかし、それはハッキーのようです。

完全な開示:私は貿易によるソフトウェア開発者であるため、私の経験のほとんどはここにありますが、個人用と業務用の両方でデスクトップとサーバーにLinuxを使用した約15年の経験があります。

1
Josh Johnson

メモリ使用量を追跡するもう1つの優れた方法は、Linuxボックスにsarをインストールすることです。 Debianを使用している場合は、sysstatとしてリストできます。 sar -rを使用すると、メモリとネットワークの統計で何が起こっているかを把握できます。

2
Linztm