web-dev-qa-db-ja.com

どこから始めればよいかわからない場合、どのようにトラブルシューティングを行いますか?

次の場合にトラブルシューティングを開始する方法に関するヒント、ヒント、および回答を探しています。

  1. 問題は断続的です
  2. 問題は文字通りどこにでもある可能性があります-オペレーティングシステム。フリーソースソフトウェア;私自身のソフトウェア開発。購入したソフトウェア。キーボードのパン粉;私が現在実行しているソフトウェアの特定の組み合わせ。マクスウェルの悪魔;実際に機械を動かしている小さな青い男たちがストライキをしました。等.
  3. 私は、問題の原因の潜在的な候補となるいくつかの分野についてのみ専門知識を持っています。

私が抱えている具体的な問題の詳細を例として以下に示しますが、現在の問題に対する答えを求めているのではなく、どこでどのようにそのような問題に取り組み始めるかを求めています。

現在、新しいマシンで問題が発生しています。場合によっては、マシンがフリーズしたばかりです。キーストローク、マウスクリック、または電源オン/オフスイッチ以外のものを受け入れません。いつも私はただウェブを閲覧しているだけです。いくつか(<= 6つの他のアプリケーション)を実行しました。これらのアプリケーションはどれも主要なものではありません。商用プログラムとオープンソースプログラムの組み合わせを表しており、通常はいくつかの種類のUnixから移行されます。

私のマシンはWindows7I7クアッドコアラップトップです。

編集:

実際の問題の説明は一例に過ぎないと述べましたが、一部のコメントはこの問題の解決に集中しています。残念ながら、それは単なる例であったため、提供された情報は正しいものの完全ではありません。人々が実際の問題を支援するためにリモートで試行に時間を浪費することを避けるために、私は自分のセットアップに関する他の情報を提供しています。私が最初に言ったように、私はこの特定の問題に対する答えを求めていません。

私のマシンは強力なラップトップです。私のメインマシンです。開発とテクニカルライティング、コミュニケーション(電子メール、Web、FTPなど)、および写真の編集とインデックス作成に使用されます。 CPUテスト、複数のメモリテスト、および他のすべてのコンポーネントのテストを含む、厳密で広範なハードウェアテストプログラムのスイートが、少なくとも月に1回実行されます。また、少なくとも毎月実行されるのは、完全なウイルススキャンです。完全なスパイウェアスキャン。ディスククリーンアップ。およびディスクの最適化。

ディスクには約3 * 10 ^ 6個のファイルが含まれています。ディスク使用量は300Gbで、150Gbは空いています。メモリは8Gbです。主要な開発ツールをすべて実行していると、マシンが少し暖かくなることがありますが、この問題が発生したのは、マシンを非常に軽く使用した場合のみです。Webブラウジング、Textpad、Graphviz、Firebirdデータベース、軽量データベースブラウザ(Flame Robin)です。 )。このような状況では、ファンでさえ少し暖かくはありません。問題が発生した期間中、ソフトウェア、オペレーティングシステム、またはハードウェアに変更を加えていません。 Microsoft、Adobe、Lenovoなど、多くの自動更新が行われていますが、これに限定されません。

この背景は、私がしたようにこの質問をする私の理由を文脈に入れます(私は願っています)。調査分野を狭めるための第一歩として、回答に記載されているさまざまなログの調査を開始します。そして、私はこれまでに受け取った回答で示唆されている特徴の1つである忍耐力を調査で試します。

39
Chris Walton

より良いアイデアを得る。

十分なフィールド情報がないと戦闘に勝つことはできません。

  1. 問題を詳細に説明して、問題が1回だけ発生することを誰が知っているかをよく理解できるようにします。

  2. あなたとあなたのコンピュータの両方で、問題の前に、そして問題とともに何が起こったのかを過去にさかのぼって追跡します。

  3. 考えられる原因を考えてください。それは明らかでないことがあるからです。

  4. 詳細情報を取得する何が起こっているのかわからないときはいつでも、これは イベント から SysInternals Tools 、to パフォーマンス分析 、to デバッグ 、to 専門知識のある他のツール

  5. あなたの仮定をテストして、あなたの考えが原因をフィルターで除去しないことを確認してください。

分割統治。

それが軍事的であるため 相手を倒す 数が多い場合でも。

考えられる原因を排除してください。そうしないと、問題の追跡に問題が発生します。このようにして、問題の根本原因にどんどん近づき、問題をはるかに簡単に解決できるようになります。

たとえば、ハードウェアを使用して、問題の修正に必要のないものをすべて切断して削除します。このようにして、問題の原因となっているコンポーネントを切断する可能性があります。そして、コンポーネントの半分を挿入し、それが再発するかどうかを確認し、不良コンポーネントが見つかるまで分割を繰り返します...

可能であれば、別のコンピューターで何かをテストすることも、問題を解決するための良い利点です。

たとえば、ソフトウェアでは、セーフモードで再起動し、スタートアップエントリを無効にすることも役立ちます。これは、設定の有効化/無効化、デフォルト構成の試行などにも当てはまります...

それをテストしてみましょう。

現在、新しいマシンで問題が発生しています。場合によっては、マシンがフリーズしたばかりです。キーストローク、マウスクリック、または電源オン/オフスイッチ以外のものを受け入れません。いつも私はただウェブを閲覧しているだけです。いくつか(<= 6つの他のアプリケーション)を実行しました。これらのアプリケーションはどれも主要なものではありません。商用プログラムとオープンソースプログラムの組み合わせを表しており、通常はいくつかの種類のUnixから移行されます。

  1. それ自体は適切な説明であり、一度だけ発生するわけではありませんどちらか。

  2. あなたは問題と一緒に何が起こったのか知っています、
    しかし問題が発生する前にあなたやあなたのコンピュータがしたことを考えていません

    これはわかりませんが、イベントログと最近変更されたファイル/フォルダからはわかります。

  3. 考えられる原因は、CPUに関連している可能性が最も高いです。これは、物事を処理するコンポーネントであるためです。

    より具体的には、これはプロセス、ドライバー、または障害のあるハードウェア(おそらく温度の問題?)である可能性があります。

  4. CPUだと知っていますが、何がわかりません。イベントにはこれが表示されません。ProcessExplorerは [〜#〜] dpc [〜#〜] でハングします。

    そこで、次のステップでは、ハングが発生した後に閉じるトレース分析を実行します。

    トレースを調べると、ドライバーXが問題を引き起こしていることがわかります

  5. 実際の仮定は行われません。 CPUの仮定は、分割統治法によって処理されます...

だから、これは私が問題を克服するために分割を開始するところです、私は解決したら停止します:

  1. 現在のバージョンのドライバーに問題がありますか?
    ドライバーを最新バージョンに更新します。

  2. 最新バージョンのドライバーに問題がありますか?
    新しいトレースを取得します。ドライバーを初期バージョンとは異なる古いバージョンに更新します。

  3. デバイスに問題がありますか?レジストリの構成に問題がありますか?
    新しいトレースを取得します。可能であれば、デバイスを再インストールまたは無効にします。

  4. 問題はランダムですが、プロセッサが過熱していますか?
    プロセッサの温度を確認し、必要に応じてファンを交換します。

  5. 問題はプロセッサではありません。他のハードウェアとソフトウェアの影響はありますか?
    ハードウェアを削除し、ソフトウェアの実行を無効にして、サードパーティの影響を特定します。

  6. 問題は取り外し可能な部品にないので、交換する必要があります。
    最悪の場合、他のすべてが失敗した場合は、交換する必要があります。

新しいトレースを取得してハードウェアを削除すると、より多くの情報が得られるため、次にどこを見ればよいかがわかります。

42
Tamara Wijsman

良いログと直感-本当に。

  • 1日目から、アプリとOSの更新、新規インストール、ハードウェアまたは接続の新規または削除、「問題を引き起こさなかった」雷雨など、システムに対して行うすべてのことを追跡します。
  • この問題に最初に気付いたとき:
    • 何してたの?
    • 最近、他に何が異常に起こったのですか?
    • 最近、何を変えましたか?
    • それ以降は、何をしているのかを常に把握しておくと、次に発生したときに、直前の処理をより適切に処理できます。
    • システムログのスナップショットを作成します。
  • あなたがそれを再現できるかどうか見てください。あなたがそれを再現することができるまで、あなたはそれを見つけることができません。
  • システムのパーティション分割を開始します。セーフモードとライブ実行、新しいアカウントと通常のアカウント、通常のアカウントとは異なるキーボードとマウス(特に、Bluetoothと有線)は、起動またはスリープ解除から数分以内に発生しますか。 1時間以上実行した後でのみ(サーマルを考えてください)。
6
JRobert

私は通常、イベントログとプログラムが独自に作成するログから始めます。プログラムは、プログラムフォルダにログを作成することがあります。

時間を特定できたら、ログでイベントを検索します。当然、Windowsログには、簡単に識別できる停止エラーが表示される場合があります。

すべてのドライバーをチェックし、それらが最新であることを確認します。

忍耐は大量に必要になります。

4
Dave M

すでに与えられたすべての良いアドバイスに加えて、ログファイルがあなたに多くを続けることを与えていないなら、マシンの適切なメモリテストはしばしば価値があります-欠陥のあるメモリはあらゆる種類の奇妙な断続的なフリーズとクラッシュを引き起こす可能性があります。組み込みのメモリテストは、メモリ数に非常に似ています非常に電源投入テストでメモリ障害が検出されることはまれです。

Google for Windowsのメモリ診断を行い、CDに書き込みます。それは古いですが、それはより良いメモリテストの1つであり、無料です。

2
Matt