あなたのJavaプログラムは100%のCPUを使用しています。50個のスレッドがあります。どのスレッドが有罪かを見つける必要があります。現在役立つツールは見つかりません。時間のかかるルーチン:
jstack <pid>
、ここでpidはJavaプロセスのプロセスIDです。それを見つける簡単な方法は、JDKに含まれる別のユーティリティ-jps
を実行することです。 jstackの出力をファイルにリダイレクトします。あるいは、EclipseのJavaプロセスに接続し、CPUを占有するスレッドにヒットするまでスレッドを1つずつ中断しようとすることができます。1CPUマシンでは、最初にJavaプロセスの優先順位を下げて移動できます。それでも、Eclipseはタイムアウトのために実行中のプロセスにアタッチできません。
Sunのvisualvm
ツールがこれを行うことを期待していました。
誰かがより良い方法を知っていますか?
ビジュアルVM用のホットスレッド検出プラグイン を見てみてください-ThreadMXBean APIを使用して複数のCPU消費サンプルを取得し、最もアクティブなスレッドを見つけます。これは Bruce Chapmanのコマンドラインに相当 に基づいていますが、これも役に立つかもしれません。
どのJavaスレッドが本番サーバーのCPUのほとんどを消費しているかを特定します。
重要なことを行うほとんどの(すべてではないにしても)本稼働システムは、1つ以上のJavaスレッドを使用します。 s)これが原因である/そうだと思います。私より賢い人がそれをどうやってできるかを教えてくれるまで。
テストアプリケーション
これをテストするには、テストアプリケーションが必要です。だから私はあなたに一つをあげます。 3つのクラスで構成されます。
HeavyThread
クラス(MD5ハッシュの計算)LightThread
クラス。StartThreads
クラスは、1 CPU集中型およびいくつかの軽いスレッドを開始します。これらのクラスのコードは次のとおりです。
import Java.security.MessageDigest;
import Java.security.NoSuchAlgorithmException;
import Java.util.UUID;
/**
* thread that does some heavy lifting
*
* @author srasul
*
*/
public class HeavyThread implements Runnable {
private long length;
public HeavyThread(long length) {
this.length = length;
new Thread(this).start();
}
@Override
public void run() {
while (true) {
String data = "";
// make some stuff up
for (int i = 0; i < length; i++) {
data += UUID.randomUUID().toString();
}
MessageDigest digest;
try {
digest = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
throw new RuntimeException(e);
}
// hash the data
digest.update(data.getBytes());
}
}
}
import Java.util.Random;
/**
* thread that does little work. just count & sleep
*
* @author srasul
*
*/
public class LightThread implements Runnable {
public LightThread() {
new Thread(this).start();
}
@Override
public void run() {
Long l = 0l;
while(true) {
l++;
try {
Thread.sleep(new Random().nextInt(10));
} catch (InterruptedException e) {
e.printStackTrace();
}
if(l == Long.MAX_VALUE) {
l = 0l;
}
}
}
}
/**
* start it all
*
* @author srasul
*
*/
public class StartThreads {
public static void main(String[] args) {
// lets start 1 heavy ...
new HeavyThread(1000);
// ... and 3 light threads
new LightThread();
new LightThread();
new LightThread();
}
}
このコードを見たことがなく、これらのクラスを実行していてCPUを100%消費している暴走JavaプロセスのPIDを持っていると仮定します。
最初にStartThreads
クラスを開始しましょう。
$ ls
HeavyThread.Java LightThread.Java StartThreads.Java
$ javac *
$ Java StartThreads &
この段階でJavaプロセスが実行されていると100 cpuを占有するはずです。
上部でShift-Hを押すと、スレッドがオンになります。 topのmanページには次のように書かれています:
-H : Threads toggle
Starts top with the last remembered 'H' state reversed. When
this toggle is On, all individual threads will be displayed.
Otherwise, top displays a summation of all threads in a
process.
そして今、スレッド表示がオンになっている私のトップに私が見る:
そして、PID 28294
のJava
プロセスがあります。 jstack
を使用してこのプロセスのスタックダンプを取得します。
$ jstack 28924
2010-11-18 13:05:41
Full thread dump Java HotSpot(TM) 64-Bit Server VM (17.0-b16 mixed mode):
"Attach Listener" daemon prio=10 tid=0x0000000040ecb000 nid=0x7150 waiting on condition [0x0000000000000000]
Java.lang.Thread.State: RUNNABLE
"DestroyJavaVM" prio=10 tid=0x00007f9a98027800 nid=0x70fd waiting on condition [0x0000000000000000]
Java.lang.Thread.State: RUNNABLE
"Thread-3" prio=10 tid=0x00007f9a98025800 nid=0x710d waiting on condition [0x00007f9a9d543000]
Java.lang.Thread.State: TIMED_WAITING (sleeping)
at Java.lang.Thread.sleep(Native Method)
at LightThread.run(LightThread.Java:21)
at Java.lang.Thread.run(Thread.Java:619)
"Thread-2" prio=10 tid=0x00007f9a98023800 nid=0x710c waiting on condition [0x00007f9a9d644000]
Java.lang.Thread.State: TIMED_WAITING (sleeping)
at Java.lang.Thread.sleep(Native Method)
at LightThread.run(LightThread.Java:21)
at Java.lang.Thread.run(Thread.Java:619)
"Thread-1" prio=10 tid=0x00007f9a98021800 nid=0x710b waiting on condition [0x00007f9a9d745000]
Java.lang.Thread.State: TIMED_WAITING (sleeping)
at Java.lang.Thread.sleep(Native Method)
at LightThread.run(LightThread.Java:21)
at Java.lang.Thread.run(Thread.Java:619)
"Thread-0" prio=10 tid=0x00007f9a98020000 nid=0x710a runnable [0x00007f9a9d846000]
Java.lang.Thread.State: RUNNABLE
at Sun.security.provider.DigestBase.engineReset(DigestBase.Java:139)
at Sun.security.provider.DigestBase.engineUpdate(DigestBase.Java:104)
at Java.security.MessageDigest$Delegate.engineUpdate(MessageDigest.Java:538)
at Java.security.MessageDigest.update(MessageDigest.Java:293)
at Sun.security.provider.SecureRandom.engineNextBytes(SecureRandom.Java:197)
- locked <0x00007f9aa457e400> (a Sun.security.provider.SecureRandom)
at Sun.security.provider.NativePRNG$RandomIO.implNextBytes(NativePRNG.Java:257)
- locked <0x00007f9aa457e708> (a Java.lang.Object)
at Sun.security.provider.NativePRNG$RandomIO.access$200(NativePRNG.Java:108)
at Sun.security.provider.NativePRNG.engineNextBytes(NativePRNG.Java:97)
at Java.security.SecureRandom.nextBytes(SecureRandom.Java:433)
- locked <0x00007f9aa4582fc8> (a Java.security.SecureRandom)
at Java.util.UUID.randomUUID(UUID.Java:162)
at HeavyThread.run(HeavyThread.Java:27)
at Java.lang.Thread.run(Thread.Java:619)
"Low Memory Detector" daemon prio=10 tid=0x00007f9a98006800 nid=0x7108 runnable [0x0000000000000000]
Java.lang.Thread.State: RUNNABLE
"CompilerThread1" daemon prio=10 tid=0x00007f9a98004000 nid=0x7107 waiting on condition [0x0000000000000000]
Java.lang.Thread.State: RUNNABLE
"CompilerThread0" daemon prio=10 tid=0x00007f9a98001000 nid=0x7106 waiting on condition [0x0000000000000000]
Java.lang.Thread.State: RUNNABLE
"Signal Dispatcher" daemon prio=10 tid=0x0000000040de4000 nid=0x7105 runnable [0x0000000000000000]
Java.lang.Thread.State: RUNNABLE
"Finalizer" daemon prio=10 tid=0x0000000040dc4800 nid=0x7104 in Object.wait() [0x00007f9a97ffe000]
Java.lang.Thread.State: WAITING (on object monitor)
at Java.lang.Object.wait(Native Method)
- waiting on <0x00007f9aa45506b0> (a Java.lang.ref.ReferenceQueue$Lock)
at Java.lang.ref.ReferenceQueue.remove(ReferenceQueue.Java:118)
- locked <0x00007f9aa45506b0> (a Java.lang.ref.ReferenceQueue$Lock)
at Java.lang.ref.ReferenceQueue.remove(ReferenceQueue.Java:134)
at Java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.Java:159)
"Reference Handler" daemon prio=10 tid=0x0000000040dbd000 nid=0x7103 in Object.wait() [0x00007f9a9de92000]
Java.lang.Thread.State: WAITING (on object monitor)
at Java.lang.Object.wait(Native Method)
- waiting on <0x00007f9aa4550318> (a Java.lang.ref.Reference$Lock)
at Java.lang.Object.wait(Object.Java:485)
at Java.lang.ref.Reference$ReferenceHandler.run(Reference.Java:116)
- locked <0x00007f9aa4550318> (a Java.lang.ref.Reference$Lock)
"VM Thread" prio=10 tid=0x0000000040db8800 nid=0x7102 runnable
"GC task thread#0 (ParallelGC)" prio=10 tid=0x0000000040d6e800 nid=0x70fe runnable
"GC task thread#1 (ParallelGC)" prio=10 tid=0x0000000040d70800 nid=0x70ff runnable
"GC task thread#2 (ParallelGC)" prio=10 tid=0x0000000040d72000 nid=0x7100 runnable
"GC task thread#3 (ParallelGC)" prio=10 tid=0x0000000040d74000 nid=0x7101 runnable
"VM Periodic Task Thread" prio=10 tid=0x00007f9a98011800 nid=0x7109 waiting on condition
JNI global references: 910
一番上から、一番上のスレッドのPIDが28938
であることがわかります。 16進数の28938
は0x710A
です。スタックダンプでは、各スレッドに16進数で表示されるnid
があることに注意してください。そして、0x710A
がスレッドのIDであることがまさに起こります:
"Thread-0" prio=10 tid=0x00007f9a98020000 nid=0x710a runnable [0x00007f9a9d846000]
Java.lang.Thread.State: RUNNABLE
at Sun.security.provider.DigestBase.engineReset(DigestBase.Java:139)
at Sun.security.provider.DigestBase.engineUpdate(DigestBase.Java:104)
at Java.security.MessageDigest$Delegate.engineUpdate(MessageDigest.Java:538)
at Java.security.MessageDigest.update(MessageDigest.Java:293)
at Sun.security.provider.SecureRandom.engineNextBytes(SecureRandom.Java:197)
- locked <0x00007f9aa457e400> (a Sun.security.provider.SecureRandom)
at Sun.security.provider.NativePRNG$RandomIO.implNextBytes(NativePRNG.Java:257)
- locked <0x00007f9aa457e708> (a Java.lang.Object)
at Sun.security.provider.NativePRNG$RandomIO.access$200(NativePRNG.Java:108)
at Sun.security.provider.NativePRNG.engineNextBytes(NativePRNG.Java:97)
at Java.security.SecureRandom.nextBytes(SecureRandom.Java:433)
- locked <0x00007f9aa4582fc8> (a Java.security.SecureRandom)
at Java.util.UUID.randomUUID(UUID.Java:162)
at HeavyThread.run(HeavyThread.Java:27)
at Java.lang.Thread.run(Thread.Java:619)
したがって、HeavyThread
クラスを実行しているスレッドがほとんどのCPUを消費していることを確認できます。
リードワールドの状況では、おそらくCPUの一部を消費するスレッドの束であり、これらのスレッドをまとめると、100%CPUを使用するJavaプロセスになります。
概要
jvmtop は、使用率の高いスレッドを表示できます。
TID NAME STATE CPU TOTALCPU
25 http-8080-Processor13 RUNNABLE 4.55% 1.60%
128022 RMI TCP Connection(18)-10.101. RUNNABLE 1.82% 0.02%
36578 http-8080-Processor164 RUNNABLE 0.91% 2.35%
128026 JMX server connection timeout TIMED_WAITING 0.00% 0.00%
JVisualVMを実行し、アプリに接続して、スレッドビューを使用するだけです。継続的にアクティブなままであるものは、最も可能性の高い犯人です。
Top Threads JConsoleのプラグインをご覧ください。
Windowsで実行している場合は、 Process Explorer を試してください。プロセスのプロパティダイアログを表示し、[スレッド]タブを選択します。
Arthas Alibabaがオープンソース化したツールをご覧になることをお勧めします。
本番コードのデバッグに役立つ便利なコマンドが多数含まれています。
スレッドダンプを取得します。 10秒間待ちます。別のスレッドダンプを取得します。もう一度繰り返します。スレッドダンプを調べて、どのスレッドが同じ場所でスタックしているか、または同じリクエストを処理しているのを確認します。これは手動で行う方法ですが、多くの場合便利です。
検討できるオプションの1つは、アプリケーション内からの回答をスレッドに照会することです。 ThreadMXBean を使用して、Javaアプリケーション内からスレッドのCPU使用率を照会し、問題のあるスレッドのスタックトレースを照会できます。
ThreadMXBeanオプションを使用すると、この種の監視をライブアプリケーションに組み込むことができます。影響はごくわずかであり、希望どおりに実行できるという明確な利点があります。
VisualVMが優れたツールであると思われる場合は、試してみてください(これを行うためです)。
ただし、そのことが明らかな場合は、プロファイラーを使用して、CPUを大量に消費している理由を突き止めます。
これは一種のハックな方法ですが、デバッガでアプリケーションを起動し、allスレッドを中断して、コードを調べて、ブロックしていないものを見つけることができるようです何らかのループ内のロックまたはI/O呼び出しで。または、これはあなたがすでに試したことと似ていますか?