Ubuntu 16.10を実行していて、gprofを使用してプログラムのプロファイルを作成しようとしています。フラグ-pg
を付けてコンパイルすると、プログラムはシングルスレッドです。実際のコンパイルコマンドは次のとおりです。
g++ -I. -std=c++11 -Wall -Wextra -O3 -pg -fPIC -Wno-unused-parameter -c -o build/obj/performance/stencil_application.o test/performance/stencil_application.cpp
g++ -I. -std=c++11 -Wall -Wextra -O3 -pg -Wno-unused-parameter build/obj/performance/stencil_application.o -o build/test/performance/stencil_application
プログラムを実行すると、プログラムが完了するまでに数秒かかり、gmon.outという名前のファイルが生成されます。ただし、gprof ./build/test/performance/stencil_application
を実行すると、出力に数値が含まれません。次のように、テーブルの見出しとさまざまなフィールドの説明のみを取得します。
Flat profile:
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls Ts/call Ts/call name
% the percentage of the total running time of the
time program used by this function.
cumulative a running sum of the number of seconds accounted
seconds for by this function and those listed above it.
self the number of seconds accounted for by this
seconds function alone. This is the major sort for this
listing.
calls the number of times this function was invoked, if
this function is profiled, else blank.
self the average number of milliseconds spent in this
ms/call function per call, if this function is profiled,
else blank.
total the average number of milliseconds spent in this
ms/call function and its descendents per call, if this
function is profiled, else blank.
name the name of the function. This is the minor sort
for this listing. The index shows the location of
the function in the gprof listing. If the index is
in parenthesis it shows where it would appear in
the gprof listing if it were to be printed.
Copyright (C) 2012-2016 Free Software Foundation, Inc.
Copying and distribution of this file, with or without modification,
are permitted in any medium without royalty provided the copyright
notice and this notice are preserved.
Call graph (explanation follows)
granularity: each sample hit covers 2 byte(s) no time propagated
index % time self children called name
This table describes the call tree of the program, and was sorted by
the total amount of time spent in each function and its children.
等々。
また、-O3
を使用せずに-g
を使用してコンパイルしようとしましたが、結果は同じです。誰かが何が悪いのか知っていますか?
上記のTony Beta Lambdaのコメントで指摘されているように、これは gccのバグ です。 2つの可能な回避策があります。gcc-4.9にダウングレードするか、フラグ-no-pie
を使用してコンパイルします。