"#pragma omp parallel num_threads(4)"を使用すると、異なるスレッドIDが取得されないのはなぜですか。この場合、すべてのスレッドIDは0です。しかし、行をコメントしてデフォルトのスレッド数を使用すると、異なるスレッドIDが取得されました。注:-variableスレッドIDを取得するために変数tidを使用しました。
#include <omp.h>
#include <stdio.h>
#include <stdlib.h>
int main (int argc, char *argv[])
{
int nthreads, tid;
int x = 0;
#pragma omp parallel num_threads(4)
#pragma omp parallel private(nthreads, tid)
{
/* Obtain thread number */
tid = omp_get_thread_num();
printf("Hello World from thread = %d\n", tid);
// /* Only master thread does this */
if (tid == 0)
{
nthreads = omp_get_num_threads();
printf("Number of threads = %d\n", nthreads);
}
}
}
上記のコードの出力:-
Hello World from thread = 0
Hello World from thread = 0
Number of threads = 1
Hello World from thread = 0
Number of threads = 1
Hello World from thread = 0
Number of threads = 1
Number of threads = 1
上記の行をコメントアウトすると出力されます:-
Hello World from thread = 3
Hello World from thread = 0
Number of threads = 4
Hello World from thread = 1
Hello World from thread = 2
2つのネストされた並列領域を作成しています。これはこれを行うのと同じです:
_#pragma omp parallel num_threads(4)
{
#pragma omp parallel private(nthreads, tid)
{
/* Obtain thread number */
tid = omp_get_thread_num();
printf("Hello World from thread = %d\n", tid);
// /* Only master thread does this */
if (tid == 0)
{
nthreads = omp_get_num_threads();
printf("Number of threads = %d\n", nthreads);
}
}
}
_
omp_get_num_threads()
は、最も内側の領域にあるスレッドの数を返します。つまり、4つのスレッドを実行しており、それぞれが1つのスレッドを実行しています。
ネストされた並列処理を有効にしていないため、内部並列領域は1つのスレッドのみを実行しています。 omp_set_nested(1)
を呼び出すことで有効にできます。
http://docs.Oracle.com/cd/E19205-01/819-5270/aewbi/index.html
2つのネストされた並列領域を作成する代わりに、単一の並列領域を作成して2つのプロパティを指定したい場合は、次のようにします。
_#pragma omp parallel num_threads(4) private(nthreads,tid)
{
.
.
.
}
_
ネスティングは、環境変数OMP_NESTEDをtrueに設定して有効にすることもできます。