WindowsのQtCreatorでCudaコードをコンパイルする

Question

私は何日もの間、32ビットのWindows 7システムでQtプロジェクトファイルを実行しようと試みてきました。このファイルには、Cudaコードを含める必要があります。この組み合わせは、誰も例をオンラインで公開することを気にしないほど単純であるか、誰も成功しなかったほど難しいかのどちらかであるように思われます。いずれにせよ、私が見つけた唯一の有用なフォーラムスレッドは、LinuxまたはMac、あるいはWindows上のVisualStudioでの同じ問題でした。ただし、ライブラリのリンクや衝突、ファイル名のスペース、WindowsバージョンのCuda SDKの存在しないフォルダーなどが原因であるかどうかにかかわらず、これらはすべてさまざまなエラーを引き起こします。トリックを行う明確な.proファイルを提供している人はいますか？

.cuファイル内のいくつかのCudaモジュールを参照するQt4.8ライブラリを使用して、Qtスタイルの通常のC++コードで単純なプログラムをコンパイルすることを目指しています。フォームの何か：

TestCUDA \
    TestCUDA.pro
    main.cpp
    test.cu

.cuファイル内のいくつかのCudaモジュールを参照するQt4.8ライブラリを使用して、Qtスタイルの通常のC++コードで単純なプログラムをコンパイルすることを目指しています。フォームの何か：

TestCUDA \ TestCUDA.pro main.cpp test.cu

Yellow · Accepted Answer

それで、私はついに、自分の、そしておそらくすべてのWindowsシステムで動作する_.pro_ファイルを組み立てることができました。以下は、おそらくトリックを行うはずの簡単なテストプログラムです。以下は、少なくとも私のシステムで動作する小さなプロジェクトファイルとテストプログラムです。

ファイルシステムは次のようになります。

_TestCUDA \ TestCUDA.pro main.cpp vectorAddition.cu _

プロジェクトファイルには次のように書かれています。

_TARGET = TestCUDA # Define output directories DESTDIR = release OBJECTS_DIR = release/obj CUDA_OBJECTS_DIR = release/cuda # Source files SOURCES += src/main.cpp # This makes the .cu files appear in your project OTHER_FILES += vectorAddition.cu # CUDA settings <-- may change depending on your system CUDA_SOURCES += src/cuda/vectorAddition.cu CUDA_SDK = "C:/ProgramData/NVIDIA Corporation/NVIDIA GPU Computing SDK 4.2/C" # Path to cuda SDK install CUDA_DIR = "C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v4.2" # Path to cuda toolkit install SYSTEM_NAME = Win32 # Depending on your system either 'Win32', 'x64', or 'Win64' SYSTEM_TYPE = 32 # '32' or '64', depending on your system CUDA_Arch = sm_11 # Type of CUDA architecture, for example 'compute_10', 'compute_11', 'sm_10' NVCC_OPTIONS = --use_fast_math # include paths INCLUDEPATH += $$CUDA_DIR/include \ $$CUDA_SDK/common/inc/ \ $$CUDA_SDK/../shared/inc/ # library directories QMAKE_LIBDIR += $$CUDA_DIR/lib/$$SYSTEM_NAME \ $$CUDA_SDK/common/lib/$$SYSTEM_NAME \ $$CUDA_SDK/../shared/lib/$$SYSTEM_NAME # Add the necessary libraries LIBS += -lcuda -lcudart # The following library conflicts with something in Cuda QMAKE_LFLAGS_RELEASE = /NODEFAULTLIB:msvcrt.lib QMAKE_LFLAGS_DEBUG = /NODEFAULTLIB:msvcrtd.lib # The following makes sure all path names (which often include spaces) are put between quotation marks CUDA_INC = $$join(INCLUDEPATH,'" -I"','-I"','"') # Configuration of the Cuda compiler CONFIG(debug, debug|release) { # Debug mode cuda_d.input = CUDA_SOURCES cuda_d.output = $$CUDA_OBJECTS_DIR/${QMAKE_FILE_BASE}_cuda.o cuda_d.commands = $$CUDA_DIR/bin/nvcc.exe -D_DEBUG $$NVCC_OPTIONS $$CUDA_INC $$LIBS --machine $$SYSTEM_TYPE -Arch=$$CUDA_Arch -c -o ${QMAKE_FILE_OUT} ${QMAKE_FILE_NAME} cuda_d.dependency_type = TYPE_C QMAKE_EXTRA_COMPILERS += cuda_d } else { # Release mode cuda.input = CUDA_SOURCES cuda.output = $$CUDA_OBJECTS_DIR/${QMAKE_FILE_BASE}_cuda.o cuda.commands = $$CUDA_DIR/bin/nvcc.exe $$NVCC_OPTIONS $$CUDA_INC $$LIBS --machine $$SYSTEM_TYPE -Arch=$$CUDA_Arch -c -o ${QMAKE_FILE_OUT} ${QMAKE_FILE_NAME} cuda.dependency_type = TYPE_C QMAKE_EXTRA_COMPILERS += cuda _

}

_QMAKE_LFLAGS_RELEASE = /NODEFAULTLIB:msvcrt.lib_に注意してください：理解するのに長い時間がかかりましたが、このライブラリはCudaの他のものと衝突しているようで、奇妙なリンクの警告とエラーが発生します。誰かがこれについての説明を持っていて、これを回避するためのより良い方法を持っている可能性があるなら、私はそれを聞きたいです。

また、Windowsファイルパスにはスペースが含まれることが多いため（デフォルトではNVIDIAのSDKにもスペースが含まれます）、インクルードパスを人為的に引用符で囲む必要があります。繰り返しますが、誰かがこの問題を解決するためのよりエレガントな方法を知っているなら、私は知りたいと思います。

_main.cpp_ファイルは次のようになります。

_#include <cuda.h> #include <builtin_types.h> #include <drvapi_error_string.h> #include <QtCore/QCoreApplication> #include <QDebug> // Forward declare the function in the .cu file void vectorAddition(const float* a, const float* b, float* c, int n); void printArray(const float* a, const unsigned int n) { QString s = "("; unsigned int ii; for (ii = 0; ii < n - 1; ++ii) s.append(QString::number(a[ii])).append(", "); s.append(QString::number(a[ii])).append(")"); qDebug() << s; } int main(int argc, char* argv []) { QCoreApplication(argc, argv); int deviceCount = 0; int cudaDevice = 0; char cudaDeviceName [100]; unsigned int N = 50; float *a, *b, *c; cuInit(0); cuDeviceGetCount(&deviceCount); cuDeviceGet(&cudaDevice, 0); cuDeviceGetName(cudaDeviceName, 100, cudaDevice); qDebug() << "Number of devices: " << deviceCount; qDebug() << "Device name:" << cudaDeviceName; a = new float [N]; b = new float [N]; c = new float [N]; for (unsigned int ii = 0; ii < N; ++ii) { a[ii] = qrand(); b[ii] = qrand(); } // This is the function call in which the kernel is called vectorAddition(a, b, c, N); qDebug() << "input a:"; printArray(a, N); qDebug() << "input b:"; printArray(b, N); qDebug() << "output c:"; printArray(c, N); if (a) delete a; if (b) delete b; if (c) delete c; } _

単純なベクトル加算を記述したCudaファイル_vectorAddition.cu_は、次のようになります。

_#include <cuda.h> #include <builtin_types.h> extern "C" __global__ void vectorAdditionCUDA(const float* a, const float* b, float* c, int n) { int ii = blockDim.x * blockIdx.x + threadIdx.x; if (ii < n) c[ii] = a[ii] + b[ii]; } void vectorAddition(const float* a, const float* b, float* c, int n) { float *a_cuda, *b_cuda, *c_cuda; unsigned int nBytes = sizeof(float) * n; int threadsPerBlock = 256; int blocksPerGrid = (n + threadsPerBlock - 1) / threadsPerBlock; // allocate and copy memory into the device cudaMalloc((void **)& a_cuda, nBytes); cudaMalloc((void **)& b_cuda, nBytes); cudaMalloc((void **)& c_cuda, nBytes); cudaMemcpy(a_cuda, a, nBytes, cudaMemcpyHostToDevice); cudaMemcpy(b_cuda, b, nBytes, cudaMemcpyHostToDevice); vectorAdditionCUDA<<<blocksPerGrid, threadsPerBlock>>>(a_cuda, b_cuda, c_cuda, n); // load the answer back into the Host cudaMemcpy(c, c_cuda, nBytes, cudaMemcpyDeviceToHost); cudaFree(a_cuda); cudaFree(b_cuda); cudaFree(c_cuda); } _

これを機能させると、もっと複雑な例が自明だと思います。

編集（24-1-2013）: _QMAKE_LFLAGS_DEBUG = /NODEFAULTLIB:msvcrtd.lib_とCONFIG(debug)に追加の_D_DEBUG_フラグを追加して、デバッグでもコンパイルできるようにしましたモード。

Kędrzu · Answer

Msvc 2010を使用して、リンカーが-lパラメーターを受け入れないことがわかりましたが、nvccはそれを必要とします。したがって、.proファイルに簡単な変更を加えました。

# Add the necessary libraries CUDA_LIBS = cuda cudart # The following makes sure all path names (which often include spaces) are put between quotation marks CUDA_INC = $$join(INCLUDEPATH,'" -I"','-I"','"') # LIBRARIES IN FORMAT NEEDED BY NVCC NVCC_LIBS = $$join(CUDA_LIBS,' -l','-l', '') # LIBRARIES IN FORMAT NEEDED BY VISUAL C++ LINKER LIBS += $$join(CUDA_LIBS,'.lib ', '', '.lib')

そしてnvccコマンド（リリースバージョン）：

cuda.commands = $$CUDA_DIR/bin/nvcc.exe $$NVCC_OPTIONS $$CUDA_INC $$NVCC_LIBS --machine $$SYSTEM_TYPE -Arch=$$CUDA_Arch -c -o ${QMAKE_FILE_OUT} ${QMAKE_FILE_NAME}

$$ LIBSの代わりに$$ NVCC_LIBSが挿入されました。私のために働く.proファイル全体：

QT += core QT -= gui TARGET = TestCUDA CONFIG += console CONFIG -= app_bundle TEMPLATE = app # Define output directories DESTDIR = release OBJECTS_DIR = release/obj CUDA_OBJECTS_DIR = release/cuda # Source files SOURCES += main.cpp # This makes the .cu files appear in your project OTHER_FILES += vectorAddition.cu # CUDA settings <-- may change depending on your system CUDA_SOURCES += vectorAddition.cu #CUDA_SDK = "C:/ProgramData/NVIDIA Corporation/NVIDIA GPU Computing SDK 4.2/C" # Path to cuda SDK install CUDA_DIR = "C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v5.0" # Path to cuda toolkit install SYSTEM_NAME = win32 # Depending on your system either 'Win32', 'x64', or 'Win64' SYSTEM_TYPE = 32 # '32' or '64', depending on your system CUDA_Arch = sm_11 # Type of CUDA architecture, for example 'compute_10', 'compute_11', 'sm_10' NVCC_OPTIONS = --use_fast_math # include paths INCLUDEPATH += $$CUDA_DIR/include #$$CUDA_SDK/common/inc/ \ #$$CUDA_SDK/../shared/inc/ # library directories QMAKE_LIBDIR += $$CUDA_DIR/lib/$$SYSTEM_NAME #$$CUDA_SDK/common/lib/$$SYSTEM_NAME \ #$$CUDA_SDK/../shared/lib/$$SYSTEM_NAME # The following library conflicts with something in Cuda QMAKE_LFLAGS_RELEASE = /NODEFAULTLIB:msvcrt.lib QMAKE_LFLAGS_DEBUG = /NODEFAULTLIB:msvcrtd.lib # Add the necessary libraries CUDA_LIBS = cuda cudart # The following makes sure all path names (which often include spaces) are put between quotation marks CUDA_INC = $$join(INCLUDEPATH,'" -I"','-I"','"') NVCC_LIBS = $$join(CUDA_LIBS,' -l','-l', '') LIBS += $$join(CUDA_LIBS,'.lib ', '', '.lib') # Configuration of the Cuda compiler CONFIG(debug, debug|release) { # Debug mode cuda_d.input = CUDA_SOURCES cuda_d.output = $$CUDA_OBJECTS_DIR/${QMAKE_FILE_BASE}_cuda.o cuda_d.commands = $$CUDA_DIR/bin/nvcc.exe -D_DEBUG $$NVCC_OPTIONS $$CUDA_INC $$NVCC_LIBS --machine $$SYSTEM_TYPE -Arch=$$CUDA_Arch -c -o ${QMAKE_FILE_OUT} ${QMAKE_FILE_NAME} cuda_d.dependency_type = TYPE_C QMAKE_EXTRA_COMPILERS += cuda_d } else { # Release mode cuda.input = CUDA_SOURCES cuda.output = $$CUDA_OBJECTS_DIR/${QMAKE_FILE_BASE}_cuda.o cuda.commands = $$CUDA_DIR/bin/nvcc.exe $$NVCC_OPTIONS $$CUDA_INC $$NVCC_LIBS --machine $$SYSTEM_TYPE -Arch=$$CUDA_Arch -c -o ${QMAKE_FILE_OUT} ${QMAKE_FILE_NAME} cuda.dependency_type = TYPE_C QMAKE_EXTRA_COMPILERS += cuda }

また、いくつかの重要な宣言、つまりアプリが機能するためのQT + =コアを追加し、この場合は役に立たなかったSDK部分も削除しました。

Tariq · Answer

この組み合わせを試してみました。私のプロジェクトには多くの依存関係があるため、それを機能させることができませんでした。私の最終的な解決策は、Windows上でアプリケーションを2つの別々のアプリケーションに分割することでした1）

VCで開発され、Windowsでサービス/ DLLとして実行されているCUDAアプリケーション
QTで開発され、CUDA関連のタスクにDLLを使用するGUIインターフェイス。

それが他の人の時間を節約することを願っています