C#を使用したCUDA(nvidia gpu言語)のコーディングに関する情報を探しています。私はいくつかのライブラリを見てきましたが、それらは少しのオーバーヘッドを追加するようです(p/invokesなどのため)。
ManagedCuda のようなニースの完全なcuda 4.2ラッパーがあります。 C++プロジェクトをソリューションに追加するだけで、C#プロジェクトが含まれます。その後、追加するだけです。
call "%VS100COMNTOOLS%vsvars32.bat"
for /f %%a IN ('dir /b "$(ProjectDir)Kernels\*.cu"') do nvcc -ptx -Arch sm_21 -m 64 -o "$(ProjectDir)bin\Debug\%%~na_64.ptx" "$(ProjectDir)Kernels\%%~na.cu"
for /f %%a IN ('dir /b "$(ProjectDir)Kernels\*.cu"') do nvcc -ptx -Arch sm_21 -m 32 -o "$(ProjectDir)bin\Debug\%%~na.ptx" "$(ProjectDir)Kernels\%%~na.cu"
c#プロジェクトのプロパティでイベントをポストビルドするには、これにより* .ptxファイルがコンパイルされ、C#プロジェクトの出力ディレクトリにコピーされます。
次に、新しいコンテキストを作成し、ファイルからモジュールをロードし、関数をロードしてデバイスを操作するだけです。
//NewContext creation
CudaContext cntxt = new CudaContext();
//Module loading from precompiled .ptx in a project output folder
CUmodule cumodule = cntxt.LoadModule("kernel.ptx");
//_Z9addKernelPf - function name, can be found in *.ptx file
CudaKernel addWithCuda = new CudaKernel("_Z9addKernelPf", cumodule, cntxt);
//Create device array for data
CudaDeviceVariable<cData2> vec1_device = new CudaDeviceVariable<cData2>(num);
//Create arrays with data
cData2[] vec1 = new cData2[num];
//Copy data to device
vec1_device.CopyToDevice(vec1);
//Set grid and block dimensions
addWithCuda.GridDimensions = new dim3(8, 1, 1);
addWithCuda.BlockDimensions = new dim3(512, 1, 1);
//Run the kernel
addWithCuda.Run(
vec1_device.DevicePointer,
vec2_device.DevicePointer,
vec3_device.DevicePointer);
//Copy data from device
vec1_device.CopyToHost(vec1);
これは、過去にnvidiaリストでコメントされています。
http://forums.nvidia.com/index.php?showtopic=97729
p/Invokeを使用すると、次のようなアセンブリで簡単に使用できます。
[DllImport("nvcuda")]
public static extern CUResult cuMemAlloc(ref CUdeviceptr dptr, uint bytesize);
C#アプリケーションでCUDAを使用するために使用できる代替方法がいくつかあります。
それらのいくつかをオンラインで見つけることができます: this answer を見てください。