ガウスぼかしの実装-畳み込み行列の計算方法（カーネル）

Question

私の質問はこの質問に非常に近いです：組み込みのガウス関数を使用せずに画像をガウスぼかしするにはどうすればよいですか？

この質問に対する答えは非常に良いですが、実際のガウスフィルターカーネルを実際に計算する例は示していません。答えは任意のカーネルを与え、そのカーネルを使用してフィルターを適用する方法を示しますが、実際のカーネル自体を計算する方法は示しません。私はガウスぼかしをC++またはMatlabでゼロから実装しようとしているので、ゼロからカーネルを計算する方法を知る必要があります。

誰かが小さなサンプル画像行列を使用して実際のガウスフィルターカーネルを計算できたら、私はそれを感謝します。

petrichor · Accepted Answer

fspecial のMATLABドキュメンテーションに記載されているように、ゼロからガウスカーネルを作成できます。そのページのアルゴリズム部分にあるガウスカーネル作成式を読み、以下のコードに従ってください。コードは、sigma = 1でm行n列の行列を作成することです。

m = 5; n = 5; sigma = 1; [h1, h2] = meshgrid(-(m-1)/2:(m-1)/2, -(n-1)/2:(n-1)/2); hg = exp(- (h1.^2+h2.^2) / (2*sigma^2)); h = hg ./ sum(hg(:)); h = 0.0030 0.0133 0.0219 0.0133 0.0030 0.0133 0.0596 0.0983 0.0596 0.0133 0.0219 0.0983 0.1621 0.0983 0.0219 0.0133 0.0596 0.0983 0.0596 0.0133 0.0030 0.0133 0.0219 0.0133 0.0030

これは、次のように組み込みのfspecialで実行できることに注意してください。

fspecial('gaussian', [m n], sigma) ans = 0.0030 0.0133 0.0219 0.0133 0.0030 0.0133 0.0596 0.0983 0.0596 0.0133 0.0219 0.0983 0.1621 0.0983 0.0219 0.0133 0.0596 0.0983 0.0596 0.0133 0.0030 0.0133 0.0219 0.0133 0.0030

好きな言語でこれを実装するのは簡単だと思います。

編集：C++でコーディングする場合は meshgrid になじみがない可能性があるため、特定のケースのh1およびh2の値も追加します。

h1 = -2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2 h2 = -2 -2 -2 -2 -2 -1 -1 -1 -1 -1 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2

thiton · Answer

簡単なことです。

double sigma = 1; int W = 5; double kernel[W][W]; double mean = W/2; double sum = 0.0; // For accumulating the kernel values for (int x = 0; x < W; ++x) for (int y = 0; y < W; ++y) { kernel[x][y] = exp( -0.5 * (pow((x-mean)/sigma, 2.0) + pow((y-mean)/sigma,2.0)) ) / (2 * M_PI * sigma * sigma); // Accumulate the kernel values sum += kernel[x][y]; } // Normalize the kernel for (int x = 0; x < W; ++x) for (int y = 0; y < W; ++y) kernel[x][y] /= sum;

moooeeeep · Answer

gaussian blur を実装するには、単に gaussian function を取り、カーネル内の各要素に対して1つの値を計算します。

通常、カーネルの中心要素に最大の重みを割り当て、カーネル境界の要素にはゼロに近い値を割り当てます。これは、カーネルが実際に中心要素があることを保証するために、奇数の高さ（または幅）を持つ必要があることを意味します。

実際のカーネル要素を計算するには、ガウスベルをカーネルグリッドに合わせてスケーリングします（任意のsigma = 1および任意の範囲。 -2*sigma ... 2*sigma）それを正規化します。要素の合計は1です。これを実現するために、任意のカーネルサイズをサポートする場合、必要なカーネルサイズにシグマを適合させることができます。

C++の例を次に示します。

#include <cmath> #include <vector> #include <iostream> #include <iomanip> double gaussian( double x, double mu, double sigma ) { const double a = ( x - mu ) / sigma; return std::exp( -0.5 * a * a ); } typedef std::vector<double> kernel_row; typedef std::vector<kernel_row> kernel_type; kernel_type produce2dGaussianKernel (int kernelRadius) { double sigma = kernelRadius/2.; kernel_type kernel2d(2*kernelRadius+1, kernel_row(2*kernelRadius+1)); double sum = 0; // compute values for (int row = 0; row < kernel2d.size(); row++) for (int col = 0; col < kernel2d[row].size(); col++) { double x = gaussian(row, kernelRadius, sigma) * gaussian(col, kernelRadius, sigma); kernel2d[row][col] = x; sum += x; } // normalize for (int row = 0; row < kernel2d.size(); row++) for (int col = 0; col < kernel2d[row].size(); col++) kernel2d[row][col] /= sum; return kernel2d; } int main() { kernel_type kernel2d = produce2dGaussianKernel(3); std::cout << std::setprecision(5) << std::fixed; for (int row = 0; row < kernel2d.size(); row++) { for (int col = 0; col < kernel2d[row].size(); col++) std::cout << kernel2d[row][col] << ' '; std::cout << '
'; } }

出力は次のとおりです。

$ g++ test.cc && ./a.out 0.00134 0.00408 0.00794 0.00992 0.00794 0.00408 0.00134 0.00408 0.01238 0.02412 0.03012 0.02412 0.01238 0.00408 0.00794 0.02412 0.04698 0.05867 0.04698 0.02412 0.00794 0.00992 0.03012 0.05867 0.07327 0.05867 0.03012 0.00992 0.00794 0.02412 0.04698 0.05867 0.04698 0.02412 0.00794 0.00408 0.01238 0.02412 0.03012 0.02412 0.01238 0.00408 0.00134 0.00408 0.00794 0.00992 0.00794 0.00408 0.00134

簡単にするために、2Dカーネルを使用する必要はありません。実装が簡単で、計算がより効率的になるのは、2つの直交1dカーネルを使用することです。これは、このタイプの線形畳み込み（線形分離可能性）の結合性により可能です。また、対応するウィキペディアの記事のこのセクションもご覧ください。

Pythonでも同じです（誰かが役に立つと期待して）：

from math import exp def gaussian(x, mu, sigma): return exp( -(((x-mu)/(sigma))**2)/2.0 ) #kernel_height, kernel_width = 7, 7 kernel_radius = 3 # for an 7x7 filter sigma = kernel_radius/2. # for [-2*sigma, 2*sigma] # compute the actual kernel elements hkernel = [gaussian(x, kernel_radius, sigma) for x in range(2*kernel_radius+1)] vkernel = [x for x in hkernel] kernel2d = [[xh*xv for xh in hkernel] for xv in vkernel] # normalize the kernel elements kernelsum = sum([sum(row) for row in kernel2d]) kernel2d = [[x/kernelsum for x in row] for row in kernel2d] for line in kernel2d: print ["%.3f" % x for x in line]

カーネルを生成します：

['0.001', '0.004', '0.008', '0.010', '0.008', '0.004', '0.001'] ['0.004', '0.012', '0.024', '0.030', '0.024', '0.012', '0.004'] ['0.008', '0.024', '0.047', '0.059', '0.047', '0.024', '0.008'] ['0.010', '0.030', '0.059', '0.073', '0.059', '0.030', '0.010'] ['0.008', '0.024', '0.047', '0.059', '0.047', '0.024', '0.008'] ['0.004', '0.012', '0.024', '0.030', '0.024', '0.012', '0.004'] ['0.001', '0.004', '0.008', '0.010', '0.008', '0.004', '0.001']

Metal3d · Answer

OK、遅い回答ですが、...の場合.

@moooeeeep回答を使用しますが、numpyを使用します。

import numpy as np radius = 3 sigma = radius/2. k = np.arange(2*radius +1) row = np.exp( -(((k - radius)/(sigma))**2)/2.) col = row.transpose() out = np.outer(row, col) out = out/np.sum(out) for line in out: print(["%.3f" % x for x in line])

わずかに少ない行。

Vlad · Answer

ガウスぼかしpython PIL画像ライブラリを使用。詳細については、こちらをお読みください： http://blog.ivank.net/fastest-gaussian-blur.html

from PIL import Image import math # img = Image.open('input.jpg').convert('L') # r = radiuss def gauss_blur(img, r): imgData = list(img.getdata()) bluredImg = Image.new(img.mode, img.size) bluredImgData = list(bluredImg.getdata()) rs = int(math.ceil(r * 2.57)) for i in range(0, img.height): for j in range(0, img.width): val = 0 wsum = 0 for iy in range(i - rs, i + rs + 1): for ix in range(j - rs, j + rs + 1): x = min(img.width - 1, max(0, ix)) y = min(img.height - 1, max(0, iy)) dsq = (ix - j) * (ix - j) + (iy - i) * (iy - i) weight = math.exp(-dsq / (2 * r * r)) / (math.pi * 2 * r * r) val += imgData[y * img.width + x] * weight wsum += weight bluredImgData[i * img.width + j] = round(val / wsum) bluredImg.putdata(bluredImgData) return bluredImg

Đ&#224;o Anh Xuy&#234;n · Answer

// my_test.cpp : Defines the entry point for the console application. // #include "stdafx.h" #include <cmath> #include <vector> #include <iostream> #include <iomanip> #include <string> //https://stackoverflow.com/questions/8204645/implementing-gaussian-blur-how-to-calculate-convolution-matrix-kernel //https://docs.opencv.org/2.4/modules/imgproc/doc/filtering.html#getgaussiankernel //http://dev.theomader.com/gaussian-kernel-calculator/ double gaussian(double x, double mu, double sigma) { const double a = (x - mu) / sigma; return std::exp(-0.5 * a * a); } typedef std::vector<double> kernel_row; typedef std::vector<kernel_row> kernel_type; kernel_type produce2dGaussianKernel(int kernelRadius, double sigma) { kernel_type kernel2d(2 * kernelRadius + 1, kernel_row(2 * kernelRadius + 1)); double sum = 0; // compute values for (int row = 0; row < kernel2d.size(); row++) for (int col = 0; col < kernel2d[row].size(); col++) { double x = gaussian(row, kernelRadius, sigma) * gaussian(col, kernelRadius, sigma); kernel2d[row][col] = x; sum += x; } // normalize for (int row = 0; row < kernel2d.size(); row++) for (int col = 0; col < kernel2d[row].size(); col++) kernel2d[row][col] /= sum; return kernel2d; } char* gMatChar[10] = { " ", " ", " ", " ", " ", " ", " ", " ", " ", " " }; static int countSpace(float aValue) { int count = 0; int value = (int)aValue; while (value > 9) { count++; value /= 10; } return count; } int main() { while (1) { char str1[80]; // window size char str2[80]; // sigma char str3[80]; // coefficient int space; int i, ch; printf("
-----------------------------------------------------------------------------
"); printf("Start generate Gaussian matrix
"); printf("-----------------------------------------------------------------------------
"); // input window size printf("
Please enter window size (from 3 to 10) It should be odd (ksize/mod 2 = 1 ) and positive: Exit enter q 
"); for (i = 0; (i < 80) && ((ch = getchar()) != EOF) && (ch != '
'); i++) { str1[i] = (char)ch; } // Terminate string with a null character str1[i] = '\0'; if (str1[0] == 'q') { break; } int input1 = atoi(str1); int window_size = input1 / 2; printf("Input window_size was: %d
", input1); // input sigma printf("Please enter sigma. Use default press Enter . Exit enter q 
"); str2[0] = '0'; for (i = 0; (i < 80) && ((ch = getchar()) != EOF) && (ch != '
'); i++) { str2[i] = (char)ch; } // Terminate string with a null character str2[i] = '\0'; if (str2[0] == 'q') { break; } float input2 = atof(str2); float sigma; if (input2 == 0) { // Open-CV sigma � Gaussian standard deviation. If it is non-positive, it is computed from ksize as sigma = 0.3*((ksize-1)*0.5 - 1) + 0.8 . sigma = 0.3*((input1 - 1)*0.5 - 1) + 0.8; } else { sigma = input2; } printf("Input sigma was: %f
", sigma); // input Coefficient K printf("Please enter Coefficient K. Use default press Enter . Exit enter q 
"); str3[0] = '0'; for (i = 0; (i < 80) && ((ch = getchar()) != EOF) && (ch != '
'); i++) { str3[i] = (char)ch; } // Terminate string with a null character str3[i] = '\0'; if (str3[0] == 'q') { break; } int input3 = atoi(str3); int cK; if (input3 == 0) { cK = 1; } else { cK = input3; } float sum_f = 0; float temp_f; int sum = 0; int temp; printf("Input Coefficient K was: %d
", cK); printf("
window size=%d | Sigma = %f Coefficient K = %d


", input1, sigma, cK); kernel_type kernel2d = produce2dGaussianKernel(window_size, sigma); std::cout << std::setprecision(input1) << std::fixed; for (int row = 0; row < kernel2d.size(); row++) { for (int col = 0; col < kernel2d[row].size(); col++) { temp_f = cK* kernel2d[row][col]; sum_f += temp_f; space = countSpace(temp_f); std::cout << gMatChar[space] << temp_f << ' '; } std::cout << '
'; } printf("
 Sum array = %f | delta = %f", sum_f, sum_f - cK); // rounding printf("
Recommend use round(): window size=%d | Sigma = %f Coefficient K = %d


", input1, sigma, cK); sum = 0; std::cout << std::setprecision(0) << std::fixed; for (int row = 0; row < kernel2d.size(); row++) { for (int col = 0; col < kernel2d[row].size(); col++) { temp = round(cK* kernel2d[row][col]); sum += temp; space = countSpace((float)temp); std::cout << gMatChar[space] << temp << ' '; } std::cout << '
'; } printf("
 Sum array = %d | delta = %d", sum, sum - cK); // recommented sum_f = 0; int cK_d = 1 / kernel2d[0][0]; cK_d = cK_d / 2 * 2; printf("
Recommend: window size=%d | Sigma = %f Coefficient K = %d


", input1, sigma, cK_d); std::cout << std::setprecision(input1) << std::fixed; for (int row = 0; row < kernel2d.size(); row++) { for (int col = 0; col < kernel2d[row].size(); col++) { temp_f = cK_d* kernel2d[row][col]; sum_f += temp_f; space = countSpace(temp_f); std::cout << gMatChar[space] << temp_f << ' '; } std::cout << '
'; } printf("
 Sum array = %f | delta = %f", sum_f, sum_f - cK_d); // rounding printf("
Recommend use round(): window size=%d | Sigma = %f Coefficient K = %d


", input1, sigma, cK_d); sum = 0; std::cout << std::setprecision(0) << std::fixed; for (int row = 0; row < kernel2d.size(); row++) { for (int col = 0; col < kernel2d[row].size(); col++) { temp = round(cK_d* kernel2d[row][col]); sum += temp; space = countSpace((float)temp); std::cout << gMatChar[space] << temp << ' '; } std::cout << '
'; } printf("
 Sum array = %d | delta = %d", sum, sum - cK_d); } }

Panfeng Li · Answer

 function kernel = gauss_kernel(m, n, sigma) % Generating Gauss Kernel x = -(m-1)/2 : (m-1)/2; y = -(n-1)/2 : (n-1)/2; for i = 1:m for j = 1:n xx(i,j) = x(i); yy(i,j) = y(j); end end kernel = exp(-(xx.*xx + yy.*yy)/(2*sigma*sigma)); % Normalize the kernel kernel = kernel/sum(kernel(:)); % Corresponding function in MATLAB % fspecial('gaussian', [m n], sigma)