OpenCVのHoG APIを使用して機能を抽出しようとしていますが、それを可能にするAPIが見つからないようです。
私がやろうとしているのは、HoGを使用してすべてのデータセット(ポジティブイメージとネガティブイメージのセット)からフィーチャを抽出し、独自のSVMをトレーニングすることです。
OpenCVでHoG.cppを覗いてみましたが、役に立ちませんでした。すべてのコードは複雑さの中に埋もれており、さまざまなハードウェアに対応する必要があります(例:IntelのIPP)
私の質問は:
これまでのところ、私は実際に既存のライブラリ(http://hogprocessing.altervista.org/)をProcessing(Java)からC++に移植していますが、まだ非常に遅く、検出には少なくとも16秒かかります
他の誰かがHoG機能の抽出に成功しましたが、どうやってそれを回避しましたか?そして、私が使用できるオープンソースコードはありますか?
前もって感謝します
次のようにopencvでhogクラスを使用できます
HOGDescriptor hog;
vector<float> ders;
vector<Point> locs;
この関数はあなたのために豚の特徴を計算します
hog.compute(grayImg, ders, Size(32, 32), Size(0, 0), locs);
grayImg
に対して計算されたHOG特徴は、ders
ベクトルに格納されてマトリックスになり、後でトレーニングに使用できます。
Mat Hogfeat(ders.size(), 1, CV_32FC1);
for(int i=0;i<ders.size();i++)
Hogfeat.at<float>(i,0)=ders.at(i);
これで、HOG機能がHogfeatマトリックスに保存されます。
次のようにオブジェクトhog
を使用して、ウィンドウサイズ、セルサイズ、ブロックサイズを設定することもできます。
hog.blockSize = 16;
hog.cellSize = 4;
hog.blockStride = 8;
// This is for comparing the HOG features of two images without using any SVM
// (It is not an efficient way but useful when you want to compare only few or two images)
// Simple distance
// Consider you have two HOG feature vectors for two images Hogfeat1 and Hogfeat2 and those are same size.
double distance = 0;
for(int i = 0; i < Hogfeat.rows; i++)
distance += abs(Hogfeat.at<float>(i, 0) - Hogfeat.at<float>(i, 0));
if (distance < Threshold)
cout<<"Two images are of same class"<<endl;
else
cout<<"Two images are of different class"<<endl;
それが有用であることを願っています:)
GPUバージョンもここにあります。
cv::Mat temp;
gpu::GpuMat gpu_img, descriptors;
cv::gpu::HOGDescriptor gpu_hog(win_size, Size(16, 16), Size(8, 8), Size(8, 8), 9,
cv::gpu::HOGDescriptor::DEFAULT_WIN_SIGMA, 0.2, gamma_corr,
cv::gpu::HOGDescriptor::DEFAULT_NLEVELS);
gpu_img.upload(img);
gpu_hog.getDescriptors(gpu_img, win_stride, descriptors, cv::gpu::HOGDescriptor::DESCR_FORMAT_ROW_BY_ROW);
descriptors.download(temp);
上記の記事の助けと比較して、2つの豚の機能のプログラムも書きました。そして、このメソッドを適用して、ROI領域の変化をチェックします。こちらのページを参照してください。 ソースコードと簡単な紹介
OpenCV 3では、GPUアルゴリズム(つまりCUDA)をユーザーが使用する方法にいくつかの変更が加えられています。 移行ガイド-CUDA を参照してください。
回答をuser3398689からOpenCV 3に更新するためのコードを次に示します。
#include <opencv2/core/cuda.hpp>
#include <opencv2/cudaimgproc.hpp>
[...]
/* Suppose you load an image in a cv::Mat variable called 'src' */
int img_width = 320;
int img_height = 240;
int block_size = 16;
int bin_number = 9;
cv::Ptr<cv::cuda::HOG> cuda_hog = cuda::HOG::create(Size(img_width, img_height),
Size(block_size, block_size),
Size(block_size/2, block_size/2),
Size(block_size/2, block_size/2),
bin_number);
/* The following commands are optional: default values applies */
cuda_hog->setDescriptorFormat(cuda::HOG::DESCR_FORMAT_COL_BY_COL);
cuda_hog->setGammaCorrection(true);
cuda_hog->setWinStride(Size(img_width_, img_height_));
cv::cuda::GpuMat image;
cv::cuda::GpuMat descriptor;
image.upload(src);
/* May not apply to you */
/* CUDA HOG works with intensity (1 channel) or BGRA (4 channels) images */
/* The next function call convert a standard BGR image to BGRA using the GPU */
cv::cuda::GpuMat image_alpha;
cuda::cvtColor(image, image_alpha, COLOR_BGR2BGRA, 4);
cuda_hog->compute(image_alpha, descriptor);
cv::Mat dst;
image_alpha.download(dst);
その後、たとえばG453で提案されているように、「dst」変数で記述子を好きなように使用できます。