適応的に適切にしきい値を設定しない数独パズルのかなりぼやけた432x432の画像があります(5x5ピクセルのブロックサイズの平均を取り、2を引きます):
ご覧のとおり、数字はわずかに歪んでおり、破損が多く、5が6に、6が8に融合しています。また、たくさんのノイズがあります。ノイズを修正するには、ガウスぼかしを使用して画像をさらにぼかします。ただし、かなり大きなガウスカーネルと適応しきい値blockSize(21x21、減算2)でさえ、すべての破損を取り除くことができず、数字をさらに融合します。
また、しきい値処理後に画像を拡張してみました。これは、blockSizeを増やすのと同様の効果があります。および 画像をシャープにする 、これはどちらの方法でもあまり効果がありません。他に何を試すべきですか?
かなり良い解決策は、形態学的クロージングを使用して明るさを均一にしてから、通常の(非適応)大津しきい値を使用することです。
// Divide the image by its morphologically closed counterpart
Mat kernel = Imgproc.getStructuringElement(Imgproc.MORPH_ELLIPSE, new Size(19,19));
Mat closed = new Mat();
Imgproc.morphologyEx(image, closed, Imgproc.MORPH_CLOSE, kernel);
image.convertTo(image, CvType.CV_32F); // divide requires floating-point
Core.divide(image, closed, image, 1, CvType.CV_32F);
Core.normalize(image, image, 0, 255, Core.NORM_MINMAX);
image.convertTo(image, CvType.CV_8UC1); // convert back to unsigned int
// Threshold each block (3x3 grid) of the image separately to
// correct for minor differences in contrast across the image.
for (int i = 0; i < 3; i++) {
for (int j = 0; j < 3; j++) {
Mat block = image.rowRange(144*i, 144*(i+1)).colRange(144*j, 144*(j+1));
Imgproc.threshold(block, block, -1, 255, Imgproc.THRESH_BINARY_INV+Imgproc.THRESH_OTSU);
}
}
結果:
Smoothing Images OpenCVチュートリアル をご覧ください。 GaussianBlurを除いて、medianBlur
とbilateralFilter
もあり、これらを使用してノイズを減らすこともできます。ソース画像(右上)からこの画像を取得しました:
更新:そして、小さな輪郭を削除した後に取得した次の画像:
更新:画像をシャープにすることもできます(たとえば、Laplacian
を使用)。 この議論 を見てください。
より良い結果を得るために、常にガウス分布を適用してください。
cvAdaptiveThreshold(original_image, thresh_image, 255,
CV_ADAPTIVE_THRESH_GAUSSIAN_C, CV_THRESH_BINARY, 11, 2);