透明度チャネル(RGBとAlph)が付いた.pngファイルを、運が悪ければロードしようとしています。 openCVは画像から4番目のチャネルを取り除いているようです。 OpenCVソースコードを変更して再構築する必要がある場合でも、アルファチャネルを含む完全な4チャネルでイメージをロードする方法はありますか?
OpenCV 2またはOpenCV 3を使用している場合は、IMREAD_ *フラグを使用する必要があります( ここ で説明されています)。
C++
using namespace cv;
Mat image = imread("image.png", IMREAD_UNCHANGED);
Python
import cv2
im = cv2.imread("image.png", cv2.IMREAD_UNCHANGED)
documentation によると、OpenCVはPNGのアルファチャネルをサポートしています。
次のようなフラグとしてCV_LOAD_IMAGE_UNCHANGEDを使用して、imread関数を呼び出すだけです。
cvLoadImage("file.png", CV_LOAD_IMAGE_UNCHANGED)
透明なPNGを読み取る正しい方法は、4番目のチャネルをアルファチャネルとして使用することです。ほとんどの場合、白い背景が必要です。その場合は、以下のコードをアルファ合成に使用できます。
def read_transparent_png(filename):
image_4channel = cv2.imread(filename, cv2.IMREAD_UNCHANGED)
alpha_channel = image_4channel[:,:,3]
rgb_channels = image_4channel[:,:,:3]
# White Background Image
white_background_image = np.ones_like(rgb_channels, dtype=np.uint8) * 255
# Alpha factor
alpha_factor = alpha_channel[:,:,np.newaxis].astype(np.float32) / 255.0
alpha_factor = np.concatenate((alpha_factor,alpha_factor,alpha_factor), axis=2)
# Transparent Image Rendered on White Background
base = rgb_channels.astype(np.float32) * alpha_factor
white = white_background_image.astype(np.float32) * (1 - alpha_factor)
final_image = base + white
return final_image.astype(np.uint8)
これに関する詳細なブログはこちら こちら 。
4つのチャネルすべてを含むpng画像をロードする最良の方法は、次のとおりです。
img= cv2.imread('imagepath.jpg',negative value)
OpenCVドキュメントに従って、
フラグ値が
1)= 0グレースケールイメージを返します。
2)<0ロードされたイメージをそのまま返します(アルファチャネル付き)。
この透明な画像を別の画像の上に描画したい場合は、@ satya-mallickの回答に従って画像を開き、次の方法を使用します。
/**
* @brief Draws a transparent image over a frame Mat.
*
* @param frame the frame where the transparent image will be drawn
* @param transp the Mat image with transparency, read from a PNG image, with the IMREAD_UNCHANGED flag
* @param xPos x position of the frame image where the image will start.
* @param yPos y position of the frame image where the image will start.
*/
void drawTransparency(Mat frame, Mat transp, int xPos, int yPos) {
Mat mask;
vector<Mat> layers;
split(transp, layers); // seperate channels
Mat rgb[3] = { layers[0],layers[1],layers[2] };
mask = layers[3]; // png's alpha channel used as mask
merge(rgb, 3, transp); // put together the RGB channels, now transp insn't transparent
transp.copyTo(frame.rowRange(yPos, yPos + transp.rows).colRange(xPos, xPos + transp.cols), mask);
}