私はいくつかの画像処理の本やウェブサイトを読んだことがありますが、画像処理における「エネルギー」という用語の本当の定義はまだわかりません。私はいくつかの定義を見つけましたが、時々それらは単に一致しません。
画像処理で「エネルギー」と言うとき、何を意味するのでしょうか。
画像処理には「エネルギー」の定義が複数あるため、それが使用された状況に応じて異なります。
エネルギーは、MAP(最大アプリオリ)推定などの確率フレームワークの下でマルコフ確率場と組み合わせて操作を定式化するときの「情報」の尺度を記述するために使用されます。エネルギーは、最小化するための負の尺度になる場合もあれば、最大化するための正の尺度になる場合もあります。
それはコンテキストに依存しますが、一般に、信号処理では、「エネルギー」は信号の二乗平均値に対応します(通常、グローバル平均値に関して測定されます)。この概念は通常 Parseval theorem に関連付けられています。これにより、総エネルギーを「周波数」に沿って分布していると考えることができます(たとえば、画像にそのエネルギーのほとんどがあると言うことができます)低周波に集中)。
その他の関連する使用法は、画像の変換です。たとえば、 [〜#〜] dct [〜#〜] 変換(JPEG圧縮方式の基礎)は、ピクセルのブロック(8x8画像)を変換します。変換された係数の行列に;通常の画像の場合、元の8x8画像のエネルギーは64ピクセルに均等に分配されますが、変換後の画像のエネルギーは左上の「ピクセル」に集中します(これも「低周波数」に対応します)。ある意味で)。
エネルギーは、画像の局所的な変化の尺度です。
エネルギーはさまざまな名前と多くの異なるコンテキストを取得しますが、同じものを参照する傾向があります。これは、局所的な領域におけるピクセルの色/明るさ/大きさの変化率です。これは、画像内のエッジに特に当てはまります。圧縮の性質上、これらの領域は圧縮が最も難しく、したがって、これらはより重要であり、エッジまたは急速なグラデーションであることがよくあります。これらは異なるコンテキストですが、同じものを指します。
シームカービングアルゴリズムは、エネルギーの決定(勾配の大きさを使用)を使用して、削除された場合に最も目立たないようにします。 JPEGは、最初のピクセルのエネルギーに対する相対的なピクセルのローカルクラスタを表します。 Snakeアルゴリズムはこれを使用して、画像内のモノのローカル輪郭エッジを検出します。したがって、さまざまな定義がたくさんありますが、それらはすべて、画像の一種の力強さを指します。絶対的な明るさの2乗によるローカルピクセルの合計か、JPEGで圧縮するハードビットか、キャニーエッジ検出のエッジか、勾配の大きさか。
重要なのは、エネルギーはものがあるところにあるということです。
より広義には、画像のエネルギーは、特定の場所のピクセル間の特定の品質の距離です。
適切に重み付けされた2dガウスカーネル内のLABdE2000色距離の合計を取得できます。ここで距離は合計され、局所性はガウスカーネルによって定義され、品質は色であり、距離は2000年からのLABデルタ式です(正誤表:以前はこれはEがユークリッドを表していましたが、標準デルタEの距離はユークリッドです)しかし、94と00の式は厳密にはユークリッドではなく、「E」はEmpfindungを表し、ドイツ語は「感覚」を表します)。輝度の局所的な差のローカル3x3カーネル、または輝度の2乗などを合計することもできます。画像の局所的な変化を測定する必要があります。
この例では、ローカルは2Dガウスカーネルとして定義され、色距離はLabDE2000アルゴリズムとして定義されています。
画像を取得してすべてのピクセルを移動し、何らかの理由で色でソートした場合。画像のエネルギーを減らします。 50%のブラックピクセルと50%のホワイトピクセルのコレクションを取り、最大エネルギーのランダムノイズとして配置するか、最小エネルギーのイメージの両側に配置できます。同様に、100%の白いピクセルがある場合、どのように配置してもエネルギーは0になります。
エネルギーは、(イメージドメイン内の)ユーザー定義関数を説明するために使用されるかなり緩い用語です。
「エネルギー」という用語を使用する動機は、一般的なオブジェクト検出/セグメンテーションタスクがエネルギー最小化問題として提起されることです。私たちは、私たちが望むソリューションをキャプチャし、勾配降下法を実行して最低値を計算するエネルギーを定義し、画像セグメンテーションのソリューションをもたらします。
画像の「エネルギー」は、画像の Shannon entropy に反比例する必要があります。ただし、すでに述べたように、イメージエネルギーは疎結合の用語なので、代わりに「圧縮性」の用語を使用する方が適切です。つまり、高画像の「エネルギー」は、高画像圧縮率に対応する必要があります。
http://lcni.uoregon.edu/~mark/Stat_mech/thermodynamic_entropy_and_information.html
(カメラでキャプチャされた自然画像の場合)光がエネルギーであると考える場合、エネルギーをあるチャネルのピクセルの値と呼ぶことができます。
しかし、私はエネルギーによって本がスペクトル密度に言及していると思います。ウィキペディアから:
エネルギースペクトル密度は、信号または時系列のエネルギー(または分散)が周波数とともにどのように分布するかを示します
私の化学に戻ると、エネルギーとエントロピーは密接に関連した用語です。また、エントロピーとランダムネスも密接に関連しています。したがって、画像処理では、エネルギーはランダムネスに似ている可能性があります。たとえば、無地の壁の写真はエネルギーが低く、ヘリコプターから撮った都市の写真はエネルギーが高い場合があります。
エネルギーは、画像の正規化されたヒストグラムに基づいて定義されます。エネルギーは、グレーレベルがどのように分布しているかを示します。グレイレベルの数が少ない場合、エネルギーは高くなります。
私はこれを画像処理の本で見つけました。
エネルギー:S_N = sum (from b=0 to b=L-1) of abs(P(b))^2
P(b) = N(b) / M
ここで、M
は、_(j,k)
_を中心とした近傍ウィンドウ内のピクセルの総数を表し、N(b)
は、同じウィンドウ内の振幅のピクセル数を表します。
エントロピーのあるこの方程式を見れば、理解が深まるかもしれません。
エントロピー:S_E = - sum (from b=0 to b=L-1) of P(b)log2{P(b)}
出典:Pp。ウィリアムK.プラット(第4版)による538〜539デジタル画像処理
エネルギーは「イメージにある情報」のようなものです。画像の圧縮はエネルギー損失を引き起こします。そのようなものだと思います。
スネークアルゴリズムは、オブジェクトの輪郭を決定するために使用される画像処理技術です。スネークは、いくつかの制約付きの(X、Y)ポイントのベクトルにすぎません。その最終的な目標は、オブジェクトを囲み、その形状(輪郭)を記述することです。次に、その形状によってオブジェクトを追跡または表現します。
アルゴリズムには、内部と外部の2種類のエネルギーがあります。
内部エネルギー(スネークエネルギー)(IE)は、ユーザーが定義したエネルギーで、ヘビに(内部で)作用して、スネークの滑らかさを制限します。このような力がないと、ヘビの形状はオブジェクトの正確な形状になります。 、これは望ましくありません。光の状態、画像の品質、ノイズなどのために、オブジェクトの正確な形状を取得することが非常に難しいためです。
外部エネルギー(EE)はデータ(画像強度)から発生し、xとy方向の強度の絶対差(強度勾配)に-1を掛けたものであり、内部エネルギーと合計されます。総エネルギーを最小限に抑える必要があるためです。したがって、すべてのスネークポイントの合計エネルギーを最小化する必要があります。理想的には、エッジがある場合にこれが当てはまります。これは、エッジまたは(EE)の勾配が最大化され、-1が乗算されるため、最も近いオブジェクトの周りのヘビが最小化されるため、アルゴリズムはソリューションに収束します。ソリューションは、調査したオブジェクトの真の輪郭であると期待されます。
このアルゴリズムは、エッジだけでなくノイズの多いポイントも高いEEに依存しているため、スネークアルゴリズムが最適なソリューションに収束しない場合があり、それが近似の貪欲なアルゴリズムである理由です。
信号処理のエネルギーは、信号境界内の信号平方の積分です。 2次元信号を含むアナロジーを作成でき、ピクセル値を二乗してすべてのピクセルの合計を計算できます。
拡散光源をレンダリングしている現在のイメージングプロジェクトでは、エネルギーを光エネルギーまたは放射エネルギーと見なしたいと思います。私が最初に持っていた質問:RGB「ピクセル値」は光エネルギーを表しますか?これは、光度計を使用して、0〜255のグレーピクセル値(n、n、n)で後続の画面を生成することでアサートできます。 matlabsフォーラム によると、1グレースケールピクセルの放射エネルギーは常にそのピクセル値に比例しますが、ピクセルごとにわずかに異なります。
エネルギーに関する別の仮定があります。前方レイトレーシングの実行中に、サンプリングされた各位置ヒットでレイcountを生成します。この光線数は、この位置でターゲットに当たる放射エネルギーに比例するか、できればそれに比例する必要があります。撮影した実際の写真と比較できるようにするために、光線数をあるピクセル値の範囲に正規化する必要があります。 。