web-dev-qa-db-ja.com

マルコフ連鎖と隠れマルコフモデルの違いは何ですか?

マルコフ連鎖モデルと隠れマルコフモデルの違いは何ですか?ウィキペディアで読みましたが、違いがわかりませんでした。

44
good_evening

例で説明するために、自然言語処理の例を使用します。この文章の確率を知りたいと想像してください:

私はコーヒーを楽しんでいます

マルコフモデルでは、次の計算によって確率を推定できます。

P(Word = I) x P(Word = enjoy | PREVIOUS_Word = I) x P(Word = coffee| PREVIOUS_Word = enjoy)

ここで、この文の品詞タグを知りたいと想像してください。つまり、Wordが過去形動詞や名詞などである場合です。

その文では品詞タグを観察しませんでしたが、そこにあると想定します。したがって、品詞タグシーケンスの確率を計算します。私たちの場合、実際のシーケンスは次のとおりです。

PRP-VBP-NN

(ここで、PRP =「個人代名詞」、VBP =「動詞、3人称以外の単数形の存在」、NN =「名詞、単数形または質量」。 https:// cs。 nyu.edu/grishman/jet/guide/PennPOS.html Penn POSタギングの完全な表記について)

ちょっと待って!これは、マルコフモデルを適用できるシーケンスです。しかし、品詞シーケンスが直接観察されることはないため、これを非表示と呼びます。もちろん実際には、このようなシーケンスを多数計算し、観察結果を最もよく説明する非表示のシーケンスを見つけたいと思います(たとえば、「the」、「this」などの単語は、決定子から生成される可能性が高くなります( DET)タグ)

私が今まで遭遇した中で最も良い説明は、1989年のLawrence R. Rabinerによる論文です: http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf

38
matt

マルコフモデルは状態マシンであり、状態変化は確率です。隠れマルコフモデルでは、確率はわかりませんが、結果はわかります。

たとえば、コインを裏返すと確率を得ることができますが、裏返しが見えず、コインが裏返されるたびに誰かが5本の指のいずれかを動かすと、指の動きを取り、非表示のマルコフモデルを使用してコイン投げの最高の推測を取得します。

26
TechEffigy

私が理解しているように、質問は次のとおりです。マルコフプロセスと非表示マルコフプロセスの違いは何ですか?

マルコフプロセス(MP)は、以下の確率的プロセスです。

  1. 有限数の州
  2. これらの状態間の確率的遷移
  3. 現在の状態によってのみ決定される次の状態(Markovプロパティ)

隠れマルコフプロセス(HMM)は、以下の確率的プロセスでもあります。

  1. 有限数の州
  2. これらの状態間の確率的遷移
  3. 現在の状態(Markovプロパティ)によってのみ決定される次の状態AND
  4. 現在の状態がわからない:現在の状態から観測結果が出ています。

例-(HMM)株式市場
株式市場では、人々は会社の価値と取引します。シェアの真の価値が100ドルであると仮定しましょう(これは観察不可能であり、実際にはそれを知ることはありません)。実際に表示されるのは取引される値です。この場合は$ 90と仮定します(これは観察可能です)。

マルコフに興味がある人のために:興味深い部分は、これらのモデルでアクションを開始するときです(前の例では、お金を稼ぐため)。これは、マルコフ決定プロセス(MDP)と部分的に観察可能なマルコフ決定プロセス(POMDP)に適用されます。これらのモデルの一般的な分類を評価するために、各マルコフモデルの主な特性を次の図にまとめました。

Classification of different Markov Models

11

MattはHMMの例として品詞タグを使用したので、もう1つの例、音声認識を追加できます。ほとんどすべての大きな語彙連続音声認識(LVCSR)システムは、HMMに基づいています。

「マットの例」:私はコーヒーを楽しむ

マルコフモデルでは次の計算により確率を推定できます。

P(Word = I) x P(Word = enjoy | PREVIOUS_Word = I) x P(Word = coffee| PREVIOUS_Word = enjoy)

隠れマルコフモデルでは

30人の異なる人が文章を読んだとしましょう"私は抱き締めるのを楽しみます"そして私たちはそれを認識しなければなりません。この文の発音は人によって異なります。したがって、その人が「抱き締める」または「独り占め」を意味していたかどうかはわかりません。実際の単語の確率分布のみが得られます。

つまり、隠れマルコフモデルは、統計的マルコフモデルであり、モデル化されるシステムは、観測されていない(隠れた)状態を持つマルコフプロセスであると見なされます。

7
Aerin

隠れマルコフモデルは、2つのレベルを持つ二重埋め込み確率過程です。

上位レベルはマルコフ過程であり、状態は観測できません。

実際、観測は上位レベルのマルコフ状態の確率関数です。

マルコフ状態が異なれば、観測確率関数も異なります。

0
sahel