Interpolated Kneser-Ney smoothingについて解説する
やぎです.先日スムージング手法について調べる機会があり,その際にInterpolated Kneser-Ney smoothingについて日本語でまとめているサイトがなかったので,ここに自分なりにまとめます.
Interpolated Kneser-Ney smoothing
Kneser-Ney smoothingは,絶対割引補間から発展した.2-gram言語モデルの絶対割引補間は,をのトレーニングコーパスにおける出現回数,固定割引値を,正規化定数をとして,以下の式で与えられる.
ここで,San Franciscoの例を考える.このフレーズが,与えられたトレーニングコーパスに豊富にあると仮定する.以下の2つの文
では,上の文の確率のほうが高くなってほしいが,上記仮定より, < となり,式(1)より,与えられたトレーニングコーパスにreading glassesという2-gramがあまり存在しなければ,下の文の確率のほうが高くなってしまうかもしれない.このような問題を解決するために,Kneser-Ney smoothingは,絶対割引補間の2番目の項を以下のように書き換える.
与えられたトークンに対するこの確率は,そのが完成させる2-gramの語彙数に比例する.
この量は,2-gramの語彙数で割ることによって正規化される(は自由変数).
は単に,が出現する可能性がどれほどあるのかを表すのに対して,は,がunfamiliarな2-gramの文脈の中に出現する可能性がどれほどあるのかを表す.以上をまとめて,2-gram言語モデルのKneser-Ney smoothingは,をの後に続く語彙数として,以下の式で与えられる.
まとめ
今回は,スムージング手法のひとつであるInterpolated Kneser-Ney smoothingについて解説しました.Hatena Blogでを書くのは初めてでしたが,きれいに書けたのでよかったです.
ではまた!