Huginの製品・サービスはマインドウエア総研により翻訳・提供されています。pict

テクノロジーの詳細

このテキストは、ベイジアンネットワーク、条件付き独立、推論、インフルエンス・ダイアグラム、条件付きガウシアン変数によるネットワークの概要を提供する。ベイジアンネットワークまたはインフルエンス・ダイアグラム・テクノロジーに基づくドメイン・モデルが、グラフィカル・ユーザー・インタフェースのシェルである Hugin GUIを用いて構築できる。Hugin知識ベースを用いたスタンドアローン・アプリケーションが、アプリケーション開発者にすべてのファシリティを提供するライブラリであるHugin decision engineを用いて構築できる。

ベイジアンネットワークとは

ベイジアンネットワークは、内在する不確実性によって特徴づけられたドメインをモデルするために使用できる(この不確実性は、ドメインの不完全な理解、タスクが実行されている現時点でのドメインの状態の不完全な知識、ドメインの行動またはそれらの組み合わせを支配するメカニズムにおける偶然性などに起因する)。

正式には、ベイジアン信念ネットワークは、下記のように定義される:

定義 (ベイジアンネットワーク)

ベイジアン信念ネットワークは、下記の特性を持つ非循環有向グラフである:

math_cpt

ノードは確率変数を、エッジは変数間の確率的依存性を表現する。これらの依存性は、条件付き確率表(CPT)の集合によって数量化される。各変数は、その親を所与とする変数のCPTを割り当てられている。親を持たない変数については、これは無条件(マージナル:周辺 ともいう)分布である。

事例 1

 asia

 

図 1: グラフは、肺病に関する医療知識のアスペクトを表現している。

図 1 は、下記の擬似的な医療知識の断片を示します:

"呼吸困難 (息切れ) [d] は、結核 [t], 肺がん [l] 気管支炎 [b], またはどれでもないか、あるいはそれらのうちの1つ以上か起因するだろう。アジアへの最近の訪問 [a] は、結核のリスクを増大し、一方、喫煙[s] は、肺がんと気管支炎の危険因子として知られている。単一胸部X線の結果 [x] は、肺がんと結核を判別しないし、呼吸困難の有無でも判別しない"[Lauritzen&Spiegelhalter88]

最後の事は、中間の変数eによってグラフ中で表現されている。この変数は、2つの親(tとl)の論理和である;それはどちらか一方の病気の存在または両方の存在を集約する。

ベイジアン信念ネットワークの重要なコンセプトは、条件付き独立である。変数の2つの集合、AとBがあり、もし第3の変数Cの値が既知であり、変数Bの値についての知識が、変数Aの値についてのさらなる情報を提供しないならば、AとBは(条件付き)独立であるという。

tech_indep

条件付き独立は、下記のようにグラフから直接読み取ることができる:A、B、C がバラバラな変数の集合だとして、そして

  • ABCとそれらの祖先を含む最小のサブ・グラフを識別する
  • 共通の子を持つノードの間に無向エッジを追加する
  • すべての有向エッジの向きを落とす

それで、もしA内の変数からB内の変数へのすべてのパスがC内の変数を含んでいるなら、AはCを仮定して(Cの条件のもとで)Bから条件付き独立である。 [Lauritzen et.al.90]

事例 2

もし患者が喫煙者であるとわかれば、我々は肺がんと気管支炎に関する信念を調整(リスクの増大)するだろう。しかしながら、結核に関する信念は変更されない(すなわち、tは変数の空集合の仮定のもとで、sから条件付き独立である)。 今、ある患者について陽性のX線の結果を得ると仮定する。これは、結核と肺がんに関する我々の信念に影響するが、気管支炎に関する信念には影響しない(すなわち、bはsの仮定のもとで、xから条件付き独立である)。しかしながら、我々はその患者が呼吸困難に苦しんでいることも知っていて、X線の結果は、気管支炎に関する我々の信念にも影響する(すなわちbはsとdの仮定のもとで、xから条件付き独立でない)。

これらの依存(独立)が、上記に説明された方法を用いて図1からすべて読み取れる。

条件付き独立を決定する別の方法は、Pearによるd分離がある [Pearl88].

推論

ベイジアンネットワークにおける推論は、他の変数での情報(エビデンス)のもとで、いくつかの変数についての条件付き確率を計算することを意味する。

これは、興味対象の変数の祖先である変数上で、すべてのエビデンスが利用可能である場合には簡単である。しかし、興味対象の変数の子孫である変数上にエビデンスがある場合、我々はエッジの方向に反して推論を実行しなければならない。この目的のために、我々はベイズの定理を採用する:

tech_bayes

Hugin開発環境で用いられる推論は、本質的にベイズの定理の気の利いた応用である。 詳細は、 [Jensen et.al.90(1)]に述べられている。

インフルエンス・ダイアグラム

インフルエンス・ダイアグラムは、決定と効用(インフルエンス・ダイアグラムの確率変数は、しばしばチャンス変数(偶然変数)と呼ばれる)が付け加えられた信念ネットワークである。決定ノードへのエッジは、時間優先を示す:確率変数から決定変数へのエッジは、決定がなされるとき確率変数の値が既知であることを示し、1つの決定変数から別の決定変数へのエッジは、対応する決定の時間的順序を示す。ネットワークは、非循環でなければならず、ネットワーク内のすべての決定ノードを含む有向パスが存在しなければならない。

我々は、我々のアプリケーションの最も可能な意思決定に興味がある。したがって、我々は、効用をネットワークの状態設定に関連づける。これらの効用は、効用ノードで表現される。各効用ノードは、その親の状態の各設定が効用に関係する効用関数を持つ。(効用は子を待たない)。 意思決定によって、我々はネットワークの設定の確率に影響を与える。したがって、我々は各決定の代案の期待される効用を計算できる(全体効用関数は、局所効用関数の総和である)。我々は、最高の期待効用で代案を選択しよう;これは最大期待効用原理として知られている。

我々がインフルエンス・ダイアグラムの第1の決定ノードの親である変数の値を観察したとき、我々はこの決定の代案についての最大期待効用を知りたい。Hugin decision engineは、未来のすべての決定が(各決定時の利用可能はすべてのエビデンスを用いて)最適な方法でなされるという仮定のもとに、これらの効用を計算する。残りの決定にも同様な考慮を適用する。

Hugin開発環境でのインフルエンス・ダイアグラムの実装に内在する計算方法は、[Jensen,Jensen,Dittmer94]に説明されている。

事例 3

oil

図 2: 石油採掘者の意思決定問題に関するインフルエンス・ダイアグラム.

T は、試験をするかどうかの決定を表す;D は、採掘するかどうかの決定を表す;represents the decision whether to drill or not to drill; S は(もし石油採掘者が試験を決定したら)地震探査試験の結果を表す;H は,穴の状態を表す;C は、地震探査試験に関連するコストを表す;P は採掘に関連する期待される報酬を表す。

石油採掘者は、採掘するかどうかの決定を下さなければならない。彼は、穴が乾燥しているか、湿っている、浸っているか確かではない。$10,000のコストで、石油試掘者は、その場所の内在的な地質構造の決定を助ける地震探査を行なえる。探査は、地形が閉じた構造(良好)、開いた構造(まあまあ)、無構造(劣悪)のいずれであるかを明らかにする。

採掘のコストは$70,000である。もし石油採掘者が採掘を決断すれば(すなわち、石油発見の価値マイナス採掘のコスト)は、穴が乾燥している場合は$-70,000、穴が湿っている場合は$50,000、穴が浸っている場合は$200,000、石油採掘者が採掘しないと決断すれば、報酬は(もちろん) $0である。

専門家は、穴の状態について以下の確率分布を推定した: P(dry)=0.5, P(wet)=0.3, および P(soaking)=0.2。さらに、地震探査試験は完全ではない;穴の状態を仮定した試験に結果についての条件付き確率は、

dry wet soaking
closed structure 0.1 0.3 0.5
open 構造 0.3 0.4 0.4
no structure 0.6 0.3 0.1

図 2 は、石油試掘者の意思決定問題についてのインフルエンス・ダイアグラムを示す。確率変数は円で描かれ、決定変数は四角形で描かれ、効用は、ダイアモンドで描かれる。

インフルエンス・ダイアグラムの基盤上で、Hugin decision engineは、試験に関連づけられた効用が$22,500であると、 試験に関連づけられていない効用が$20,000であると計算する。そして、最適な戦略は地震探査試験を実施することであり、したがって、試験の結果に基づいて、採掘するかどうかを決定する。

[この事例はRaiffa [Raiffa68]による。この事例のより徹底した説明は、事例の章で述べる。]

条件付きガウス変数を持つベイジアンネットワーク

最近、Hugin開発環境は、離散および連続の確率変数の両方を持つネットワークを取り扱うように拡張された。 連続確率変数は、親の値を条件とするガウス分布(または正規分布として知られる)を持つはずである。

離散値の親Iと連続値の親Zを持つ連続値Yについての分布は、親の値を条件とする(1次元)ガウス分布である。

tech_normal

平均は連続値の親変数に線形的に依存し、分散は連続値の親変数に依存しないことに注意せよ。しかしながら、線形関数と分散の両方は、離散値の親変数に依存することができる。 これらの制約は、正確な推論が可能であることを確かにする。

離散変数は、連続値の親を持つことができない。

事例 4

図 3 は、廃棄物焼却炉に関する信念ネットワークを示す:

"廃棄物焼却炉からの(ダストと重金属の)放出は、受け入れ廃棄物[W]の組成的差異に起因して異なる。その他の重要因子は、 廃棄物の焼却方法[B]で、それは放出[C].におけるCO2の濃度測定によって監視できる。フィルタ効率 [E] は、エレクトロフィルタの技術的状態 [F] と廃棄物[W]の量と組成に依存する。重金属の放出 [Mo] は、一般に受け入れ廃棄物の金属濃度[Mi] とiダスト粒子の放出[D] の両方に依存する。ダストの放出[D]は、光の透過性 [L]の測定によって監視される。"( [Lauritzen92]より)

waste

図 3: 廃棄物焼却炉モデルの構造的:
B, F, および W は、離散変数、一方、残りの変数は連続値。  

条件付きガウス変数を含むベイジアンネットワークの推論の結果は、エビデンスを仮定した個々の変数の信念(周辺分布)である。離散変数については、これは、(いつもどおり)変数のステートに対する確率分布になる。条件付きガウス変数については、次の2つの測度が与えられる。:

  1. 平均と分布の分散
  2. 一般的に分布は単純なガウス分布ではなく、ガウス分布の混合(つまり加重和)になるので、各ガウス分布についての母数の一覧(重み・平均・分散)が利用できる

事例 5

図3に示したネットワーク(および、離散変数B、F、Wがすべてバイナリであることを仮定)から、次のようなことがわかる。

  • Cの分布は、2つまでのガウス分布からなり得る(もしBが例示されているならばガウス分布はひとつ)
  • 最初に(つまり、どのエビデンスも入力されていない時)、Eの分布は4つまでのガウス分布からなる
  • Lが例示される場合(かつ、B・F・Wのいずれも例示されていない場合), Eの分布は8個までのガウス分布からなる