(血統の分野の最低限の知識が必要)
種馬 Alan は母馬 Ann との間にBetsy を,母馬 Alice との間に Bennyを得た.Betsy は Bill との間に Carlを産み,Benny は Bonnie との間の Cecilyを得た.Bill と Bonnie は両方ともAnnから生まれているが, 彼らの父親 (A1 および A2) はまったく関係がない.Carl と Cecily は雄の子馬 Dennisのみを産んでいる.
図1: Dennisの血統 |
結局,Dennis は,受け継いだ遺伝子a による生命にかかわる遺伝病を患っていることがわかった.一致する優性遺伝子は A である.Dennisは即座に安楽死させられるほどその病気は重篤で, 種馬飼育場はその遺伝子を生産から排除したいので,Carl とCecily を繁殖から外した.彼らは両方とも遺伝型 Aa の遺伝子を持つはずだからである.
ここで問題は次のことである.他にどの馬を繁殖から外すべきか? Bonnie がとても素晴らしい雌馬であるのに対して,Alanは生産においてより簡単に置き換えができる. 種馬飼育場はどうすることが一番良いか? それには,病気の遺伝子のキャリアである確率を各馬について知ることが良いであろう.キャリアである確率は,通常0.01であることが知られている.
種馬飼育場での遺伝子継承のドメインは,ベイジアンネットワーク(BN)で簡単にモデルできる. 実際,図1の血統は,各ノードに条件付き確率表(CPT)を与えるだけでBNになる.まず,我々はノードのステートを指定する : Dennis を除くすべての馬は,どれも病気ではないので, (Aa) を持つか,または(AA) を持たない.それらにステート "AA" と "Aa" を与える.図1の上位レイヤの各ノードは,表1に示すCPTを持つ.Dennis を除くその他は,表2に示す CPT を持つ.Dennis は表3に示すCPT を持つ.
|
||||
表 1: 上位レイヤのノードのCPT (例としてAlan を使用). |
|
|||||||||||||||||||
表 2: 中間レイヤのノードのCPT (例としてBetsy を使用). |
|
||||||||||||||||||||||||
表 3: ノード DennisのCPT: P(Dennis | Carl, Cecily). |
このBN は,30分もかからずにHugin グラフィカル・ユーザー・インタフェースを用いて実装された.そして,Dennis が aa であるというエビデンスが投入されて,sum伝播が実行された.その結果を図2に示す.
図 2: 馬が病気の遺伝子 (Aa) を持つ確率 |
図2では, Betsy が病気の遺伝子のキャリアでありそうなことがわかる.彼女の親(Ann と Alan)は両方とも) キャリアである確率が高い.ただし,より徹底した調査は,それらの両方が同時にキャリアでありそうなことを示す.図3では,もしAlan がキャリアであることがわかっているなら,Ann もかなりキャリアでありそうだということになることがわかる.これは,病気の遺伝子が片親のみから継承されるからである.この図は, その遺伝子がAlan から Betsy に,そして Benny から Carl と Cecilyに継承されていることを示す.
この結果に対する結論は,飼育場主がどれぐらい確かに病気の遺伝子を生産から排除したいかによる.彼が良い馬を排除しないとは絶対に言い切れないが,少なくともBetsy,Ann, Bonnieを排除するべきである.Alanは簡単に置き換えられるので,これも排除したいという場合, もしAlan が病気の遺伝子を持つならBennyはたぶんそれを継承しているので,もし彼がBennyも排除しないなら,Alanを排除しても効果はない.
図 3: Alan が病気の遺伝子のキャリアであると仮定した場合,この図はAnn がおそらくキャリアではないことを示す. |
Huginのダウンロード・サイトにもこのサンプルがあります.
たとえば,医療診断と治療,顧客の信用評価,鉱物の探索,バイオ生産プラントの監視,画像の認識,情報検索,故障解析など,さまざまな領域で上記の事例と共通の特徴がある.
これらの領域は,因果構造で特徴づけられる.ここで結果は完全に決定論的ではない.あるときはイベントが1つの結果を持ち,またあるときは他の結果を持つ.この現象は,原因不確実性(causal uncertainty)と呼ばれる.原因不確実性で特徴づけられるドメインはBNでモデルできる.
この領域のもう1つの特徴は,本質的な特徴の多くが直接には観測できないことである.これは診断問題(diagnosis problem)である.症状だけがわかっていて,それらから原因を結論づけなければならないという問題である.強いて言えば,ネットワーク中のリンクの方向と反対に推論しなければならない.
翻訳者:多田くにひろ(マインドウェア総研)