Huginの製品・サービスはマインドウエア総研により翻訳・提供されています。pict

Stud Farm(種馬飼育場)

By: Hugin Expert

.種馬飼育場の例では、種馬飼育場の馬が、生命を脅かすような病気を引き起こす劣勢遺伝子の保菌者である可能性を計算するためにベイジアン・ネットワークが用いられています。

Stud Farm - Download

Stud Farmから構築された事例

種馬Alanは、雌馬Annを種付けしてBetsyを、雌馬Aliceを種付けして、Bennyを生んだ。Betsyは、BillとともにCarlを、BennyはBonnieに種付けしてCecilyを生んだ。BillとBonnieはAnnが産むが、彼らの父(A1 と A2)はまったく関係がない。CarlとCecilyはオスの子馬Dennisを産む。

stud_farm_genes1

図 1: Dennisの家系図

Dennisが劣性遺伝子aによってもたらされる生命を脅かすほどの遺伝病に苦しんでいるのがわかっている。その対応する優性遺伝子はAである。その病気が非常に重いので、Dennisはすぐに安楽死させられ、種馬飼育場はその遺伝子を生産からはずしたいので、CarlとCecilyは二人とも遺伝子型Aaを持つキャリアに違いないから、繁殖からはずされる。

さて問題は: 他にどの馬が繁殖からはずされるべきなのか?である。Bonnieが非常に良い雌馬であるが、一方Alanはより簡単に繁殖で置き換えることができる。種馬飼育場は何をするのが一番であろうか?それぞれの馬が病気のキャリアである確率を知ることがよい。普通、キャリアである確率は0.01だとわかっている。

ベイジアンネットワーク

種馬飼育場における遺伝子継承のドメインは、ベイジアン・ネットワーク(BN)で簡単にモデル化できる。実際、図 1の家系図は、、BNにするためそれぞれのノードの条件付き確率表(CPT)を必要としているだけである。最初、そのノードのステートを指定する:Dennisを除くすべての馬はどれも病気になっていないので、彼らはキャリア(Aa)かそうでないか(AA)のどちらかになる。彼らにステート"AA"と"Aa"をあたえる。図 1の上層部にあるノードそれぞれは、表 1に示すCPTを持っている。Dennisを除く残りの馬たちは表 2に示すCPTを持つ。Dennisは表 3に示すCPTを持っている。

Alan="AA" Alan="Aa"
0.99 0.01
表 1: 上層部のノードのCPT(例としてAlan を使用).
Alan="AA" Alan="Aa"
Ann="AA" Ann="Aa" Ann="AA" Ann="Aa"
Betsy="AA" 1.00 0.50 0.50 0.33
Betsy="Aa" 0.00 0.50 0.50 0.67
表 2: 中間層にあるノードのCPT(例としてBetsy を使用).
Cecily="AA" Cecily="Aa"
Carl="AA" Carl="Aa" Carl="AA" Carl="Aa"
Dennis="AA" 1.00 0.50 0.50 0.25
Dennis="Aa" 0.00 0.50 0.50 0.50
Dennis="aa" 0.00 0.00 0.00 0.25
表 3: DennisのノードのCPT: P(Dennis | Carl, Cecily).

このBNは30分以内でHugin GUIを用いて実装されている。それから、Dennisがaaであるエビデンスが入力され、SUMプロパゲーションが実行される。図 2にその結果を示す。

stud_results2

図 2: その馬が病気の遺伝子のキャリア(Aa)である確率

図 2で、Betsyが病気の遺伝子のキャリアである可能性が非常にあることがわかる。彼女の両親(AnnとAlan)も両方ともキャリアである確率が非常に高い。しかし、より全般的調査により、彼らの両方が同時にキャリアである可能性は非常に低いことを示している。図 3で、もしAlanがキャリアだとわかれば、Annもキャリアである可能性は非常に低くなる。こういったわけで、病気の遺伝子は1頭の馬からのみ、遺伝している。その図では、AlanからBetsyとBennyへ、そこからCarlとCecilyへと遺伝子が遺伝しているのを示している。.

その結果に対する結論は、農夫がどのくらい正確に病気の遺伝子を生産から取り除きたいかに非常に依存している。彼は正しい馬を捨ててしまうことに絶対的確信をもつことはできないが、すくなくともBetsy、Ann、Bonnieは捨てるべきである。Alanは容易に置き換えることができるので、彼はAlanを捨てたいとすると、Alanが病気の遺伝子を持っていた場合Bennyはおそらく病気の遺伝子を継いでいるので、Bennyも捨てないと効果がないことになる。

stud_results3

図 3: Alanが病気の遺伝子を持っていると仮定すると、この図はAnnはおそらくキャリアではないということを示している 

このネットワークはHuginソフトウェアと一緒にコンピュータにインストールされています。Huginでこのネットワークを開いてください。このネットワークは、Huginのインストールの. Samples サブディレクトリにあります。

コメント

たくさんの領域で、上記の例と共通する本質的な特徴がある。たとえば、医療診断や治療、顧客の信用評価、鉱物の探索、生物学的な生産工場のモニタリング、画像理解、情報検索、故障解析

その領域は、効果が完全には決定しなような<原因-結果>構造によって特徴付けられる。ひとつのイベントがある結果を招くこともあれば、別の結果を招くこともある。この現象はcausal uncertainty(原因の不確実性)と呼ばれる。原因の不確実性によって特徴付けられた領域はBNによってモデル化できる。

この領域のその他の特徴は、本質的な属性の数が直接観察できないということである。診断問題では: あなたは症状しかわからない、そしてそれらから原因を結論付けなければならない。そのネットワーク内の矢印の反対方向にいわゆる推論をしなくてはならない。