適応アルゴリズム(逐次更新)は、挿入され伝播されたエビデンス(すなわち、経験)を考慮して、ベイジアンネットワークの条件付き確率を更新します。適応アルゴリズムは、離散確率ノードにのみ適用されます。このアルゴリズムは、グラフィカルな構造と条件付き確率分布の初期設定が存在しているけれども、モデルされたドメインが時間とともに変化したり、モデルが不完全だったり、または単純にモデルがドメインを繁栄していないときなどに役立ちます。
この節では、条件付き確率表の逐次更新の概観を提供します。これは、読者がベイジアンネットワークやインフルエンス・ダイアグラムの手法、さらにHuginグラフィカル・ユーザー・インタフェース(このグラフィカル・ユーザー・インタフェース)に親しんでいることを前提にします。
ベイジアンネットワークの基本コンセプトは、ベイジアンネットワーク入門に説明しています。同じ節でインフルエンス・ダイアグラムについても学ぶことができます。Huginグラフィカル・ユーザー・インタフェースへの入門は、チュートリアル 小規模なベイジアンネットワークを参照してください。
適応 または 逐次学習としても知られる逐次更新は、オブザベーションがなされたドメインの条件付き確率分布を更新して改善することを可能にします。適応は、とくにモデルが不完全な場合、モデルされたドメインが時間とともに変化する場合、または、単純にモデルがドメインを適切に反映していない場合に役立ちます。適応の前に、グラフィカルな構造と条件付き確率分布の初期設定が存在しなければならないことに留意してください。
Huginに実装されている適応アルゴリズムは、 Spiegelhalter
& Lauritzen (1990)によって開発されました。
このアルゴリズムのより詳細な数学的説明は、Cowel &
Dawid (1992)
および Olesen et al. (1992) の論文も参照してください。
Spiegelhalter と Lauritzen は、経験(experience)の概念を導入しました。
経験は、数量的な専門家の判断と過去のケースの両方に基づくことができる数量的記憶です。経験の散布(Dissemination)は、ネットワーク中の変数の事前条件付き分布を計算するプロセスのことです。 経験の回復(Retrieval)は ネットワーク中の条件付き分布を決定するパラメータの更新された分布を計算するプロセスのことです。
手短に言うと、適応アルゴリズムは、挿入され伝播されたエビデンス(すなわち経験)を考慮して、ベイジアンネットワークの条件付き確率分布を更新します。適応は、離散確率ノードにのみ適用できることに注意してください。
所定の離散確率ノードの経験は、経験カウント(数)の集合Alpha0,...,Alphan-1で表現されます。ここで、n は、そのノードの親のコンフィギュレーションの数で、すべてのiでAlphai > 0 ; Alphaiは、その親がi番目のコンフィギュレーションで観察された回数です。ただし、カウントは、整数である必要はなく、任意の(正の)実数でも構いません。したがって、カウントは単に概念的なものです。経験カウントは経験表として知られる表に格納されています。
経験表が作成されると、ゼロが記入されます。ゼロは無効な経験カウントなので、適応が実行できる前に、表に正値が格納されなければなりません。 適応アルゴリズムは、正の経験カウントを持つ親のコンフィギュレーションに対応する条件付き分布だけを適応させます。その他のコンフィギュレーション(経験表を持たないノードのコンフィギュレーションを含む)は無視されます。この慣例は、個々の親コンフィギュレーションのレベルで適応をオン/オフするために使用できます: 経験カウントを正値に設定すると、関連する親コンフィギュレーションの適応がオンになり; ゼロまたは負値に設定すると、オフになります。
経験表は削除できます。これは、その経験表に関連するノードの適応がオフになり、初期条件付き分布は、削除時のそのノードの条件付き分布に等しくなることに注意してください。
適応アルゴリズムは、オプションの減退(フェーディング) 機能も提供します。この機能は、ドメイン・モデルが環境の変化に適応するように、過去の(古くなったであろう)経験の影響を減少させます。これは、減退係数Deltaiによって経験カウントAlphai
を減らすことで実現されます。 Deltaiは、通常、1に近い1未満の正の実数です。実際の減退量は、問題の親コンフィギュレーションの確率に比例してなされます。正確には: 伝播されたエビデンスが与えられたi番目の親がpiの場合、適応が実行される前にAlphai に (1-pi)+piDeltaiを乗じます。
伝播されたエビデンスに矛盾する親コンフィグレーション(すなわち、pi = 0のコンフィグレーション)に対応する経験カウントは、変更されないままであることに注意してください。
適応を起動するには、適応ボタン を使用できます。
適応は、連続値ノードをサポートしていません。
翻訳者:多田くにひろ(マインドウェア総研)