構造学習には2つのアルゴリズムがあります: PCアルゴリズムとNPC アルゴリズム.
Huginの PC アルゴリズムは,Spirtes,
Glymour & Scheines (2000)によるオリジナルのPCアルゴリズムの改良型で,制約ベース学習アルゴリズムの類に属します.これらのアルゴリズムの基本アイデアは,統計的検定による条件付き独立および従属ステートメント(CDIs)の集合を導出することです.
このアルゴリズムは以下のステップを実行します:
PCアルゴリズムに関する重要なことの1つは,一般的に,それがデータからすべてのリンクの方向を導くことができなくて,したがって,いくつかのリンクがランダムに方向づけされることです.これは,学習された構造が検査されるべきで,もしいくつかのリンクが直観に反しているようであれば(たとえば,汗が熱の原因になるというようなあべこべ),学習ウィザード(構造的ドメイン知識を指定する方法を提供)または NPC
アルゴリズム(無向リンクの方向性をインタラクティブに決定できる)の使用を検討できることを意味します.
従来の制約ベース学習アルゴリズムは,無限のデータ集合,完全な検定,DAG忠実性(すなわち,データがDAGによって分解する確率分布からシミュレートされてると仮定できること)を仮定して,正しいであろう構造を産出します.しかしながら,限定されたデータ集合の場合, これらのアルゴリズムは,しばしば,多すぎる条件付き独立ステートメントを導きます.また,それらは重要な従属関係を省略することもあります.
一般的に,NPCアルゴリズムを使用することが推奨されます.結果のグラフは,データ中の(条件付き)独立関係のより良いマップになるでしょう.とくに,データ集合が小さい場合,NPCアルゴリズムが実行されるべきです.ただし,NPCアルゴリズムは,PCアルゴリズムよりも実行時間が長くかかります.
翻訳者:多田くにひろ(マインドウェア総研)