PC アルゴリズム

構造学習には2つのアルゴリズムがあります: PCアルゴリズムとNPC アルゴリズム.

Huginの PC アルゴリズムは,Spirtes, Glymour & Scheines (2000)によるオリジナルのPCアルゴリズムの改良型で,制約ベース学習アルゴリズムの類に属します.これらのアルゴリズムの基本アイデアは,統計的検定による条件付き独立および従属ステートメント(CDIs)の集合を導出することです.

このアルゴリズムは以下のステップを実行します:

PCアルゴリズムに関する重要なことの1つは,一般的に,それがデータからすべてのリンクの方向を導くことができなくて,したがって,いくつかのリンクがランダムに方向づけされることです.これは,学習された構造が検査されるべきで,もしいくつかのリンクが直観に反しているようであれば(たとえば,汗が熱の原因になるというようなあべこべ),学習ウィザード(構造的ドメイン知識を指定する方法を提供)または NPC アルゴリズム(無向リンクの方向性をインタラクティブに決定できる)の使用を検討できることを意味します.

従来の制約ベース学習アルゴリズムは,無限のデータ集合,完全な検定,DAG忠実性(すなわち,データがDAGによって分解する確率分布からシミュレートされてると仮定できること)を仮定して,正しいであろう構造を産出します.しかしながら,限定されたデータ集合の場合, これらのアルゴリズムは,しばしば,多すぎる条件付き独立ステートメントを導きます.また,それらは重要な従属関係を省略することもあります.

一般的に,NPCアルゴリズムを使用することが推奨されます.結果のグラフは,データ中の(条件付き)独立関係のより良いマップになるでしょう.とくに,データ集合が小さい場合,NPCアルゴリズムが実行されるべきです.ただし,NPCアルゴリズムは,PCアルゴリズムよりも実行時間が長くかかります.


Back

翻訳者:多田くにひろ(マインドウェア総研