まとめ
以上、SOMをデータ表現の基盤として用いたデータマイニングを概観してきました。多くの書籍でデータマイニングにおけるSOMは、可視化による分析手法の1つとして説明されているのですが、それはSOMの1つの側面を説明しているに過ぎません。データマイニングにおけるSOMの役割を一言で言うなら、さまざまな分析を行うための<基盤>だというべきでしょう。
自動車に例えると、SOMはエンジンというよりも、ターボチャージャーの役割を果たします。従来の統計解析の手法は、そのままでは今日の企業で扱われるような大規模なデータ(たとえばテラバイト級のデータ)に適用することが難しかったのですが、SOMによって圧縮されたデータ表現の上で統計解析を行うことより、統計解析をパワーアップさせることができます。
また、もう1つの見方をすると、SOMは従来の統計解析を非線形の領域に広げるための<足場>として利用することができます。ViscoveryのSOMローカル回帰手法では、SOMのノードごとに線形モデルを構築することにより、線形モデルの可読性・可解釈性を生かしながら、全体として非線形に近づけることができ、予測誤差を極小化することに成功しております。
一般的なデータマイニング・システムでは、問題のタイプごとにさまざまな手法を使い分けるようになっています。つまり、クラスタ分析、クラス分類、予測(回帰)といったさまざまな手法があるわけですが、それらの手法はそれぞれ全く異なるもので、それらを統合するような表現方法を持ち合わされておりません。しかし、SOMを基盤とするアプローチでは、それぞれの統計手法の結果をすべて同じSOMという基盤の上で可視化して解釈することができます。
したがって、ViscoveryのSOMテクノロジーは、他のデータサイエンス手法と競合する立場にあるわけではなく、他の手法を併用しながら、それらを統合することが可能です。今後は、これを他のデータサイエンス手法と併用することで得られる独特の効用により、今日的な課題の解決が注目されることになると予想します。これを採用することで、以下のことが可能になります。
- 教師あり/教師なし学習の両アプローチを統一的なビジュアル・ツールで実行できる。
- 他のさまざまな手法・アルゴリズムによる分類・予測モデルを統一的な方法で比較し、局所的なデータ空間ごとに、最も適合するモデルを選択するインテリジェントなアンサンブル予測・分類を実行できる。
- 企業の戦略をモデル化し、データサイエンスで得られる予測・分類モデルと組み合わせることで、企業戦略に合致したデータサイエンスの運用が可能になる。
これらのことについて、また別のコンテンツで詳細に説明する予定です。