自動クラスタリングとクラスタリング調整
ViscoveryではSOMの学習が終了すると、デフォルトのSOM-Ward法のクラスタリングが行われた状態でマップが表示されます。自動でクラスタ数の打ち切りが実行されて、その結果が表示されます。通常の統計ソフトの階層型クラスタ分析では、デンドログラムがクラスタリングの結果の視覚的表現として使用されますが、ViscoveryはSOMという強力な可視化方法があるので、デンドログラムは使用しません。
Viscoveryでは自動打ち切りされらクラスタ数だけでなく、自由にクラスタ数を変更して、その結果を表示させることができます。クラスタ数の変更と、後で触れる「プロファイル分析」を用いて、探索的分析を行うことがクラスタリング(クラスタ分析)の極意です。すなわち、クラスタ数の自動打ち切りは、探索的分析の開始点を提供するものであり、最終結果ではありません。
クラスタリング調整ダイアログ
クラスタ数の自動打ち切りは、通常の統計ソフトと同様、エルボー法に基づきます。階層型クラスタリングは、最初にすべてのオブジェクト(通常のクラスタ分析ではデータポイント、SOM-Ward法ではノード)が1個ずつバラバラな状態から開始して、最も近いオブジェクトからステップ・バイ・ステップで併合して行きます。したがって、併合の各ステップでクラスタ内分散(非類似度)が増大します。計算上は、その増大率が高ければ高いほど、併合前のクラスタリングが有意であると考えることができます。
ただし、通常、階層クラスタリングの結果は、未分類から小分類、中分類を経て、大分類に至る全体の構造を示しており、すべてのステップの分類は、それぞれ、それなりに根拠のある分類と考えるべきです。どれかのステップだけが正しく、それ以外はすべて間違いというようなことはありません。通常の統計ソフトの場合も同様ですが、自動打ち切りの結果が客観的な結果だということを意味しているわけではありませんのでご注意ください。
そもそもデータをクラスタリングするときに、何らかの目的があります。マーケティング・キャンペーンの最適化とか、製造工程に最適化などです。それぞれの目的に合わせて、適度な大きさのクラスタを検討するのが合理的です。多くの場合、自動打ち切りのクラスタは大きすぎるかもしれません。
Visocveryではさらに、計算で得られたクラスタを局所的に分割したり、統合したりして、新しいセグメンテーションを自由自在に作成することもできます。クラスタリングとクラス分類のところで述べるような考え方で、このテクニックを使用すると精緻なセグメンテーションモデルを作成できます。