データ分析ツールは、データ特性の要約とデータ・ポイントの視覚的な精査を提供します。データ分析ツールは、データ行列について利用可能です。
データセットの特性の要約は、Summaryパネルにあります(図 1)。
図 1: データセット特性の要約 |
生成された要約は、次のことをレポートします:
Inspectionパネルは、選択された列のすべての値を1つのグラフにプロットして、数値データ・ポイントの視覚的な精査を提供します。
選択された列のデータ・タイプによって、グラフは、ドットの集合(数値データ X 数値データ)、線(数値データ X 離散データ)、グリッド(離散データ X 離散データ)の形式をとります。
図2のInspectionパネルは、数値データから生成されたプロットです。
図 2: 数値データ・ポイントの精査プロット - 欠損値はグラフの外側にプロットされます |
グラフを生成するのに3つの列が使用できます: X-軸、Y-軸、そして色づけ。列は、ドロップダウン・リストから選択できます。ドロップダウン・リストは、データ・タイプによって、 数値データは(n)、 区間データは(i)、 テキスト・ラベルは(t)のいずれかが接頭された列名からなります。
欠損値は、3つのルールに従ってグラフの外側に置かれます:
Classesパネルは、 選択されたターゲット・クラスを用いて変数を分類することにより、離散変数の精査を提供します。
変数とターゲット・クラスを選択すると、カウントの表と列ダイアグラムが生成されます。ダイアグラムで列をクリックすると、クリックされた列部分に対応する表中のエントリがハイライトされます。ダイアグラムの上にマウス・カーソルを置くと、対応する配置(configuration)もレポートします。
図 3 の classes パネルは、それぞれ2つのステートを持つ2つの離散変数を用いた分類に関するダイアグラムを示してます。
図 3: 離散変数を用いた分類の精査 |
翻訳者:多田くにひろ(マインドウェア総研)