クラスター分析は多変量解析の一種で、与えられたデータについて似たものを集めて、集落(クラスター)として分類する統計手法です。
下図のように、樹形図(デンドログラム)で表現されます。
何段階もの分岐点があり、その分岐により、一つのまとまり(クラスター)として分類します。下図でいうと、丸で囲んだデータがそれぞれ一つのクラスターであり、似たものとして分類されます。
(イメージ)
なお、各データの類似度についてはユークリッド平方距離、標準化ユークリッド距離、マハラノビスの距離、ミンコフスキー距離などがあり、樹形図を作成する際には最短距離法、最長距離法、群平均法、重心法、メジアン法、ウォード法などがあります。
コメント