next up previous
次へ: 階層的クラスター分析の考え方 上へ: クラスター分析 戻る: クラスター分析

クラスター分析とは

$ クラスター分析$(cluster analysis)とは,異質なもののまざり合っている対象の中で,互いに似たものを集めて$ 集落$(クラスター)をつくり,対象を分類しようという方法を総称したもので,数値分類法(numerical classification,numerical taxonomy)とも呼ばれる.症状や検査値にもとづく疾患の分類,財務諸指標による企業の分類,形状や性質による細菌の分類,$ \cdots$といったさまざまな分野に応用されている.
 分析の目的や用途に応じて,いろいろな方法が提唱され,その分類についてもいくつかの考え方があるが,ここではWilliams and Lance(1977)による分類を表11.1に示す. $ 排他的/非排他的$とは,1つの対象がただ1つだけのクラスターに属すか,2つ以上のクラスターに属すことを許すか, $ 外的基隼あり/なし$とは分類のために利用する属性(変数)のほかに,それに合わせるように分類したいような外的な属性をもつかどうか(数量化法における外的基準のあり/なしと同じ意味), $ 階層的/非階層的$とは樹形図で表わされる階層構造を求めるか,単にクラスター内でできるだけ均一で,クラスター間でできるだけ異なるような分類を目ざすか, $ 凝集的/分割的$とは階層的な分類構造を得るのに,1つずつの対象から逐次似たものを集めるか,逆にすべての対象を含む全体から逐次分割していくか, $ 単一側面的/多側面的$とは分割のとき影響の大きい1つだけの属性により分けるか,すべての属性を考慮して分けるか,をそれぞれ表わす.

表: クラスター分析法の分類(Williams and Lance(1977)による)


本章では,とくに利用きれることの多い,凝集型の階層的クラスター分析法をとりあげる.


Tomoyuki Tarumi 平成16年5月13日