次へ: 階層的クラスター分析の考え方
上へ: クラスター分析
戻る: クラスター分析
(cluster analysis)とは,異質なもののまざり合っている対象の中で,互いに似たものを集めて
(クラスター)をつくり,対象を分類しようという方法を総称したもので,数値分類法(numerical classification,numerical taxonomy)とも呼ばれる.症状や検査値にもとづく疾患の分類,財務諸指標による企業の分類,形状や性質による細菌の分類,
といったさまざまな分野に応用されている.
分析の目的や用途に応じて,いろいろな方法が提唱され,その分類についてもいくつかの考え方があるが,ここではWilliams and Lance(1977)による分類を表11.1に示す.
とは,1つの対象がただ1つだけのクラスターに属すか,2つ以上のクラスターに属すことを許すか,
とは分類のために利用する属性(変数)のほかに,それに合わせるように分類したいような外的な属性をもつかどうか(数量化法における外的基準のあり/なしと同じ意味),
とは樹形図で表わされる階層構造を求めるか,単にクラスター内でできるだけ均一で,クラスター間でできるだけ異なるような分類を目ざすか,
とは階層的な分類構造を得るのに,1つずつの対象から逐次似たものを集めるか,逆にすべての対象を含む全体から逐次分割していくか,
とは分割のとき影響の大きい1つだけの属性により分けるか,すべての属性を考慮して分けるか,をそれぞれ表わす.
表:
クラスター分析法の分類(Williams and Lance(1977)による)
|
本章では,とくに利用きれることの多い,凝集型の階層的クラスター分析法をとりあげる.
Tomoyuki Tarumi
平成16年5月13日