logo
Posobie_OiM_EHA_chast_I

1.1.8.5. Кластерний аналіз

Кластерний аналіз – один із методів багатомірного аналізу, при­зна­чений для угруповання (кластеризації) сукупності, елементи якої характе­ризуються багатьма ознаками. Значення кожної з ознак слу­жать ко­орди­натами кожної одиниці досліджуваної сукупності в багато­мірному про­сторі ознак. Кожне спостереження, що характеризується значеннями декількох показників, можна представити як крапку в просторі цих по­каз­ників, значення яких розглядаються як координати в багато­мір­ному просто­рі. Відстань між крапками р та q з k-ко­ор­динатами визначається як:

. (1.42)

Основним критерієм кластеризації є те, що розходження між кла­стерами повинні бути більш істотні, ніж між спостереженнями, відне­сеними до одного кластера, тобто в багатомірному просторі повин­ний дотримуватися нерівності:

rp.g  r1,2 (1.43)

де r1,2 – відстань між кластерами 1 і 2.

Так само, як і процедури регресійного аналізу, процедура кластеризації досить трудомістка, її доцільно виконувати на комп'ютері.