logo search
Учебник СтатистикаMicrosoft Office Word

7.5. Оцінка узгодженості варіації атрибутивних ознак

Взаємозв’язки між атрибутивними ознаками аналізуються на підставі таблиць взаємної спряженості (співзалежності). Як приклад розглянемо табл. 7.9, в якій наведено результати соціологічного опитування населення щодо намірів прилучитися до ринку цінних паперів. Тих, хто не боїться ризикувати, класифікували як ризикованих інвесторів, тих, хто не уявляє ризику без гарантій, — обережними, а хто ризику уникає взагалі, — неризикованими.

Частоти комбінаційного розподілу респондентів за віком і схильністю до ризику концентруються навколо діагоналі з верхнього лівого кута в нижній правий. Серед молодих більшість готова ризикувати на ринку цінних паперів, у середній віковій групі готовий ризикувати один з п’яти, а половина не уявляє ризику без гарантій, у третій віковій групі на одного обережного припадають два неризиковані.

Таблиця 7.9

РОЗПОДІЛ РЕСПОНДЕНТІВ ЗА ВІКОМ І СХИЛЬНІСТЮ ДО РИЗИКУ

Вік х, років

Тип інвестора у

Разом fi0

Ризикований

Обережний

Неризикований

16—30

24

12

4

40

31—50

20

50

30

100

51 і більше

6

18

36

60

Разом f0j

50

80

70

200

Характер розподілу частот, концентрація їх уздовж головної діагоналі свідчать про наявність стохастичного зв’язку між віком і схильністю до ризику.

Оцінка щільності стохастичного зв’язку ґрунтується на відхиленнях частот (часток) умовного та безумовного розподілів, тобто на відхиленнях фактичних частот fij від теоретичних Fij, пропорційних до підсумкових:

,

де fi0 — підсумкові частоти за ознакою x; f0j — підсумкові частоти за ознакою ;— обсяг сукупності.

Якби схильність до ризику не залежала від віку, то кількість ризикованих серед молоді становила б

,

обережних у другій віковій групі

,

неризикованих у третій віковій групі

.

Абсолютну величину відхилень фактичних частот fij від пропорційних Fij характеризує квадратична спряженість 2 Пірсона:

.

За відсутності стохастичного зв’язку 2 = 0. На основі розподілу ймовірностей 2 перевіряється істотність зв’язку. Критичні значення 2 для  = 0,05 і числа ступенів свободи = (mx – 1) (my – 1) наведено в табл. 7.10. Так, для k = (3 – 1) (3 – 1) = 4 критичне значення Фактичне значення

що значно перевищує критичне, а отже, з імовірністю 0,95 істотність зв’язку між віком і схильністю до ризику доведено.

Відносною мірою щільності стохастичного зв’язку слугує коефіцієнт взаємної спряженості (співзалежності). За умови, що mx = my використовують формулу Чупрова:

,

де mx — число груп за ознакою x; my — число груп за ознакою y. Оскільки за відсутності зв’язку між ознаками 2 = 0, то і С = 0. При функціональному зв’язку C  1. У разі, коли mxmx, віддають перевагу коефіцієнту спряженості Крамера:

,

де mmin — мінімальне число груп (mx або my).

У нашому прикладі mx = my = 3, а тому наведені формули коефіцієнта взаємної спряженості тотожні:

,

що свідчить про наявність зв’язку.

Таблиця 7.10

КРИТИЧНІ ЗНАЧЕННЯ

k

1

2

3

4

5

6

7

8

3,84

5,99

7,81

9,49

11,07

12,59

14,07

15,51

Якщо обидві взаємозв’язані ознаки альтернативні, тобто кількість груп mx = my = 2, то за відсутності зв’язку добутки діагональних частот однакові: f11 f22 = f12 f21. Саме на відхиленнях добут­ків частот ґрунтуються характеристики зв’язку:

,

.

У літературі зі статистики коефіцієнт для 4-клітинкової таблиці називаєтьсякоефіцієнтом контингенції або асоціації. Очевидно, що за змістом він ідентичний коефіцієнту взаємної спряженості, а з 2 пов’язаний функціонально: 2 = nC2.

За допомогою коефіцієнта контингенції оцінимо щільність зв’язку між шкідливою звичкою палити і хворобами легенів (табл. 7.11).

Таблиця 7.11

РОЗПОДІЛ ПАЦІЄНТІВ КЛІНІКИ ЗА РЕЗУЛЬТАТАМИ ЛЕГЕНЕВИХ ПРОБ

Наявність звички палити

Результати легеневих проб

Разом

Аномальні

Нормальні

Палить

20

5

25

Не палить

10

15

25

Разом

30

20

50

.

Значення перевищує критичне . Істотність зв’язку доведено з імовірністю 0,95.

Корисною мірою при аналізі 4-клітинкових таблиць взаємної спряженості є відношення перехресних добутків або відношення шансів

Відношення шансів характеризує міру відносного ризику. У нашому прикладі

.

Отже, імовірність легеневих хвороб у тих, хто палить, у 6 разів вища порівняно з тими, хто не палить.

Зауважимо, що методи аналізу таблиць взаємної спряженості можна використати і для кількісних ознак. Будь-які технічні перешкоди відсутні. Проте слід пам’ятати, що коефіцієнт спряженості оцінює лише узгодженість фактичного розподілу з пропорційним. При переставлянні рядків чи стовпців значення коефіцієнта С не зміниться. Міри щільності кореляційного зв’язку — коефіцієнт детермінації R2 і кореляційне відношення 2 — оцінюють не лише узгодженість частот, а й порядок, послідовність, в якій поєднуються різні значення ознак. Отже, ці характеристики зв’язку більш потужні. А загалом вибір методу вимірювання зв’язку і характеристик його щільності має ґрунтуватись на попередньому теоретичному аналізі суті явищ, характеру взаємозв’язків, наявній інформації.