logo
Учебник СтатистикаMicrosoft Office Word

5.5. Види та взаємозв’язок дисперсій

Дисперсія посідає особливе місце у статистичному аналізі соціально-економічних явищ. На відміну від інших характеристик варіації завдяки своїм математичним властивостям вона є невіддільним і важливим елементом інших статистичних методів, зокрема дисперсійного аналізу.

Для ознак метричної шкали дисперсія — це середній квадрат відхилень індивідуальних значень ознаки від середньої:

.

Як і будь-яка середня, дисперсія має певні математичні властивості. Сформулюємо найважливіші з них.

1. Якщо всі значення варіант xj зменшити на сталу величину А, то дисперсія не зміниться:

.

2. Якщо всі значення варіант xj змінити в А раз, то дисперсія зміниться в A2 раз:

.

3. Якщо частоти замінити частками, дисперсія не зміниться.

Нескладними алгебраїчними перетвореннями можна довести, що дисперсія — це різниця квадратів . Якщо

,

то, замінивши і поділивши всі складові наn, дістанемо:

,

де — квадрат середньої величини;— середній квадрат значень ознаки.

Дисперсія альтернативної ознаки обчислюється як добуток часток: , де— частка елементів сукупності, яким властива ознака,— частка решти елементів. Застосуємо основну формулу дисперсії до цих характеристик структури:

Якщо, скажімо, у збиральному цеху частка висококваліфікованих робітників становить , то дисперсія частки.

Дисперсія альтернативної ознаки широко використовується при проектуванні вибіркових обстежень, обробці даних соціологічних опитувань, статистичному контролі якості продукції тощо. За відсутності первинних даних про розподіл сукупності припускають, що і використовують максимальне значення дисперсії(див. підрозд. 6.4).

Якщо сукупність розбито на групи за певною ознакою х, то для будь-якої іншої ознаки у можна обчислити дисперсію як у цілому по сукупності, так і в кожній групі. Центром розподілу сукупності в цілому є загальна середня , центром розподілу вj-й групі — групова середня . Відхилення індивідуальних значень ознакиу від загальної середньої можна подати як дві складові:. Узагальнюючими характеристиками цих вiдхилень є дисперсії: загальна, групова та міжгрупова.

Загальна дисперсія характеризує варіацію ознаки у навколо загальної середньої:

.

Групова дисперсія характеризує варіацію відносно групової середньої:

.

Оскільки в групи об’єднуються певною мірою схожі елементи сукупності, то варіація в групах, як правило, менша, ніж у цілому по сукупності. Якщо причинні комплекси, що формують варіацію в різних групах, неоднакові, то й групові дисперсії різняться між собою.

Узагальнюючою мірою внутрішньогрупової варіації є середня з групових дисперсій:

.

Різними є й групові середні . Мірою варіації їх навколо загальної середньої єміжгрупова дисперсія

.

Отже, загальна дисперсія складається з двох частин. Перша характеризує внутрішньогрупову, друга — міжгрупову варіацію.

Взаємозв’язок дисперсій називається правилом розкладання (декомпозиції) варіації:

.

Розглянемо розрахунок зазначених дисперсій на прикладі варіації якості твердого сиру у залежно від терміну його зберігання х. Результати вибіркового обстеження якості 20 партій сиру, розподіл їх за терміном зберігання (1, 2, 3 місяці), розрахунки середніх та дисперсій наведено в табл. 5.13. Згідно з даними таблиці маємо:

1) середній бал якості сиру (за 10-бальною шкалою)

;

2) загальна дисперсія балів якості

;

3) групові середні бали якості та групові дисперсії:

;

;

;

;

;

.

Таблиця 5.13

РОЗРАХУНОК ЗАГАЛЬНОЇ ТА ГРУПОВИХ ДИСПЕРСІЙ ЯКОСТІ СИРУ

№ з/п

Термін зберігання х, міс.

Бал якості, y

Розрахунок дисперсій якості

загальної

групових

1-ша група

2-га група

3-тя група

у

у

у

1

2

7,3

0,01

7,3

0,01

2

1

8,8

1,96

8,8

0,01

3

1

8,4

1,00

8,4

0,09

4

3

6,5

0,81

6,5

0,36

5

2

7,5

0,01

7,5

0,09

6

3

6,4

1,00

6,4

0,25

7

1

9,1

2,89

9,1

0,16

8

1

8,6

1,44

8,6

0,01

9

3

5,7

2,89

5,7

0,04

10

2

6,8

0,36

6,8

0,16

11

2

7,7

0,09

7,7

0,25

12

3

5,6

3,24

5,6

0,09

13

1

8,9

2,25

8,9

0,04

14

2

7,8

0,16

7,8

0,36

15

3

5,3

4,41

5,3

0,36

16

1

8,5

1,21

8,5

0,04

17

2

6,8

0,36

6,8

0,16

18

2

7,1

0,09

7,1

0,01

19

1

8,6

1,44

8,6

0,01

20

2

6,6

0,64

6,6

0,36

Разом

148,0

26,26

60,9

0,36

57,6

1,4

29,5

1,1

Середня

7,4

8,7

7,2

5,9

Дисперсія

1,313

0,051

0,175

0,220

Значення групових середніх підтверджують залежність якості сиру від терміну його зберігання. У 1-й групі середній бал якості становить 8,7, у 2-й групі якість сиру знижується на 1,5 бала, а в 3-й зниження якості порівняно з першою групою становить 2,8 бала. Водночас зростає варіація балів у групах, що відбиває посилення впливу інших чинників на якість сиру.

Необхідні величини для розрахунку середньої з групових і міжгрупової дисперсій наведено в табл. 5.14.

Таблиця 5.14

ДО РОЗРАХУНКУ МІЖГРУПОВОЇ ТА СЕРЕДНЬОЇ З ГРУПОВИХ ДИСПЕРСІЙ

Групи за терміном зберігання, міс.

Число партій

Середній бал якості

Групова дисперсія

Розрахунок дисперсій

середньої з групових

міжгрупової

1

7

8,7

0,051

0,36

1,3

11,83

2

8

7,2

0,175

1,40

– 0,2

0,32

3

5

5,9

0,220

1,10

– 1,5

11,25

Разом

20

7,4

2,86

23,4

За даними таблиці міжгрупова дисперсія становить

середня з групових дисперсій

.

Сума їх дорівнює загальній дисперсії: 0,143 + 1,170 = 1,313.

Міжгрупова варіація — це результат впливу фактора, який покладено в основу групування, внутрішньогрупова — інших факторів, окрім групувального. Відношення міжгрупової дисперсії до загальної характеризує частку варіації результативної ознаки у, яка пов’язана з варіацією групувальної ознаки. Це відношення називають кореляційним і позначають символом :

.

У розглянутому прикладі кореляційне відношення становить , тобто 84,2% варіації якості сиру пов’язані з терміном зберігання. На інші фактори припадає 100 – 84,2 = = 15,8% варіації.

Правило декомпозиції варіації є основою вимірювання щільності зв’язку.

завдання для самоконтролю

1. Як виявляється закономірність розподілу?

2. Назвіть особливості частотних характеристик розподілу.

3. Чому саме середню розглядають як типовий рівень ознаки в сукупності? Як співвідноситься середня з іншими характеристиками центра розподілу?

4. Середня величина ознаки у двох сукупностях однакова. Чи може бути різною варіація цієї ознаки?

5. Терміни корисного використання нематеріальних активів фірми, захищених патентами, ліцензіями тощо, на кінець року становили:

Термін використання, років

1

2

3

4

5

6

Разом

У % до загальної суми нематеріальних активів

2,6

10,2

39,2

40,0

6,8

1,2

100

Визначіть ряд кумулятивних часток, медіану і моду терміну корисного використання нематеріальних активів фірми.

6. Кредитні ставки комерційних банків під короткострокові позики становили:

Кредитна ставка, %

Суми наданих позик, млн грн.

І квартал

ІІ квартал

До 10

1

5

10 — 20

4

11

20 — 30

9

8

30 і більше

6

6

Разом

20

30

За кожний квартал визначіть середню кредитну ставку та середнє лінійне відхилення. Як змінилися середній рівень і варіація кредитної ставки?

7. Прибутковість активів комерційних банків на початок року становила в середньому 15% при дисперсії 36, на кінець року — 10% при дисперсії 25. Оцініть відносну варіацію прибутковості активів на початок і кінець року, зробіть висновок про напрямок зміни середньої і варіації.

8. Розподіл агропідприємств за рівнем урожайності кукурудзи (ц/га) на зрошувальних землях характеризується даними:

Режим іригації

Середній рівень

Модальне значення

Середнє квадратичне відхилення

1

60

57,0

12

2

75

70,5

9

Порівняйте варіацію та асиметрію розподілу агропідприємств за рів­нем урожайності кукурудзи.

9. Квадратичний коефіцієнт варіації витрат домогосподарств на харчування становить 79%. Чи можна вважати однорідною сукупність домогосподарств за цією ознакою?

10. На яких засадах ґрунтується оцінка нерівномірності розподілу? Поясніть зміст і особливості розрахунку коефіцієнтів локалізації та концентрації.

11. За наведеними даними оцініть ступінь концентрації землі у фермерських господарствах, зробіть висновок.

Земельна площа на одне господарство, га

Структура господарств, %

За кількістю ферм

За земельною площею

До 10

8,3

0,3

10 — 50

29,2

4,5

50 — 200

200 — 500

500 — 1000

38,0

20,2

2,7

26,5

23,8

20,6

1000 і більше

1,6

24,3

Разом

100

100

12. За даними про віковий склад парку металообробного устаткування за два роки оцініть інтенсивність структурних зрушень, зробіть висновок.

Вікова група, років

У % до підсумку

1995

2000

До 10

60

45

10 — 20

26

34

20 і більше

14

21

Разом

100

100

13. Частка високоліквідних активів у сумі поточних активів становить 20%. Визначіть дисперсію частки високоліквідних активів.

14. Сукупність розбито на однорідні групи, причому варіація ознаки в групах значно менша, ніж у цілому по сукупності. Який зв’язок між загальною і груповою варіаціями?

15. Яку варіацію характеризує міжгрупова дисперсія?

16. За даними хронометражних обстежень затрати часу на обробку деталі на різних стругальних верстатах становили, хв:

у І зміну — 26, 24, 23, 28, 25, 24;

у ІІ зміну — 28, 30, 29, 33.

Визначіть групові, міжгрупову та загальну дисперсії затрат часу на обробку деталі. Покажіть взаємозв’язок дисперсій.