logo search
Учебник СтатистикаMicrosoft Office Word

6.5. Статистична перевірка гіпотез

Статистична гіпотеза — це певне припущення щодо властивостей генеральної сукупності, яке можна перевірити, спираючись на результати вибіркового спостереження. Суть перевірки гіпотез полягає в тому, щоб визначити, узгоджуються чи ні результати вибірки з гіпотезою, випадковими чи невипадковими є розбіжності між гіпотезою і даними вибірки.

Найчастіше гіпотеза, яку належить перевірити, формулюється як відсутність розбіжності (нульова розбіжність) між невідомим параметром генеральної сукупності G і заданою величиною А, а тому її позначають Н0. Зміст гіпотези записують після двокрапки, наприклад Н0: G = A.

Кожній нульовій гіпотезі протиставляють альтернативну Нa. При формулюванні Нa враховується вагомість відхилень (G – A): для додатних відхилень НaG > А, для від’ємних — Нa: G < A, для тих і інших — Нa: GA.

Якщо вибіркові дані cуперечать гіпотезі Н0, вона відхиляється, коли ці дані узгоджуються з гіпотезею Н0, вона не відхиляється. Спираючись на результати вибірки, статистична перевірка гіпотез неминуче пов’язана з ризиком прийняття помилкового рішення: ризик І — відхилення правильної нульової гіпотези, ризик ІІ — невідхилення нульової гіпотези, коли насправді пра­вильною є альтернативна. Ці ризики конкуруючі, і зменшення ймовірності  одного зумовлює збільшення ймовірності  іншого. Оскільки уникнути ризиків неможливо, а наслідки їх, як правило, різновагомі, то в кожному конкретному дослідженні прагнуть мінімізувати той ризик, який пов’язаний з більшими втра-тами. Імовірності ризиків наведено в табл. 6.2.

Таблиця 6.2

ІМОВІРНІСТЬ РИЗИКІВ ПОМИЛКОВИХ РІШЕНЬ ПРИ ПЕРЕВІРЦІ ГІПОТЕЗ

Правильна гіпотеза

Прийнята гіпотеза

Н0

Нa

Н0

1 – 

Нa

1 – 

Правило, за яким гіпотеза Н0 відхиляється або не відхиляється (приймається), називається статистичним критерієм. Математичною основою будь-якого критерію є статистична характеристика Z, значення якої визначається за даними вибірки, а закон розподілу відомий. Кожне значення характеристики Z має певну ймовірність F (Z). Якщо вибіркове значення Z малоймовірне, гіпотеза Н0 відхиляється.

Межу малоймовірності Z називають рівнем істотності . Очевидно, що  — це ймовірність ризику І, а тому залежно від змісту гіпотези Н0 і наслідків її відхилення рівень істотності визначають у кожному конкретному дослідженні. Зазвичай вибирають один із рівнів , для яких табульовані значення статистичних характеристик критеріїв. Це  = 0,10; 0,05; 0,025; 0,01.

Значення статистичної характеристики критерія Z–  поділяє множину вибіркових значень Z на дві частини: а) область допустимих значень і б) критичну область. Якщо вибіркове значення Z потрапляє у критичну область, гіпотеза Н0 відхиляється, якщо в область допустимих значень — не відхиляється. Саме тому значення Z–  називають критичним.

Залежно від того, як сформульована альтернативна гіпотеза, критична область може бути односторонньою (ліво- чи правосторонньою) або двосторонньою (рис. 6.2).

Рис. 6.2. Лівостороння та двостороння критичні області

Порядок перевірки статистичних гіпотез розглянемо на прик­ладі співвідношення середніх двох сукупностей. Припустимо, ведеться вибірковий контроль тривалості служби деталей одного виду, виготовлених за різними технологіями. Контролю піддано 5 деталей, виготовлених за старою технологією, і 4 — за новою, тобто n1 = 5, n2 = 4. Вибіркові оцінки середніх і дисперсій відповідно становили: = 580 год при= 308;= 612 год при= 329.

Різниця між середніми (–) = (612 – 580) = 32 год.

Потрібно визначити, чи істотна ця різниця, тобто чи зумовлена вона відмінностями технологій, чи випадкова. Нульова гіпотеза формулюється на припущенні, що відхилення середніх випадкові Н0: . Альтернативна гіпотеза передбачає, що нова технологія збільшує тривалість служби деталі:На: . За такого формулюванняНa виконується одностороння (правостороння) перевірка.

Статистичною характеристикою гіпотези Н0: є нормоване відхилення середніх

,

яке підпорядковане розподілу Стьюдента з числом ступенів свободи n1 + n2 – 2.

У нашому прикладі k = 5 + 4 – 2 = 7; оцінка дисперсії розраховується як середня арифметична зважена з дисперсій, що характеризують варіацію тривалості служби деталей за кожною технологією

;

значення t-критерію

.

Перевіримо гіпотезу Н0 проти Нa з рівнем істотності  = 0,05. За даними табл. 6.3 критичне значення t0,95 (7) = 1,89, що менше за фактичне (t = 2,37). Отже, нульова гіпотеза Н0: відхиляється, і з імовірністю 0,95 можна стверджувати, що нова технологія збільшує термін служби деталей.

У разі двосторонньої перевірки гіпотези, коли Нa:, використовують критичне значення для, наприклад при = 0,05 це буде t0,975 (k).

Отже, статистична гіпотеза перевіряється в такій послідовності:

а) формулюють нульову Н0 та альтернативну Нa гіпотези;

б) вибирають статистичну характеристику Z, за значеннями якої перевіряють правильність гіпотези Н0;

в) визначають рівень істотності  і відповідне йому критичне значення Z1 – ; залежно від формулювання гіпотез Н0 i Нa критична область може бути одно- або двосторонньою;

г) за результатами вибірки розраховують фактичне (вибіркове) значення статистичної характеристики Z, яке порівнюють з критичним Z1 – ; якщо Z > Z1 – , гіпотеза Н0 відхиляється, при Z < Z1 –  — не відхиляється.

Таблиця 6.3

ЗНАЧЕННЯ КВАНТИЛІВ t РОЗПОДІЛУ СТЬЮДЕНТА ДЛЯ  = 0,05

Число ступенів свободи

Для критерію

двостороннього

одностороннього

4

2,78

2,13

5

2,57

2,01

6

2,45

1,94

7

2,38

1,89

8

2,31

1,86

10

2,23

1,81

15

2,13

1,75

20

2,09

1,73

30

2,04

1,70

1,96

1,64

Процедура перевірки гіпотез використовується при порівнянні вибіркових характеристик (середньої, частки, дисперсії) з відповідними нормативами, порівнянні характеристик двох вибіркових сукупностей, оцінюванні істотності розбіжностей двох розподілів, у дисперсійному та кореляційному аналізі.