logo search
Учебник СтатистикаMicrosoft Office Word

6.2. Вибіркові оцінки середньої та частки

У статистиці використовують два типи оцінок параметрів генеральної сукупності — точкові та інтервальні. Точкова оцінка— це значення параметра за даними вибірки: вибіркова середня та вибіркова часткар. Інтервальною оцінкою називають інтервал значень параметра, розрахований за даними вибірки для певної ймовірності, тобто довірчий інтервал. Чим менший довірчий інтервал, тим точніша вибіркова оцінка.

Межі довірчого інтервалу визначаються на основі точкової оцінки та граничної похибки вибірки :

для середньої

;

для частки

,

де  — стандартна (середня) похибка вибірки; t — квантиль розподілу ймовірностей (довірче число).

Стандартна похибка вибірки  є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Як доведено в теорії вибіркового методу, дисперсія вибіркових середніх у n раз менша від дисперсії ознаки в генеральній сукупності, тобто . Оскільки на практиці генеральна дисперсія ознакиневідома, у розрахунках можна використати вибіркову незсунену оцінку дисперсії: для повторної вибірки, для безповторної. Отже, формули стандартної похибки:

для повторної вибірки

,

для безповторної вибірки

.

Щодо практичного використання наведених формул слід урахувати таке:

а) дисперсія частки , дер і q — частки вибіркової сукупності, яким відповідно властива і невластива ознака;

б) у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому береться до уваги лише у вибірках з невеликою кількістю елементів;

в) коригуючий множник для безповторної вибірки , тобто при малих величинах (наприклад, для 2 чи 5%-ної вибірки) наближається до 1, а тому розрахунок можна виконувати за формулою для повторної вибірки; при 10%-ній вибірці коригуючий множник становить 0,949, при 20%-ній — 0,894.

Гранична похибка вибірки — це максимально можлива похибка для взятої ймовірностіF(x). Довірче число t показує, як співвідносяться гранична та стандартна похибки. Як бачимо з рис. 6.1, з імовірністю 0,683 гранична похибка не вийде за межі стандартної , з імовірністю 0,954 вона не перевищить 2, з імовірністю 0,997 —  3. На практиці найчастіше застосовують імовірність 0,954 (на рис. 6.1 незаштрихована частина площини).

Рис. 6.1. Співвідношення ймовірностей та ширини довірчих меж

З урахуванням сказаного формули граничних похибок середньої та частки записують так:

Повторна вибірка

Безповторна вибірка

для середньої

;

;

для частки

;

.

Як видно з формул, розмір граничної похибки залежить:

Чим більша варіація ознаки в генеральній сукупності, тим більша в середньому похибка вибірки. Залежність похибки від обсягу вибіркової сукупності обернено пропорційна. Щоб зменшити похибку вибірки вдвічі, обсяг останньої має зрости в 4 рази. При безповторному доборі похибка буде тим менша, чим більша частка обстеженої сукупності . Очевидно, при суцільному спостереженні похибка репрезентативності відсутня ( = 0).

При малих вибірках (n < 30 ), у розрахунках стандартних похибок використовують вибіркові оцінки дисперсій . Квантиліt визначають за розподілом імовірностей Стьюдента. У табл. 6.3 наведено деякі значення квантилів t розподілу Стьюдента для ймовірності 0,95 і числа ступенів свободи, тобто числа незалежних величин, необхідних для визначення даної характеристики, – 1. При > 30 квантилі розподілу Стьюдента і нормального розподілу збігаються.

Розглянемо методику вибіркового оцінювання середньої та частки на прикладі обстеження 225 домогосподарств регіону. За результатами 1%-ної вибірки 70% грошового доходу домогосподарства витрачають на харчування. Середньодушові витрати на харчування за місяць становлять 82 грн. при дисперсії 8510.

Визначимо межі середньодушових витрат на харчування з імовірністю 0,954 (t = 2).

Гранична похибка

грн.

Це дає підставу стверджувати з імовірністю 0,954, що середньодушові витрати на харчування в цілому по регіону щонайменше 69,7 грн. і не перевищують 94,3 грн.:

.

Перш ніж визначити граничну похибку частки витрат на харчування, необхідно обчислити її дисперсію:

= 0,7(1 – 0,7) = 0,21.

Гранична похибка

або 6,1%.

Щодо інтервалу можливих значень частки витрат на харчування в генеральній сукупності, то межі його становлять 63,9 і 76,1%:

.

У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї самої ознаки в різних сукупностях.

Такі порівняння виконують за допомогою відносної похибки, яка показує, на скільки процентів вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої — це коефіцієнт варіації вибіркових середніх:

.

Її розмір можна визначити також на основі коефіцієнта варіації ознаки Vx:

для повторної вибірки

;

для безповторної вибірки

.

Так, у нашому прикладі відносна похибка середньодушових витрат на харчування

.

Такий самий результат дає розрахунок відносної похибки на основі коефіцієнта варіації :

;

Вибіркову похибку частки також слід порівнювати з часткоюр. Адже одна і та сама похибка = 2% дляр = 80% є малою, для р = 40% — допустимою, для р = 10% — завеликою. Відносну похибку частки обчислюють за формулою

.

У нашому прикладі відносна похибка частки витрат на харчування становить 4,36%:

,

що значно менше порівняно з похибкою середньодушових витрат на харчування (7,5%).

Отже, відносну похибку можна використати для порівняння вибіркових оцінок різних ознак. На практиці достатнім рівнем точності вважається Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку.