logo search
Книга1 МОНД

4.3. Оцінки характеристик змінних об’єкту

Оцінки математичного сподівання та дисперсії для дискретної випадкової величини визначаються за формулами:

; .

Знаменник вибіркової дисперсії дорівнює різниці між об’ємом вибірки N та числом зв’язків, які накладені на цю вибірку (кількість середніх величин). Цю різницю f називають числом ступенів свободи вибірки.

Для визначення точності оцінки величини аN користуються довірчими інтервалами аN ± ε, а для визначення надійності – довірчою надійністю Рε = Р(аN – ε < а < аN + ε), тобто невідоме значення параметру а з імовірністю Рε знаходиться в довірчому інтервалі аN ± ε. В технічних розрахунках звичайно приймають Рε = 0,95 (95%).

Оцінка центральних моментів асиметрії та ексцесу розраховується за формулами:

; ;

; .

Розрахунок інтервальних оцінок для математичного сподівання та дисперсії змінної Х виконується за формулами:

; ,

де Sх – середньоквадратичне відхилення;

tq – значення критерію Стьюдента (псевдонім англійського математика В. С. Госета), який знаходять з таблиць для f = N – 1 і рівня значимості q при певній довірчий імовірності Р; оскільки звичайно Р = 0,95, тому q = 0,05 (5%), якщо це не обговорено спеціально для конкретних досліджень;

- значення χ2 – розподілу Пірсона для рівня значимості відповідно.

Приклад. В результаті 8 – міразового контролю складу продуктів згоряння на виході з агрегату отримано, що вміст оксидів азоту в них становить: 76,48; 76,43; 77,20; 76,45; 76,25; 76,48; 76,48; 76,60 . Визначити інтервальні оцінки дисперсії та математичного сподівання.

Рішення. Оцінки математичного сподівання та дисперсії:

; .

З таблиці розподілу Стьюдента для f = 8 – 1 = 7; q = 5% знаходимо tq = 2,36; тоді інтервальна оцінка математичного сподівання:

; .

Для f = 7 з таблиці розподілу Пірсона знаходимо ; ; тоді інтервальна оцінка дисперсії:

; .

Перевірку гіпотези щодо відмінності середнього обчисленого від стандартного виконують за співвідношенням:

.

Різниця між стандартним значенням х0 і середнім вибірковим є суттєвим при виконанні цього співвідношення.

Приклад. Температура в агрегаті, яку вимірювали еталонним термометром, складає х0 = 10000С. При вимірах її за допомогою інших термометрів отримані значення: 986; 1005; 991; 994; 983; 1002; 996; 998; 1002; 9830С. Чи суттєво відрізняється середнє значення вимірів цими термометрами від еталонного?

Рішення. Розрахуємо оцінки математичного сподівання, дисперсії та середньоквадратичного відхилення:

; ; .

Критерій Стьюдента для числа ступенів свободи f = 10 –1 = 9 і рівня значимості q = 5% знаходимо з таблиць: tq = 2,23. Тоді маємо:

> .

Тобто, середнє значення вимірів суттєво відрізняється від стандартного.

Різні серії дослідів можуть бути виконані з різною якістю, тому виконують перевірку відмінності дисперсій в цих серіях. Припустимо, що маємо дві вибірки об’ємом N1 та N2, для яких визначені оцінки дисперсій S12 та S22. Ці дисперсії є однаковими, якщо виконується умова:

,

де S12 > S22 ;

F – критерій Фішера для числа ступенів свободи f1 i f2 та заданого рівня значимості qзадане.

Приклад. Порівняти точність аналізів вмісту кисню в продуктах згоряння, які виконані двома лаборантами. Лаборант А виконав 20 аналізів з результатами: 4,40; 4,56; 4,42; 4,59; 4,55; 4,45; 4,55; 4,39; 4,75; 4,72; 4,53; 4,66; 4,90; 4,50; 4,45; 4,66; 4,80; 4,36; 4,75; 4,22. Результати 13 аналізів лаборанта В: 4,42; 4,47; 4,70; 4,72; 4,53; 4,55; 4,60; 4,64; 4,29; 4,52; 4,57; 4,56; 4,66. Різницю точності аналізів визначити для 5% - ного рівня значимості.

Рішення. Розраховуємо оцінки математичного сподівання та дисперсії для кожної серії дослідів. Лаборант А:

; .

Лаборант В:

; ;

S12 = 0,0295 > S22 = 0,0139

Середні значення аналізів у обох лаборантів приблизно рівні, однак розсіювання результатів біля середніх значень є різним. Табличне значення критерію Фішера для f1 = 20 – 1 = 19; f2 = 13 – 1 = 12; q = 5% складає F = 2,50. Оскільки , то з імовірністю Рε = 95% можна стверджувати, що різниця в точності аналізів лаборантів А і В є несуттєвою.

В об’ємі вибірки можуть зустрічатися різко відмінні значення, які ще називають аномальними. Виявлення та виключення аномальних значень з вибірки здійснюється за наступною процедурою.

Спочатку знаходять максимальне відхилення від середнього:

Δmax = xmax(min) - ,

де xmax(min) – аномальне значення в виборці.

Потім виконується оцінка:

│Δmax │ > сSx ,

де с – величина, яку знаходять зі співвідношення шляхом ітерацій.

Значення xmax(min) відкидається, якщо виконується наведена нерівність. Оцінка може проводитися багаторазово, середньоквадратичне відхилення Sх розраховують кожен раз за даними залишку вибірки.

Приклад. За даними аналізу продуктів згоряння отриманий вміст СО2 в них: х1 = 23,2; х2 = 23,4; х3 = 23,5; х4 = 24,1; х5 = 25,5%. Чи є значення х5 аномальним і чи слід виключити його з вибірки?

Рішення. Обчислюємо оцінку математичного сподівання і максимальне відхилення у виборці:

; Δmax =│25,5 – 23,55│ = 1,95%.

Оцінка дисперсії по залишку вибірки ( по чотирьом вимірам):

Sx2 = ; Sx = 0,67.

Табличне значення t – критерію для q = 5%; N = 5; f = 5 – 1 = 4 складає tq = 2,776. Зі співвідношення: методом ітерацій отримуємо: с = 1,67. Тоді припустиме відхилення:

СSx = 1,67*0,67 = 1,12%.

Оскільки Δmax > сSx , то значення х5 повинно бути виключено з вибірки.

Важливим практичним питанням, яке вирішується на стадії попереднього експерименту, є визначення необхідної повторності дослідів. Мінімально потрібна кількість паралельних дослідів визначається за наступною процедурою.

Для масиву дослідних даних попередніх N вимірів визначають середнє значення та середньоквадратичне відхилення:

; .

Потім знаходять гранично припустиме відхилення параметру від середнього для заданого рівня значимості q = 0,05:

Δгр = q .

Критерій Стьюдента t0,05 для числа ступенів свободи f = N – 1 та рівня значимості q = 0,05 знаходять за допомогою таблиць і визначають різницю між стандартним середнім та обчисленим за вибіркою для даної кількості вимірів N:

δ =

Якщо δ < δгр , зменшують N, знаходять для нового N значення t0,05 з таблиць і знову розраховують δ, поки δ не стане більшим за δгр . Найменше значення N, коли забезпечується умова δ < δгр , приймають за потрібну кількість паралельних вимірів (дослідів).

Приклад. Попередні N = 12 вимірів показали, відрив факелу при стабільних інших параметрах спостерігався при витраті палива на пальник хu, : 105; 100; 100; 100; 102,5; 100; 97,5; 97,5; 102,5; 105; 102,5. Визначити необхідну повторність дослідів при дослідженні процесу стабілізації полум’я.

Рішення. Середня витрата палива та середньоквадратичне відхилення за результатами N = 12 дослідів:

= 101,25 ; Sx = 2,5 .

Гранично припустиме відхилення параметру від середнього при q = 0,05:

δгр = q = 101,25*0,05 = 5,063

Табличне значення t – критерію для f = N –1 = 12 – 1 = 11 і довірчої імовірності Рε = 95% з таблиць t0,05 = 2,2.

Різниця між стандартним середнім та обчисленим за вибіркою:

δ = .

Отримане значення δ значно менш, ніж δгр, тому розрахуємо δ для менших значень N.

Для N = 6 значення t – критерію t0,05 = 2,57 і δ = 2,623; для N = 4 t0,05 = 3,38 і δ = 3,975; для N = 3 t0,05 = 4,30 і δ = 6,207, що більш, ніж δгр. Відповідно, приймаємо чотириразову повторність вимірів.

Ще однією задачею попереднього експерименту є визначення закону розподілу випадкової величини. Звичайно перевіряють його нормальність, оскільки цей розподіл є домінуючим. Для цього будують гістограму. На вісі абсцис відкладають інтервали, які відповідають групам сукупності випадкової величини, і на кожному з них, як на основі, будують прямокутник. Височина його дорівнює частоті даної групи , де ng – кількість вимірів в групі; N – загальна кількість вимірів, тобто об’єм вибірки.

Кількість груп вибирають таким чином, щоб результати вимірів були добре оглядові і утримували велику кількість відомостей. Алгоритм побудови гістограми наступний.

1. Діапазон зміни випадкової величини у виборці хmin xmax ділять на ε інтервалів; ε вибирають за емпіричною формулою:

ε = 1 + 3,2ln N .

Довжину інтервалів приймають однаковою:

Δg = .

2. Визначають число ng (g = 1, 2, …, ε) елементів вибірки, які знаходяться в кожному інтервалі Δg , і відносну частоту попадання випадкової величини у відповідний інтервал:

Рg = .

3. Отриманий варіаційний ряд записують в таблицю, причому елементам вибірки, які потрапили в g – тий інтервал, приписують середнє значення:

і будують гістограму Рg → хg-1 xg.

Після побудови гістограми виконують перевірку нормальності закону розподілу вибірки за допомогою критеріїв згоди, які оцінюють розбіжності між теоретичними та емпіричними розподілами.

Критерій згоди Пірсона для варіаційного ряду розраховують за формулою:

,

де - імовірність попадання в g – тий інтервал, яка обчислюється за допомогою теоретичного розподілу:

;

Zg – ліва границя g – того інтервалу відносно х в одиницях Sx:

Zg = ;

Ф(Z) = – функція Лапласа, значення якої наведені в таблицях.

Найменше значення Zg = Zmin замінюють на (- ∞), найбільше значення Zg = Zmах - на (+ ∞). Якщо , то розподіл є нормальним. Табличне значення визначають з таблиць для числа ступенів свободи f = ε – l –1, де l = 2 для нормального розподілу.

Приклад. Виконано 200 вимірів температури х в агрегаті. Відхилення температури від номінальної Х = 9500С складають хmin = - 200C; хmах = + 300C. Діапазон відхилень розбитий на g = 10 інтервалів, які наведені в табл. 4.1. Точність вимірів складає ± 10С. Визначити нормальність розподілу масиву.

Таблиця 4.1

Вихідні та розрахункові дані для визначення нормальності розподілу масиву

g

Хg xg+1

ng

хg*

Рg

g*

Zg

Ф0(Zg)

1

-20 -15

7

-17,5

0,035

1

- ∞

- 0,5

0,0239

4,78

1,04

2

-15 -10

11

-12,5

0,055

2

-1,99

-0,4761

0,0469

9,38

0,28

3

-10 - 5

15

- 7,5

0,075

3

-1,47

-0,4292

0,0977

19,54

1,05

4

- 5 0

24

- 2,5

0,120

4

-0,96

-0,3315

0,1615

32,30

2,13

5

0 5

49

2,5

0,245

5

-0,44

-0,1700

0,1979

39,58

2,24

6

5 10

41

7,5

0,205

6

0,07

0,0279

0,1945

38,90

0,11

7

10 15

26

12,5

0,130

7

0,59

0,2224

0,1419

28,38

0,20

8

15 20

17

17,5

0,085

8

1,10

0,3643

0,0831

16,62

0,01

9

20 25

7

22,5

0,035

9

1,62

0,4474

0,0526

10,52

0,03

10

25 30

3

27,5

0,015

10

2,13

0,4834

11

+ ∞

0,5

Рішення. Спочатку за вихідними даними визначаємо середнє значення в інтервалі хg* і відносну частоту Рg, потім оцінку математичного сподівання, дисперсії та середньоквадратичного відхилення:

= 4,300С; Sx2 = 94,2(0C)2; Sx = 9,710C.

Після цього розраховуємо нормовані значення випадкової величини Zg і з таблиць знаходимо Ф0(Zg) з урахуванням того, що при Zg < 0 Ф0(Zg) = - Ф0(|Zg|) . Після отримання та знаходимо значення критерію Пірсона = 7,09. Інтервали g = 10 та g = 9 можна об/єднати з огляду на їх малу чисельність.

Кількість ступенів свободи вибірки складає f = 9 –2 = 6, табличний критерій Пірсона для f = 6; q = 0,05 складає χт2 = 12,59. Оскільки χр2 < χт2 , то розглянута вибірка є нормальною.

За Р. Фішером треба розглядати два основних види відхилень від нормального закону розподілу. При одному з них розподіл даних за своєю формою є асиметричним або скошеним; у ньому середня і медіана не співпадають одна з одною (медіана – це серединне спостереження в ранжованому ряду даних). Другий вид відхилення характеризується деяким надлишком або недоліком спостережень, сконцентрованих в центрі ряду. Це ознака крутизни розподілу – гостро – або плосковершинність його.

Приклад. Виконувалися N = 11 вимірів концентрації оксидів азоту у продуктах спалювання палива на виході пальника Х, , результати яких наведені в табл. 4.2. Виконати перевірку масиву даних на скошеність.

Рішення. Розрахунок виконуємо в наступному порядку. Обчислюємо середнє значення змінної , її відхилення від середнього х, суми квадратів та кубів відхилень S1 i S2, а також середній квадрат та куб відхилень:

К2 = ; К3 = .

Таблиця 4.2

Вихідні та розрахункові дані для перевірки масиву на скошеність

№№

вимірів і

Х,

х = Х -

х2

х3

1

148

- 24

576

- 13824

2

154

- 18

324

- 5832

3

158

- 14

196

- 2744

4

160

- 12

144

- 1728

5

161

- 11

121

- 1331

6

162

- 10

100

- 1000

7

166

- 6

36

- 216

8

170

- 2

4

- 8

9

182

10

100

1000

10

195

23

529

12167

11

236

64

4096

262144

N = 11

= = 172

S1 = = 0

S2 = 2 = 6226

S3 = 3 = 248628

Мірою скошеності є величина:

g1=

Оскільки g1 > 0, то це означає, що спостерігається надлишок даних в області менших від середнього значень. Якщо g1 приймає негативне значення, то, навпаки, має місце надлишок даних в області більших від середнього значень. В разі g1= 0 вибірка є симетричною.

Для перевірки значимості отриманої коефіцієнту g1 знаходимо його дисперсію, середньоквадратичне відхилення (стандартну помилку) та розрахункове значення критерію Стьюдента:

Sg12 = ; Sg1 = 0,661;

tр =

Табличне значення t – критерію вибирають для числа ступенів свободи f → ∞ та заданого рівня значимості q. Приймемо для даного прикладу q = 0,01 і з таблиць знаходимо tт = 2,576. Оскільки tт < tр = 2,96, то можна казати про скошеність представленої вибірки, тобто про її асиметрію, з імовірністю 99%.

Крутизна розподілу вимірюється показником g2 , заснованим на сумі четвертих ступенів відхилень від середнього S4 :

К4 = ; g2 = .

Якщо g2 дорівнює нулю, то відхилення від нормального розподілу немає. Позитивне g2 вказує на надлишок спостережень біля середньої; негативне g2 виникає при плосковершинності кривої розподілу.

Величину стандартної помилки та розрахунковий критерій Стьюдента розраховують за формулами:

Sg2 = ; tp = .

Табличне значення t – критерію tт приймають для числа ступенів свободи f → ∞ та заданого рівня значимості q. При перевищенні табличного значення t – критерію над розрахунковим (tp < tт) відхилення крутизни розподілу у виборці від нормального є несуттєвим.