4.3. Оцінки характеристик змінних об’єкту
Оцінки математичного сподівання та дисперсії для дискретної випадкової величини визначаються за формулами:
; .
Знаменник вибіркової дисперсії дорівнює різниці між об’ємом вибірки N та числом зв’язків, які накладені на цю вибірку (кількість середніх величин). Цю різницю f називають числом ступенів свободи вибірки.
Для визначення точності оцінки величини аN користуються довірчими інтервалами аN ± ε, а для визначення надійності – довірчою надійністю Рε = Р(аN – ε < а < аN + ε), тобто невідоме значення параметру а з імовірністю Рε знаходиться в довірчому інтервалі аN ± ε. В технічних розрахунках звичайно приймають Рε = 0,95 (95%).
Оцінка центральних моментів асиметрії та ексцесу розраховується за формулами:
; ;
; .
Розрахунок інтервальних оцінок для математичного сподівання та дисперсії змінної Х виконується за формулами:
; ,
де Sх – середньоквадратичне відхилення;
tq – значення критерію Стьюдента (псевдонім англійського математика В. С. Госета), який знаходять з таблиць для f = N – 1 і рівня значимості q при певній довірчий імовірності Р; оскільки звичайно Р = 0,95, тому q = 0,05 (5%), якщо це не обговорено спеціально для конкретних досліджень;
- значення χ2 – розподілу Пірсона для рівня значимості відповідно.
Приклад. В результаті 8 – міразового контролю складу продуктів згоряння на виході з агрегату отримано, що вміст оксидів азоту в них становить: 76,48; 76,43; 77,20; 76,45; 76,25; 76,48; 76,48; 76,60 . Визначити інтервальні оцінки дисперсії та математичного сподівання.
Рішення. Оцінки математичного сподівання та дисперсії:
; .
З таблиці розподілу Стьюдента для f = 8 – 1 = 7; q = 5% знаходимо tq = 2,36; тоді інтервальна оцінка математичного сподівання:
; .
Для f = 7 з таблиці розподілу Пірсона знаходимо ; ; тоді інтервальна оцінка дисперсії:
; .
Перевірку гіпотези щодо відмінності середнього обчисленого від стандартного виконують за співвідношенням:
.
Різниця між стандартним значенням х0 і середнім вибірковим є суттєвим при виконанні цього співвідношення.
Приклад. Температура в агрегаті, яку вимірювали еталонним термометром, складає х0 = 10000С. При вимірах її за допомогою інших термометрів отримані значення: 986; 1005; 991; 994; 983; 1002; 996; 998; 1002; 9830С. Чи суттєво відрізняється середнє значення вимірів цими термометрами від еталонного?
Рішення. Розрахуємо оцінки математичного сподівання, дисперсії та середньоквадратичного відхилення:
; ; .
Критерій Стьюдента для числа ступенів свободи f = 10 –1 = 9 і рівня значимості q = 5% знаходимо з таблиць: tq = 2,23. Тоді маємо:
> .
Тобто, середнє значення вимірів суттєво відрізняється від стандартного.
Різні серії дослідів можуть бути виконані з різною якістю, тому виконують перевірку відмінності дисперсій в цих серіях. Припустимо, що маємо дві вибірки об’ємом N1 та N2, для яких визначені оцінки дисперсій S12 та S22. Ці дисперсії є однаковими, якщо виконується умова:
,
де S12 > S22 ;
F – критерій Фішера для числа ступенів свободи f1 i f2 та заданого рівня значимості qзадане.
Приклад. Порівняти точність аналізів вмісту кисню в продуктах згоряння, які виконані двома лаборантами. Лаборант А виконав 20 аналізів з результатами: 4,40; 4,56; 4,42; 4,59; 4,55; 4,45; 4,55; 4,39; 4,75; 4,72; 4,53; 4,66; 4,90; 4,50; 4,45; 4,66; 4,80; 4,36; 4,75; 4,22. Результати 13 аналізів лаборанта В: 4,42; 4,47; 4,70; 4,72; 4,53; 4,55; 4,60; 4,64; 4,29; 4,52; 4,57; 4,56; 4,66. Різницю точності аналізів визначити для 5% - ного рівня значимості.
Рішення. Розраховуємо оцінки математичного сподівання та дисперсії для кожної серії дослідів. Лаборант А:
; .
Лаборант В:
; ;
S12 = 0,0295 > S22 = 0,0139
Середні значення аналізів у обох лаборантів приблизно рівні, однак розсіювання результатів біля середніх значень є різним. Табличне значення критерію Фішера для f1 = 20 – 1 = 19; f2 = 13 – 1 = 12; q = 5% складає F = 2,50. Оскільки , то з імовірністю Рε = 95% можна стверджувати, що різниця в точності аналізів лаборантів А і В є несуттєвою.
В об’ємі вибірки можуть зустрічатися різко відмінні значення, які ще називають аномальними. Виявлення та виключення аномальних значень з вибірки здійснюється за наступною процедурою.
Спочатку знаходять максимальне відхилення від середнього:
Δmax = xmax(min) - ,
де xmax(min) – аномальне значення в виборці.
Потім виконується оцінка:
│Δmax │ > сSx ,
де с – величина, яку знаходять зі співвідношення шляхом ітерацій.
Значення xmax(min) відкидається, якщо виконується наведена нерівність. Оцінка може проводитися багаторазово, середньоквадратичне відхилення Sх розраховують кожен раз за даними залишку вибірки.
Приклад. За даними аналізу продуктів згоряння отриманий вміст СО2 в них: х1 = 23,2; х2 = 23,4; х3 = 23,5; х4 = 24,1; х5 = 25,5%. Чи є значення х5 аномальним і чи слід виключити його з вибірки?
Рішення. Обчислюємо оцінку математичного сподівання і максимальне відхилення у виборці:
; Δmax =│25,5 – 23,55│ = 1,95%.
Оцінка дисперсії по залишку вибірки ( по чотирьом вимірам):
Sx2 = ; Sx = 0,67.
Табличне значення t – критерію для q = 5%; N = 5; f = 5 – 1 = 4 складає tq = 2,776. Зі співвідношення: методом ітерацій отримуємо: с = 1,67. Тоді припустиме відхилення:
СSx = 1,67*0,67 = 1,12%.
Оскільки Δmax > сSx , то значення х5 повинно бути виключено з вибірки.
Важливим практичним питанням, яке вирішується на стадії попереднього експерименту, є визначення необхідної повторності дослідів. Мінімально потрібна кількість паралельних дослідів визначається за наступною процедурою.
Для масиву дослідних даних попередніх N вимірів визначають середнє значення та середньоквадратичне відхилення:
; .
Потім знаходять гранично припустиме відхилення параметру від середнього для заданого рівня значимості q = 0,05:
Δгр = q .
Критерій Стьюдента t0,05 для числа ступенів свободи f = N – 1 та рівня значимості q = 0,05 знаходять за допомогою таблиць і визначають різницю між стандартним середнім та обчисленим за вибіркою для даної кількості вимірів N:
δ =
Якщо δ < δгр , зменшують N, знаходять для нового N значення t0,05 з таблиць і знову розраховують δ, поки δ не стане більшим за δгр . Найменше значення N, коли забезпечується умова δ < δгр , приймають за потрібну кількість паралельних вимірів (дослідів).
Приклад. Попередні N = 12 вимірів показали, відрив факелу при стабільних інших параметрах спостерігався при витраті палива на пальник хu, : 105; 100; 100; 100; 102,5; 100; 97,5; 97,5; 102,5; 105; 102,5. Визначити необхідну повторність дослідів при дослідженні процесу стабілізації полум’я.
Рішення. Середня витрата палива та середньоквадратичне відхилення за результатами N = 12 дослідів:
= 101,25 ; Sx = 2,5 .
Гранично припустиме відхилення параметру від середнього при q = 0,05:
δгр = q = 101,25*0,05 = 5,063
Табличне значення t – критерію для f = N –1 = 12 – 1 = 11 і довірчої імовірності Рε = 95% з таблиць t0,05 = 2,2.
Різниця між стандартним середнім та обчисленим за вибіркою:
δ = .
Отримане значення δ значно менш, ніж δгр, тому розрахуємо δ для менших значень N.
Для N = 6 значення t – критерію t0,05 = 2,57 і δ = 2,623; для N = 4 t0,05 = 3,38 і δ = 3,975; для N = 3 t0,05 = 4,30 і δ = 6,207, що більш, ніж δгр. Відповідно, приймаємо чотириразову повторність вимірів.
Ще однією задачею попереднього експерименту є визначення закону розподілу випадкової величини. Звичайно перевіряють його нормальність, оскільки цей розподіл є домінуючим. Для цього будують гістограму. На вісі абсцис відкладають інтервали, які відповідають групам сукупності випадкової величини, і на кожному з них, як на основі, будують прямокутник. Височина його дорівнює частоті даної групи , де ng – кількість вимірів в групі; N – загальна кількість вимірів, тобто об’єм вибірки.
Кількість груп вибирають таким чином, щоб результати вимірів були добре оглядові і утримували велику кількість відомостей. Алгоритм побудови гістограми наступний.
1. Діапазон зміни випадкової величини у виборці хmin xmax ділять на ε інтервалів; ε вибирають за емпіричною формулою:
ε = 1 + 3,2ln N .
Довжину інтервалів приймають однаковою:
Δg = .
2. Визначають число ng (g = 1, 2, …, ε) елементів вибірки, які знаходяться в кожному інтервалі Δg , і відносну частоту попадання випадкової величини у відповідний інтервал:
Рg = .
3. Отриманий варіаційний ряд записують в таблицю, причому елементам вибірки, які потрапили в g – тий інтервал, приписують середнє значення:
і будують гістограму Рg → хg-1 xg.
Після побудови гістограми виконують перевірку нормальності закону розподілу вибірки за допомогою критеріїв згоди, які оцінюють розбіжності між теоретичними та емпіричними розподілами.
Критерій згоди Пірсона для варіаційного ряду розраховують за формулою:
,
де - імовірність попадання в g – тий інтервал, яка обчислюється за допомогою теоретичного розподілу:
;
Zg – ліва границя g – того інтервалу відносно х в одиницях Sx:
Zg = ;
Ф(Z) = – функція Лапласа, значення якої наведені в таблицях.
Найменше значення Zg = Zmin замінюють на (- ∞), найбільше значення Zg = Zmах - на (+ ∞). Якщо , то розподіл є нормальним. Табличне значення визначають з таблиць для числа ступенів свободи f = ε – l –1, де l = 2 для нормального розподілу.
Приклад. Виконано 200 вимірів температури х в агрегаті. Відхилення температури від номінальної Х = 9500С складають хmin = - 200C; хmах = + 300C. Діапазон відхилень розбитий на g = 10 інтервалів, які наведені в табл. 4.1. Точність вимірів складає ± 10С. Визначити нормальність розподілу масиву.
Таблиця 4.1
Вихідні та розрахункові дані для визначення нормальності розподілу масиву
g | Хg xg+1 | ng | хg* | Рg | g* | Zg | Ф0(Zg) |
|
|
|
1 | -20 -15 | 7 | -17,5 | 0,035 | 1 | - ∞ | - 0,5 | 0,0239 | 4,78 | 1,04 |
2 | -15 -10 | 11 | -12,5 | 0,055 | 2 | -1,99 | -0,4761 | 0,0469 | 9,38 | 0,28 |
3 | -10 - 5 | 15 | - 7,5 | 0,075 | 3 | -1,47 | -0,4292 | 0,0977 | 19,54 | 1,05 |
4 | - 5 0 | 24 | - 2,5 | 0,120 | 4 | -0,96 | -0,3315 | 0,1615 | 32,30 | 2,13 |
5 | 0 5 | 49 | 2,5 | 0,245 | 5 | -0,44 | -0,1700 | 0,1979 | 39,58 | 2,24 |
6 | 5 10 | 41 | 7,5 | 0,205 | 6 | 0,07 | 0,0279 | 0,1945 | 38,90 | 0,11 |
7 | 10 15 | 26 | 12,5 | 0,130 | 7 | 0,59 | 0,2224 | 0,1419 | 28,38 | 0,20 |
8 | 15 20 | 17 | 17,5 | 0,085 | 8 | 1,10 | 0,3643 | 0,0831 | 16,62 | 0,01 |
9 | 20 25 | 7 | 22,5 | 0,035 | 9 | 1,62 | 0,4474 | 0,0526 | 10,52 | 0,03 |
10 | 25 30 | 3 | 27,5 | 0,015 | 10 | 2,13 | 0,4834 |
|
|
|
|
|
|
|
| 11 | + ∞ | 0,5 |
|
|
|
Рішення. Спочатку за вихідними даними визначаємо середнє значення в інтервалі хg* і відносну частоту Рg, потім оцінку математичного сподівання, дисперсії та середньоквадратичного відхилення:
= 4,300С; Sx2 = 94,2(0C)2; Sx = 9,710C.
Після цього розраховуємо нормовані значення випадкової величини Zg і з таблиць знаходимо Ф0(Zg) з урахуванням того, що при Zg < 0 Ф0(Zg) = - Ф0(|Zg|) . Після отримання та знаходимо значення критерію Пірсона = 7,09. Інтервали g = 10 та g = 9 можна об/єднати з огляду на їх малу чисельність.
Кількість ступенів свободи вибірки складає f = 9 –2 = 6, табличний критерій Пірсона для f = 6; q = 0,05 складає χт2 = 12,59. Оскільки χр2 < χт2 , то розглянута вибірка є нормальною.
За Р. Фішером треба розглядати два основних види відхилень від нормального закону розподілу. При одному з них розподіл даних за своєю формою є асиметричним або скошеним; у ньому середня і медіана не співпадають одна з одною (медіана – це серединне спостереження в ранжованому ряду даних). Другий вид відхилення характеризується деяким надлишком або недоліком спостережень, сконцентрованих в центрі ряду. Це ознака крутизни розподілу – гостро – або плосковершинність його.
Приклад. Виконувалися N = 11 вимірів концентрації оксидів азоту у продуктах спалювання палива на виході пальника Х, , результати яких наведені в табл. 4.2. Виконати перевірку масиву даних на скошеність.
Рішення. Розрахунок виконуємо в наступному порядку. Обчислюємо середнє значення змінної , її відхилення від середнього х, суми квадратів та кубів відхилень S1 i S2, а також середній квадрат та куб відхилень:
К2 = ; К3 = .
Таблиця 4.2
Вихідні та розрахункові дані для перевірки масиву на скошеність
№№ вимірів і | Х, | х = Х - | х2 | х3 |
1 | 148 | - 24 | 576 | - 13824 |
2 | 154 | - 18 | 324 | - 5832 |
3 | 158 | - 14 | 196 | - 2744 |
4 | 160 | - 12 | 144 | - 1728 |
5 | 161 | - 11 | 121 | - 1331 |
6 | 162 | - 10 | 100 | - 1000 |
7 | 166 | - 6 | 36 | - 216 |
8 | 170 | - 2 | 4 | - 8 |
9 | 182 | 10 | 100 | 1000 |
10 | 195 | 23 | 529 | 12167 |
11 | 236 | 64 | 4096 | 262144 |
N = 11 | = = 172 | S1 = = 0 | S2 = 2 = 6226 | S3 = 3 = 248628 |
Мірою скошеності є величина:
g1=
Оскільки g1 > 0, то це означає, що спостерігається надлишок даних в області менших від середнього значень. Якщо g1 приймає негативне значення, то, навпаки, має місце надлишок даних в області більших від середнього значень. В разі g1= 0 вибірка є симетричною.
Для перевірки значимості отриманої коефіцієнту g1 знаходимо його дисперсію, середньоквадратичне відхилення (стандартну помилку) та розрахункове значення критерію Стьюдента:
Sg12 = ; Sg1 = 0,661;
tр =
Табличне значення t – критерію вибирають для числа ступенів свободи f → ∞ та заданого рівня значимості q. Приймемо для даного прикладу q = 0,01 і з таблиць знаходимо tт = 2,576. Оскільки tт < tр = 2,96, то можна казати про скошеність представленої вибірки, тобто про її асиметрію, з імовірністю 99%.
Крутизна розподілу вимірюється показником g2 , заснованим на сумі четвертих ступенів відхилень від середнього S4 :
К4 = ; g2 = .
Якщо g2 дорівнює нулю, то відхилення від нормального розподілу немає. Позитивне g2 вказує на надлишок спостережень біля середньої; негативне g2 виникає при плосковершинності кривої розподілу.
Величину стандартної помилки та розрахунковий критерій Стьюдента розраховують за формулами:
Sg2 = ; tp = .
Табличне значення t – критерію tт приймають для числа ступенів свободи f → ∞ та заданого рівня значимості q. При перевищенні табличного значення t – критерію над розрахунковим (tp < tт) відхилення крутизни розподілу у виборці від нормального є несуттєвим.
- Міністерство освіти і науки україни
- Національна металургійна академія україни
- Бобилєв в.П., іванов і.І., пройдак ю.С.
- Методологія та організація наукових досліджень
- Методологія та організація наукових досліджень.
- Рекомендовано Міністерством освіти і науки України як навчальний посібник для студентів вищих навчальних закладів, які навчаються за напрямом «Металургія» (лист № 1.4/18-г-700 від 28.03.08 р.)
- Загальні відомості щодо науки, наукових досліджень, кадрів та установ
- Особливості науки
- 1.2. Наука як система знань
- . Наукові дослідження, їх особливості і класифікація
- 1.4. Наукові установи і кадри
- 2. Вибір теми і формулювання задач наукових досліджень
- 2.1. Обгрунтування теми наукових досліджень
- . Складання техніко – економічного обгрунтування науково – дослідної роботи
- . Робота з науково – технічною інформацією
- 3. Методи теоретичних досліджень
- 3.1. Методологія теоретичних досліджень
- 3.2. Моделі досліджень
- Математичні методи аналізу
- 3.3.1. Аналітичні методи досліджень
- 3.3.2. Аналітичні методи досліджень з використанням експерименту
- 3.3.3. Ймовірносно – статистичні методи досліджень
- 3.3.4. Етапи системного аналізу
- 3.3.5. Принципи оптимізації технічних систем
- 3.3.6. Аналітична оптимізація об’єкту досліджень
- 3.3.7. Пошукові методи оптимізації технічних об’єктів та систем
- 3.3.8. Методи системного аналізу
- Вихідні дані до транспортної задачі
- Вихідні дані до задачі про склад сировини
- Вихідні дані до задачі планування виробництва
- 4. Методи експериментальних досліджень
- 4.1. Методологія експерименту
- 4.2. Співвідношення аналізу і експерименту
- 4.3. Оцінки характеристик змінних об’єкту
- . Кореляційний аналіз дослідних даних
- Апроксимація експериментальних даних
- Основний експеримент
- 4.6.1. Факторний експеримент за планами першого порядку
- Факторний експеримент другого порядку
- 5. Методи прогнозування
- . Класифікація методів прогнозування
- . Аналіз часових рядів
- . Методи експертних оцінок
- 6. Методи пошуку нових технічних рішень
- 6.1 Загальні методи та прийоми рішення технічних задач
- Евристичні методи і прийоми
- 6.3. Способи генерування альтернативних варіантів технічних рішень
- Винахідницька робота
- 7.1. Об’єкти винахідницького права
- 7.3. Оформлення винаходу
- 7.3.1. Вимога єдності винаходу
- 7.3.2. Склад заявки на отримання патенту
- 7.3.3. Формула винаходу
- . Об’єкти винаходу – “пристрій”, “спосіб”, “речовина”
- 8. Представлення результатів і організація наукової роботи
- 8.1. Складання звіту про ндр
- . Опублікування наукових матеріалів
- . Усне представлення результатів досліджень
- . Керівництво науковим колективом
- Література
- Додатки
- Значення нормованої функції Лапласа
- Значення критерію Стьюдента
- Відсоткові точки χ2 – розподілення
- Ентальпія газів, кДж/м3
- 49005, М. Дніпропетровськ, а/с 493