7.2. Регресійний аналіз
Важливою характеристикою кореляційного зв’язку є лінія регресії — емпірична в моделі аналітичного групування і теоретична в моделі регресійного аналізу. Емпірична лінія регресії представлена груповими середніми результативної ознаки , кожна з яких належить до відповідного інтервалу значень групувального факторахj. Теоретична лінія регресії описується певною функцією яку називаютьрівнянням регресії, а Y — теоретичним рівнем результативної ознаки.
На відміну від емпіричної, теоретична лінія регресії неперервна. Так, уважають, що маса дорослої людини в кілограмах має бути на 100 одиниць менша за її зріст у сантиметрах. Співвідношення між масою і зростом можна записати у вигляді рівняння: , деу — маса; х — зріст.
Безперечно, така форма зв’язку між масою та зростом людини надто спрощена. Насправді збільшення маси не жорстко пропорційне до збільшення зросту. Люди одного зросту мають різну масу, проте в середньому зі збільшенням зросту маса зростає. Для точнішого відображення зв’язку між цими ознаками в рівняння слід увести другий параметр, який був би коефіцієнтом пропорційності при х, тобто Y = – 100 + bx.
Рівняння регресії в такому вигляді описує числове співвідношення варіації ознак х і у в середньому. Коефіцієнт пропорційності при цьому відіграє визначальну роль. Він показує, на скільки одиниць у середньому змінюється у зі зміною х на одиницю. У разі прямого зв’язку b — величина додатна, у разі оберненого — від’ємна.
Подаючи у як функцію х, тим самим абстрагуються від множинності причин, штучно спрощуючи механізм формування варіації у. Аналіз причинних комплексів здійснюється за допомогою множинної регресії.
Різні явища по-різному реагують на зміну факторів. Для того щоб відобразити характерні особливості зв’язку конкретних явищ, статистика використовує різні за функціональним видом регресійні рівняння. Якщо зі зміною фактора х результат у змінюється більш-менш рівномірно, такий зв’язок описується лінійною функцією Y = a + bx. Коли йдеться про нерівномірне співвідношення варіацій взаємозв’язаних ознак (наприклад, коли прирости значень у зі зміною х прискорені чи сповільнені або напрям зв’язку змінюється), застосовують нелінійні регресії, зокрема:
степеневу ;
гіперболічну ;
параболічну тощо.
Вибір та обґрунтування функціонального виду регресії ґрунтується на теоретичному аналізі суті зв’язку. Нехай вивчається зв’язок між урожайністю та кількістю опадів. Надто мала і надто велика кількість опадів спричинюють зниження врожайності, максимальний її рівень можливий за умови оптимальної кількості опадів, тобто зі збільшенням факторної ознаки (опади) урожайність спершу зростає, а потім зменшується. Залежність такого роду описується параболою Y = a + bx + cx2.
Вивчаючи зв’язок між собівартістю у та обсягом продукції х, використовують рівняння гіперболи , деа — пропорційні витрати на одиницю продукції, b — постійні витрати на весь випуск.
Зауважимо, що теоретичний аналіз суті зв’язку, хоча й дуже важливий, лише окреслює особливості форми регресії і не може точно визначити її функціонального виду. До того ж у конкретних умовах простору і часу межі варіації взаємозв’язаних ознак х і у значно вужчі за теоретично можливі. І якщо кривина регресії невелика, то в межах фактичної варіації ознак зв’язок між ними досить точно описується лінійною функцією. Цим значною мірою пояснюється широке застосування лінійних рівнянь регресії:
.
Параметр b (коефіцієнт регресії) — величина іменована, має розмірність результативної ознаки і розглядається як ефект впливу x на y. Параметр a — вільний член рівняння регресії, це значення y при x = 0. Якщо межі варіації x не містять нуля, то цей параметр має лише розрахункове значення.
Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого — мінімізація суми квадратів відхилень емпіричних значень y від теоретичних Y:
.
Математично доведено, що значення параметрів a та b, при яких мінімізується сума квадратів відхилень, визначаються із системи нормальних рівнянь:
,
.
Розв’язавши цю систему, знаходимо такі значення параметрів:
,
.
Розглянемо порядок обчислення параметрів лінійної регресії на прикладі зв’язку між урожайністю зернових і кількістю внесених добрив (у центнерах діючої поживної речовини — д. р.). Значення взаємозв’язаних ознак та необхідні для розрахунку параметрів величини наведено в табл. 7.3.
= 12; = 224;= 342,8;= 18,68;
= 12 : 8 = 1,5; = 224 : 8 = 28.
Таблиця 7.3
ДО РОЗРАХУНКУ ПАРАМЕТРІВ ЛІНІЙНОЇ РЕГРЕСІЇ, ТЕОРЕТИЧНИХ РІВНІВ І ЗАЛИШКОВИХ ВЕЛИЧИН
Номер господар- ства | Кількість внесених добрив х, д. р | Урожайність зернових у, ц/га | ху | х2 | Y | y – Y | (y – Y)2 |
1 | 1,1 | 23 | 25,3 | 1,21 | 24 | –1 | 1 |
2 | 1,4 | 25 | 35,0 | 1,96 | 27 | –2 | 4 |
3 | 1,2 | 26 | 31,2 | 1,44 | 25 | 1 | 1 |
4 | 2,0 | 33 | 66,0 | 4,00 | 33 | 0 | 0 |
5 | 1,5 | 27 | 40,5 | 2,25 | 28 | –1 | 1 |
6 | 1,3 | 2,8 | 36,4 | 1,69 | 26 | 2 | 4 |
7 | 1,8 | 30 | 54,0 | 3,24 | 31 | –1 | 1 |
8 | 1,7 | 32 | 54,4 | 2,89 | 30 | 2 | 4 |
Разом | 12,0 | 224 | 342,8 | 18,68 | 224 | | 16 |
Користуючись цими величинами, визначаємо:
(ц/га);
.
Отже, рівняння регресії має вигляд
,
тобто кожний центнер внесених добрив (у перерахунку на діючу поживну речовину) дає приріст урожайності в середньому 10 ц/га. Якщо добрива зовсім не вносити (х = 0), то урожайність зернових не перевищить 13,0 ц/га.
Рівняння регресії відбиває закон зв’язку між х і у не для окремих елементів сукупності, а для сукупності в цілому; закон, який абстрагує вплив інших факторів, виходить з принципу «за інших однакових умов». За цих умов очікувана врожайність зернових при внесенні добрив у обсязі 1,1 ц д. р. на 1 га становить Y = 13 + 10 1,1 = 24 (ц/га). Для інших значень факторної ознаки х теоретичні рівні врожайності наведено в табл. 7.3. Вплив інших окрім х факторів зумовлює відхилення емпіричних значень у від теоретичних у той чи інший бік. Відхилення (y – Y) називають залишками і позначають символом е. Залишки, як правило, менші за відхилення від середньої, тобто .
У нашому прикладі
, .
Відповідно загальна дисперсія врожайності
,
залишкова дисперсія
.
У невеликих за обсягом сукупностях коефіцієнт регресії схильний до випадкових коливань. Тому слід перевірити його істотність. Коли зв’язок лінійний, істотність коефіцієнта регресії перевіряють за допомогою t-критерію (Стьюдента), статистична характеристика якого для гіпотези визначається відношенням коефіцієнта регресіїb до власної стандартної похибки тобто.
Стандартна похибка коефіцієнта регресії залежить від варіації факторної ознаки залишкової дисперсіїі числа ступенів свободи, деm — кількість параметрів рівняння регресії:
.
Для лінійної функції m = 2. За даними табл. 7.3 маємо:
.
Звідси (ц/га), а, що перевищує критичне значення двосторонньогоt-критерію (табл. 6.3). Гіпотеза про випадковий характер коефіцієнта регресії відхиляється, а отже, з імовірністю 0,95 вплив кількості внесених добрив на врожайність зернових визнається істотним.
Для коефіцієнта регресії, як і для будь-якої іншої випадкової величини, визначаються довірчі межі . У нашому прикладі довірчі межі коефіцієнта регресії з імовірністю 0,95 (t = 2,45) становлять .
Важливою характеристикою регресійної моделі є відносний ефект впливу фактора х на результат у — коефіцієнт еластичності:
.
Він показує, на скільки процентів у середньому змінюється результат у зі зміною фактора х на 1%. У нашому прикладі тобто збільшення кількості внесених добрив на 1% спричинює приріст урожайності зернових у середньому на 0,8%.
Оцінити відносний ефект впливу фактора х на результат у можна безпосередньо на основі степеневої функції Y = axb, параметр b якої є коефіцієнтом еластичності. Степенева функція зводиться до лінійного виду логарифмуванням lg Y = lg a + b lg x. До класу степеневих належать функції споживання, виробничі функції тощо.
- 1. Предмет і метод статистики
- 1.1. Предмет статистики
- 1.2. Основні категорії статистики
- 1.3. Статистична методологія
- 2. СтаТиСтичне спостереження
- 2.1. Статистичне спостереження як метод інформаційного забезпечення
- 2.2. Програмно-методологічні питання статистичного спостереження
- 2.3. Організаційні питання статистичного спостереження
- 2.4. Форми, види та способи спостереження
- Завдання для самоконтролю
- 3. Зведення та групування статистичних даних
- 3.1. Суть статистичного зведення
- Назва таблиці
- 3.2. Класифікації та групування
- 3.3. Принципи формування груп
- 3.4. Статистичні таблиці
- Завдання для самоконтролю
- 1. Предмет і метод статистики
- 1.1. Предмет статистики
- 1.2. Основні категорії статистики
- 1.3. Статистична методологія
- 2. СтаТиСтичне спостереження
- 2.1. Статистичне спостереження як метод інформаційного забезпечення
- 2.2. Програмно-методологічні питання статистичного спостереження
- 2.3. Організаційні питання статистичного спостереження
- 2.4. Форми, види та способи спостереження
- Завдання для самоконтролю
- 3. Зведення та групування статистичних даних
- 3.1. Суть статистичного зведення
- Назва таблиці
- 3.2. Класифікації та групування
- 3.3. Принципи формування груп
- 3.4. Статистичні таблиці
- Завдання для самоконтролю
- 4. Статистичні показники
- 4.1. Суть і види статистичних показників
- 4.2. Абсолютні величини
- 4.3. Відносні величини
- Відносні величини динаміки
- Відносні величини просторових порівнянь
- Відносні величини порівняння зі стандартом
- Відносні величини структури
- Відносні величини координації
- Матеріальні запаси фірми
- Відносні величини інтенсивності
- 4.4. Середні величини
- Середня арифметична
- Ставлення населення до смертної кари
- Середня гармонічна
- Середня геометрична
- 4.5. Система статистичних показників
- Багатовимірні середні інвестиційної привабливості цінних паперів
- 5. Ряди розподілу. Аналіз варіацій та форми розподілу
- 5.1. Закономірність розподілу
- 5.2. Характеристики центра розподілу
- 5.3. Характеристики варіації
- 5.4. Характеристики форми розподілу
- 5.5. Види та взаємозв’язок дисперсій
- 6.1. Суть вибіркового спостереження
- 6.2. Вибіркові оцінки середньої та частки
- 6.3. Різновиди вибірок
- 6.4. Визначення обсягу вибірки
- 6.5. Статистична перевірка гіпотез
- Завдання для самоконтролю
- 7. Методи аналізу взаємозв’язків
- 7.1. Види взаємозв’язків
- Види взаємозв’язків і їх особливості
- 7.2. Регресійний аналіз
- 7.3. Оцінка щільності та перевірка істотності кореляційного зв’язку
- 7.4. Рангова кореляція
- 7.5. Оцінка узгодженості варіації атрибутивних ознак
- Завдання для самоконтролю
- 8.1. Суть і складові елементи динамічного ряду
- 8.2. Характеристики інтенсивності динаміки
- 8.3. Середня абсолютна та відносна швидкість розвитку
- 8.4. Характеристика основної тенденції розвитку
- 8.5. Оцінка коливань та сталості динаміки
- Тренд і сезонні коливання продажу безалкогольних напоїв
- До розрахунку залишкової дисперсії
- 9. Індекси
- 9.1. Суть і функції індексів
- 9.2. Методологічні основи побудови зведених індексів
- 9.3. Агрегатна форма індексів
- 9.4. Середньозважені індекси
- 9.5. Взаємозв’язки індексів
- 9.6. Індекси середніх величин
- 9.7. Територіальні індекси
- Товарна маса і ціни експорту
- Завдання для самоконтролю
- Економічна та соціальна статистика
- 10.3. Система національних рахунків
- Класифікація рахунків снр
- Продовження табл. 10.2
- Закінчення табл. 10.2
- Рахунок товарів та послуг
- Рахунок виробництва
- Рахунок утворення доходів
- Розрахунок розподілу первинних доходів
- Рахунок вторинного розподілу доходів
- Рахунок перерозподілу доходів у натурі
- Рахунок використання наявного доходу
- Рахунок використання скоригованого наявного доходу
- Фінансовий рахунок
- Завдання для самоконтролю
- 11. Статистика національного багатства
- 11.1. Поняття, значення та завдання статистичного вивчення національного багатства
- 11.2. Статистика природних ресурсів
- 11.3. Статистика національного майна
- 12. Статистика населення
- 12.1. Методологічні особливості статистики населення
- 12.2. Статистика чисельності, складу та розміщення населення
- Розподіл постійного населення україни за статтю на 01.01.99
- Вікові контингенти населення україни в розрізі статі станом на 01.01.89 та 01.01.99, % до підсумку
- 12.3. Статистика природного руху та відтворення населення
- 12.4. Механічний рух населення та його статистичні показники
- 12.5. Перспективні розрахунки населення
- Фрагмент перспективних розрахунків чисельності хлопчиків україни за даними останнього перепису
- 13. Статистика трудових ресурсів
- 13.1. Поняття, склад та рух трудових ресурсів
- 13.2. Особливості статистичного
- 3. Рівні безробіття.
- 13.3. Статистичне вивчення якості робочої сили
- Завдання для самоконтролю
- 14. Статистика продукції
- 14.1. Проблеми обліку, розрахунку та зіставлення показників продукції
- 14.2. Макроекономічні показники продукції
- Фактори індексної моделі
- Завдання для самоконтролю
- 15. Статистика цін і тарифів
- 15.1. Види цін та організація їх статистичного спостереження
- 15.2. Динаміка цін і тарифів виробників товарів та послуг
- 15.3. Динаміка споживчих цін
- Динаміка обсягу та зміни цін і тарифів на окремі основні платні послуги населенню в 1997—1998 рр.
- 15.4. Міждержавні та міжрегіональні порівняння цін і тарифів
- Реалізація і ціни товарів у містах а та б
- 15.5. Методи оцінювання показників виробництва товарів та послуг за порівнянними цінами
- 16. Статистика ринку
- 16.1. Статистичне вивчення ринку
- 16.2. Особливості статистичного вивчення ринку споживчих товарів
- 16.3. Особливості статистичного вивчення ринку засобів виробництва
- Баланс міжрегіональних зв’язків
- Елемент аij по горизонталі показує напрями потоку товарів (з області і в область j). Цей самий елемент по вертикалі показує джерела постачання в j-ту область.
- Із цієї формули випливають інші співвідношення, необхідні для аналізу формування ресурсів окремих областей:
- Тоді місткість ринку можна визначити за формулою
- 16.4. Статистика товарного обороту внутрішньої торгівлі
- 16.5. Статистичне забезпечення маркетингу на ринку банківських послуг
- Завдання для самоконтролю
- 17. Статистика зовнішньоекономічної діяльності
- 17.1. Предмет і завдання статистики зовнішньоекономічної діяльності
- 17.2. Статистика зовнішньої торгівлі
- 17.3. Статистика платіжного балансу
- 17.4. Статистика обмінних курсів
- 18. Статистика фінансів
- 18.1. Статистика державного бюджету
- 1) Тип податку, як він визначений у сдф (акцизи, податок на нерухомість тощо);
- 2) Тип інституційної одиниці, яка сплачує податок (домашнє господарство, державне підприємство, комерційна організація);
- 3) Обставини, за яких сплачується податок (продукція вироблена, імпортована, підготовлена на експорт).
- Завдання для самоконтролю
- 18.2. Статистика грошового обігу
- 1) Прогнозування попиту на гроші;
- 2) Прогнозування пропозиції грошей.
- Питання для самоконтролю
- 18.3. Статистика інвестиційної діяльності
- Завдання для самоконтролю
- 18.4. Статистика кредитної діяльності
- 18.5. Статистика страхової діяльності
- Розрахунок варіації нетто-ставки
- 19. Статистика ефективності
- 19.1. Статистика ефективності суспільного виробництва
- 19.2. Оцінка ефективності комерційної діяльності
- 19.3. Оцінки ефективності банківської діяльності
- Поділи, за якими виконується статистичний аналіз ефективності
- Завдання для самоконтролю
- 19.4. Статистика ефективності праці
- Завдання для самоконтролю
- 19.5. Статистика ефективності використання матеріальних ресурсів
- Завдання для самоконтролю
- 19.6. Статистика ефективності фінансової діяльності
- Завдання для самоконтролю
- 20. Статистика рівня життя населення
- 20.1. Статистика доходів населення
- 20.2. Статистика споживання населенням матеріальних благ та послуг
- Вихідні дані для розрахунку індексів рівня споживання
- Індекси рівня споживання
- 20.3. Статистика соціального обслуговування
- Завдання для самоконтролю