3.3. Принципи формування груп
Якщо групувальна ознака неперервна, постає питання про кількість груп та межі кожної з них. Кількість груп залежить від ступеня варіації групувальної ознаки та обсягу сукупності. Так, для дискретної ознаки, діапазон варіації якої обмежений (кількість дітей у сім’ї, тарифний розряд тощо), груп, як правило, стільки, скільки варіант ознаки. У разі значної варіації дискретної ознаки (кількість працюючих на підприємстві, кількість укладених на біржі угод), як і неперервної (стаж роботи працівника, собівартість продукції), діапазон варіації розбивається на m інтервалів.
Орієнтовно оптимальна кількість груп визначається за стандартними процедурами, зокрема за формулою Стерджеса:
m = 1 + 2,30259 lg n,
де n — обсяг сукупності; m — число інтервалів.
Інтервали являють собою каркас групувань. На практиці їх утворюють за трьома формальними принципами: рівності інтервалів; кратності інтервалів; рівності частот.
У структурних і аналітичних групуваннях найчастіше застосовують принцип рівності інтервалів. Ширина кожного інтервалу залежить від діапазону варіації ознаки х та обґрунтованого числа груп (інтервалів) m:
.
Визначаючи межі інтервалів, ширину h доцільно округлювати, самі межі слід позначати з такою точністю, щоб поділ елементів сукупності на групи був однозначним.
Якщо діапазон варіації ознаки надто широкий і поділ значень нерівномірний, беруть нерівні інтервали, зокрема сформовані за принципом кратності, коли ширина кожного наступного інтервалу в k раз більша (менша), ніж попереднього.
Припустимо, що прибутковість активів комерційних банків коливається від 1 до 42%, а прибутковість капіталу — від 11 до 165%. За кожною ознакою утворимо чотири групи (m = 4), скориставшись за прибутковістю активів принципом рівних інтервалів, тобто h = (42 – 1) : 4 10, а за прибутковістю капіталу — принципом кратності інтервалів (k = 2). Варіанти розбиття на групи ілюструє табл. 3.5.
Таблиця 3.5
ВАРІАНТИ ФОРМУВАННЯ ІНТЕРВАЛІВ ГРУПУВАНЬ ЗА РІВНЕМ ПРИБУТКОВОСТІ, %
Прибутковість активів | Прибутковість капіталу |
До 10 | 11 — 20 |
10 — 20 | 21 — 40 |
20 — 30 | 41 — 80 |
30 і більше | 81 і більше |
Перший та останній інтервали (або один із них) відкриті, тобто мають лише одну межу (верхню чи нижню). За допомогою відкритих інтервалів усі крайні значення ознаки, що варіює, зводяться в одну групу, завдяки чому групування стає компактним. Межі інтервалів визначаються по-різному. У першому варіанті групування верхня межа j-го інтервалу збігається з нижньою межею (j + 1)-го інтервалу. Правило віднесення межових значень ознаки до відповідного інтервалу задають слова, що стосуються відкритих інтервалів. Зокрема, слово «до» в першому інтервалі означає, що нижню межу слід уважати належною, а верхню — не належною інтервалу.
У другому варіанті групування верхня межа j-го інтервалу і нижня межа (j + 1)-го інтервалу різняться між собою. У цьому разі обидві межі вважаються такими, що належать інтервалу.
Інтервали типологічного групування формуються не за математичними принципами, а за соціально-економічним змістом. Межа інтервалу розглядається як умовна межа переходу кількості в нову якість. Число груп залежить від кількості існуючих типів. Наприклад, групуючи чоловіків за ознакою працездатності, застосовують вікові групи, років:
0—15 — особи допрацездатного віку;
16—59 — працездатного;
60 і більше — старші за працездатний вік.
Принцип рівних частот використовують нечасто і переважно в аналітичних групуваннях, щоб уникнути зважування групових середніх (дисперсійний аналіз результатів експерименту).
Групування за однією ознакою називається простим, за двома і більше ознаками — комбінаційним. У комбінаційних групуваннях ознаки ієрархічно впорядковуються за змістом чи за вагомістю.
Групи, утворені за першою ознакою, поділяються на підгрупи за другою, а ті, у свою чергу, можуть поділятися на підгрупи за третьою ознакою і т. д. На кожному етапі поділу використовується лише одна ознака, тобто відбувається послідовне описування груп. Кількість підгруп дорівнює добутку числа групувальних ознак на число градацій за кожною з них. У разі трьох і більше групувальних ознак сукупність стрімко подрібнюється, групи виявляються нечисленними, а характеристики груп — ненадійними.
Альтернативою комбінаційному групуванню є багатовимірне, коли групи утворюються за певною множиною ознак одночасно. Мірою подібності елементів є різні критерії і, як наслідок, — різні методи багатовимірного групування. Найпростішим серед них є групування за інтегральним показником, наприклад за рейтинговою оцінкою. У такому разі багатовимірне групування зводиться до простого.
Іноді доводиться перегруповувати дані, передусім щоб забезпечити порівнянність структур двох сукупностей за однією і тією самою ознакою. Результат перегрупування називають вторинним групуванням. Перегрупування виконують або об’єднанням, або розбиттям інтервалів первинного групування.
Якщо межі інтервалів первинного і вторинного групувань збігаються, частоти (частки) об’єднувальних інтервалів просто підсумовуються. Коли виконується розбиття інтервалу первинного групування, частоти поділяються між новоутвореними групами пропорційно до співвідношення частин довжини початкового інтервалу. Припускається, що всередині інтервалу поділ рівномірний.
Техніку перегрупування даних розглянемо на прикладі поділу працюючих за розміром середньомісячної заробітної плати у двох галузях промисловості (табл. 3.6).
Таблиця 3.6
ПОДІЛ ПРАЦЮЮЧИХ ЗА РІВНЕМ СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ
Галузь А | Галузь В | |||
Заробітна плата, грн. | Частка працюючих, % | Заробітна плата, грн. | Частка працюючих, % | |
До 160 | 15 | До 160 | 12 | |
160 — 180 | 20 | 160 — 190 | 30 | |
180 — 200 | 26 | 190 — 220 | 21 | |
200 — 220 | 23 | 220 — 250 | 18 | |
220 — 240 | 9 | 250 — 280 | 13 | |
240 і більше | 7 | 280 і більше | 6 | |
Разом | 100 | Разом | 100 |
Результати первинного групування безпосередньо порівняти не можна, оскільки інтервали групування різні: у галузі А ширина інтервалу 20, у галузі В — 30 грн. Перегрупуємо дані, утворивши п’ять груп з інтервалом h = 40 грн. Очевидно, інтервали поділу в галузі А потрібно об’єднати, а в галузі В — розбити. Результати вторинного групування ілюструє табл. 3.7.
Таблиця 3.7
ВТОРИННЕ ГРУПУВАННЯ ПРАЦЮЮЧИХ ЗА РІВНЕМ СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ
Заробітна плата, грн. | Частка працюючих, % | |
Галузь А | Галузь В | |
До 160 | 15 | 12 |
160 — 200 |
20 + 26 = 46 | |
200 — 240 |
23 + 9 = 32 | |
240 — 280 |
7 | |
280 і більше | — | 6 |
Разом | 100 | 100 |
Порівнявши частки вторинного групування, побачимо, що в галузі В сукупність працюючих за рівнем заробітної плати більш диференційована. Перегрупуванням даних можна перейти від структурного групування до типологічного.
- 1. Предмет і метод статистики
- 1.1. Предмет статистики
- 1.2. Основні категорії статистики
- 1.3. Статистична методологія
- 2. СтаТиСтичне спостереження
- 2.1. Статистичне спостереження як метод інформаційного забезпечення
- 2.2. Програмно-методологічні питання статистичного спостереження
- 2.3. Організаційні питання статистичного спостереження
- 2.4. Форми, види та способи спостереження
- Завдання для самоконтролю
- 3. Зведення та групування статистичних даних
- 3.1. Суть статистичного зведення
- Назва таблиці
- 3.2. Класифікації та групування
- 3.3. Принципи формування груп
- 3.4. Статистичні таблиці
- Завдання для самоконтролю
- 1. Предмет і метод статистики
- 1.1. Предмет статистики
- 1.2. Основні категорії статистики
- 1.3. Статистична методологія
- 2. СтаТиСтичне спостереження
- 2.1. Статистичне спостереження як метод інформаційного забезпечення
- 2.2. Програмно-методологічні питання статистичного спостереження
- 2.3. Організаційні питання статистичного спостереження
- 2.4. Форми, види та способи спостереження
- Завдання для самоконтролю
- 3. Зведення та групування статистичних даних
- 3.1. Суть статистичного зведення
- Назва таблиці
- 3.2. Класифікації та групування
- 3.3. Принципи формування груп
- 3.4. Статистичні таблиці
- Завдання для самоконтролю
- 4. Статистичні показники
- 4.1. Суть і види статистичних показників
- 4.2. Абсолютні величини
- 4.3. Відносні величини
- Відносні величини динаміки
- Відносні величини просторових порівнянь
- Відносні величини порівняння зі стандартом
- Відносні величини структури
- Відносні величини координації
- Матеріальні запаси фірми
- Відносні величини інтенсивності
- 4.4. Середні величини
- Середня арифметична
- Ставлення населення до смертної кари
- Середня гармонічна
- Середня геометрична
- 4.5. Система статистичних показників
- Багатовимірні середні інвестиційної привабливості цінних паперів
- 5. Ряди розподілу. Аналіз варіацій та форми розподілу
- 5.1. Закономірність розподілу
- 5.2. Характеристики центра розподілу
- 5.3. Характеристики варіації
- 5.4. Характеристики форми розподілу
- 5.5. Види та взаємозв’язок дисперсій
- 6.1. Суть вибіркового спостереження
- 6.2. Вибіркові оцінки середньої та частки
- 6.3. Різновиди вибірок
- 6.4. Визначення обсягу вибірки
- 6.5. Статистична перевірка гіпотез
- Завдання для самоконтролю
- 7. Методи аналізу взаємозв’язків
- 7.1. Види взаємозв’язків
- Види взаємозв’язків і їх особливості
- 7.2. Регресійний аналіз
- 7.3. Оцінка щільності та перевірка істотності кореляційного зв’язку
- 7.4. Рангова кореляція
- 7.5. Оцінка узгодженості варіації атрибутивних ознак
- Завдання для самоконтролю
- 8.1. Суть і складові елементи динамічного ряду
- 8.2. Характеристики інтенсивності динаміки
- 8.3. Середня абсолютна та відносна швидкість розвитку
- 8.4. Характеристика основної тенденції розвитку
- 8.5. Оцінка коливань та сталості динаміки
- Тренд і сезонні коливання продажу безалкогольних напоїв
- До розрахунку залишкової дисперсії
- 9. Індекси
- 9.1. Суть і функції індексів
- 9.2. Методологічні основи побудови зведених індексів
- 9.3. Агрегатна форма індексів
- 9.4. Середньозважені індекси
- 9.5. Взаємозв’язки індексів
- 9.6. Індекси середніх величин
- 9.7. Територіальні індекси
- Товарна маса і ціни експорту
- Завдання для самоконтролю
- Економічна та соціальна статистика
- 10.3. Система національних рахунків
- Класифікація рахунків снр
- Продовження табл. 10.2
- Закінчення табл. 10.2
- Рахунок товарів та послуг
- Рахунок виробництва
- Рахунок утворення доходів
- Розрахунок розподілу первинних доходів
- Рахунок вторинного розподілу доходів
- Рахунок перерозподілу доходів у натурі
- Рахунок використання наявного доходу
- Рахунок використання скоригованого наявного доходу
- Фінансовий рахунок
- Завдання для самоконтролю
- 11. Статистика національного багатства
- 11.1. Поняття, значення та завдання статистичного вивчення національного багатства
- 11.2. Статистика природних ресурсів
- 11.3. Статистика національного майна
- 12. Статистика населення
- 12.1. Методологічні особливості статистики населення
- 12.2. Статистика чисельності, складу та розміщення населення
- Розподіл постійного населення україни за статтю на 01.01.99
- Вікові контингенти населення україни в розрізі статі станом на 01.01.89 та 01.01.99, % до підсумку
- 12.3. Статистика природного руху та відтворення населення
- 12.4. Механічний рух населення та його статистичні показники
- 12.5. Перспективні розрахунки населення
- Фрагмент перспективних розрахунків чисельності хлопчиків україни за даними останнього перепису
- 13. Статистика трудових ресурсів
- 13.1. Поняття, склад та рух трудових ресурсів
- 13.2. Особливості статистичного
- 3. Рівні безробіття.
- 13.3. Статистичне вивчення якості робочої сили
- Завдання для самоконтролю
- 14. Статистика продукції
- 14.1. Проблеми обліку, розрахунку та зіставлення показників продукції
- 14.2. Макроекономічні показники продукції
- Фактори індексної моделі
- Завдання для самоконтролю
- 15. Статистика цін і тарифів
- 15.1. Види цін та організація їх статистичного спостереження
- 15.2. Динаміка цін і тарифів виробників товарів та послуг
- 15.3. Динаміка споживчих цін
- Динаміка обсягу та зміни цін і тарифів на окремі основні платні послуги населенню в 1997—1998 рр.
- 15.4. Міждержавні та міжрегіональні порівняння цін і тарифів
- Реалізація і ціни товарів у містах а та б
- 15.5. Методи оцінювання показників виробництва товарів та послуг за порівнянними цінами
- 16. Статистика ринку
- 16.1. Статистичне вивчення ринку
- 16.2. Особливості статистичного вивчення ринку споживчих товарів
- 16.3. Особливості статистичного вивчення ринку засобів виробництва
- Баланс міжрегіональних зв’язків
- Елемент аij по горизонталі показує напрями потоку товарів (з області і в область j). Цей самий елемент по вертикалі показує джерела постачання в j-ту область.
- Із цієї формули випливають інші співвідношення, необхідні для аналізу формування ресурсів окремих областей:
- Тоді місткість ринку можна визначити за формулою
- 16.4. Статистика товарного обороту внутрішньої торгівлі
- 16.5. Статистичне забезпечення маркетингу на ринку банківських послуг
- Завдання для самоконтролю
- 17. Статистика зовнішньоекономічної діяльності
- 17.1. Предмет і завдання статистики зовнішньоекономічної діяльності
- 17.2. Статистика зовнішньої торгівлі
- 17.3. Статистика платіжного балансу
- 17.4. Статистика обмінних курсів
- 18. Статистика фінансів
- 18.1. Статистика державного бюджету
- 1) Тип податку, як він визначений у сдф (акцизи, податок на нерухомість тощо);
- 2) Тип інституційної одиниці, яка сплачує податок (домашнє господарство, державне підприємство, комерційна організація);
- 3) Обставини, за яких сплачується податок (продукція вироблена, імпортована, підготовлена на експорт).
- Завдання для самоконтролю
- 18.2. Статистика грошового обігу
- 1) Прогнозування попиту на гроші;
- 2) Прогнозування пропозиції грошей.
- Питання для самоконтролю
- 18.3. Статистика інвестиційної діяльності
- Завдання для самоконтролю
- 18.4. Статистика кредитної діяльності
- 18.5. Статистика страхової діяльності
- Розрахунок варіації нетто-ставки
- 19. Статистика ефективності
- 19.1. Статистика ефективності суспільного виробництва
- 19.2. Оцінка ефективності комерційної діяльності
- 19.3. Оцінки ефективності банківської діяльності
- Поділи, за якими виконується статистичний аналіз ефективності
- Завдання для самоконтролю
- 19.4. Статистика ефективності праці
- Завдання для самоконтролю
- 19.5. Статистика ефективності використання матеріальних ресурсів
- Завдання для самоконтролю
- 19.6. Статистика ефективності фінансової діяльності
- Завдання для самоконтролю
- 20. Статистика рівня життя населення
- 20.1. Статистика доходів населення
- 20.2. Статистика споживання населенням матеріальних благ та послуг
- Вихідні дані для розрахунку індексів рівня споживання
- Індекси рівня споживання
- 20.3. Статистика соціального обслуговування
- Завдання для самоконтролю