3. Групування статистичних даних
Групування взагалі, як основний елемент статистичного зведення, є розподіл сукупності масових явищ і процесів суспільного життя на типи і групи за найбільш характерними ознаками. Якщо ознаками виступають кількісні показники, то такий вид робіт (на відміну від класифікацій) називають у вузькому розумінні безпосередньостатистичним групуванням.
Метою статистичного групування є поділ сукупностей на однорідні типові групи за існуючими для них кількісними ознаками з метою всебічної характеристики їхнього стану, розвитку і взаємодії.
За допомогою групувань вирішують три важливі взаємопов'язані завдання: виділення різних соціально-економічних типів явищ (процесів) та всебічна їх характеристика; дослідження структури масової сукупності; вивчення взаємодії між окремими ознаками сукупності.
Залежно від мети та завдань дослідження групування поділяють на такі їх види: типологічні; структурні; аналітичні.
Групування, що приводять до виділення у складі масових явищ їх соціально-економічних типів (тобто однорідних частин за якістю та умовам розвитку, в яких діють одні ї теж закономірності факторів) називають типологічними. Прикладом цього виду групувань є групування населення за віковим складом, групування підприємств за формою власності тощо. Побудова цих групувань на тривалий час дозволяє простежити процес розвитку суспільства, форм власності. Групування, що направлені на вирішення даних задач, займають ведуче місце у вітчизняній статистиці.
Структурні групування характеризують склад однорідної сукупності за будь-якою ознакою. З допомогою таких групувань аналізують структуру сукупності і структурні зрушення в розвитку соціально-економічних явищ і процесів. До них належать групування населення за статтю, віком, а на виробництві - групування робітників за виробничим стажем, рівнем кваліфікації тощо.
Групування, які спрямовані на виявлення зв'язку між окремими ознаками явища, що вивчається, називаються аналітичними. Прикладом таких групувань можуть бути групування, в яких вивчаються взаємозв'язки між собівартістю та її факторами, продуктивністю праці та її факторами і т.д.
За кількістю групувальних ознак, покладених в основу групування, розрізняють прості та комбінаційні групування. Простим називають групування, яке проводиться за однією ознакою. У разі поєднання двох і більше ознак групування єкомбінаційним. У комбінаційних групуваннях групи з однією ознакою поділяються на підгрупи з іншою ознакою (наприклад, групування підприємств за формою власності, розміром прибутку, рівню рентабельності або за іншими ознаками - продуктивністю праці, фондовіддачею та ін.).
Поряд з первинним групуванням, види якого розглянуті вище, у статистиці застосовують вторинне, яке проводять на основі раніше здійсненого. Воно використовується для кращої характеристики досліджуваного явища, якщо первинне групування не дає змоги чітко визначити характер розподілу одиниць сукупності.
При використанні методу групування вирішують такі питання:
а) вибір групувальної ознаки;
б) визначення кількості груп та величини інтервалу;
в) встановлення переліку показників, якими повинні характеризуватись виділені групи стосовно конкретного групування;
г) складання макетів таблиць, де будуть представлені результати групування;
д) обчислення абсолютних, відносних і середніх показників;
ж) табличне і графічне оформлення результатів групування.
Принципове значення при побудові групувань має вибір групувальної ознаки, на основі якої виділяють різні типи, групи і підгрупи. За групувальні приймають найістотніші ознаки. Групувальною ознакою може бути атрибутивна (якісна) або кількісна ознака.При групуванні атрибутивною ознакою виділяють стільки груп, скільки є найменувань ознаки.
Таблиця 1.
Розподіл земель міста за видами забудови
Вид міської забудови | Площа, га | % від підсумку |
Промислова площа | 670 | 22,1 |
Житлова | 1920 | 63,5 |
Громадська | 315 | 10,4 |
Інша | 120 | 4,0 |
Всього | 3025 | 100 |
Перші три групи таблиці представляють основні види забудови, а четверта - об'єднує решту менш вагомих видів. Такий вид групування відноситься до структурного, яке в даному прикладі характеризує масштаби та вагомість окремих видів забудови на території міста.
При складанні групувань на основі кількісних ознак (дискретних або неперервних) визначають кількість груп та інтервали групування.
Для визначення кількості груп необхідно дотримуватись двох важливих умов побудови групувань: 1) виділені групи мають відрізнятися якісною однорідністю; 2) кількість одиниць у кожній групі має бути досить великою, що відповідає вимозі закону великих чисел. У масових сукупностях оптимальну кількість груп з рівними інтервалами приблизно можна визначити за формулою американського вченого Стерджеса:
т = 1+3,322 Ig n
де т - кількість груп;п - обсяг сукупності.
Формула Стерджеса може бути використана при умові, що розподіл одиниць сукупності за даною ознакою наближається до нормального закону розподілення.
Інтервали, тобто проміжок між значеннями ознаки в групі одиниць, бувають рівні, нерівні, відкриті та закриті. Вибір виду інтервалу залежить від характеру розподілу одиниць досліджуваної сукупності.
Рівні інтервали використовують у випадках, коли значення варіюючої ознаких змінюються плавно, поступово, рівномірно. Ширина інтервалуh визначається за формулою:
де хтах, хтіп - найбільше та найменше значення ознаки у сукупності. Наприклад, прибутковість активів комерційних банків коливається в межах від 5 до 45%. При прийнятті кількості групт=4 ширина інтервалу
= 10.
Тоді межі інтервалів становлять відповідно: 5-15, 15-25, 25-35, 35-45. Оскільки межі інтервалів збігаються (15 - в перший та другий групі, 25 - в другій та третій, 35 - в третій і четвертій), то для виключення невизначеності віднесення межових значень ознаки до той чи іншої групи використовують правило: ліве число не включає в себе значення ознаки, праве -включає. Тоді, наприклад, число 15 повинно бути віднесено до другої групи, а не першої. Всі інтервали у даному прикладі називаються закритими. Наведений розподіл прибутковості активів банків може бути представлено у іншому вигляді: до 15, 15-25, 25-35, 35 і більше. Перший і останній інтервали мають лише одну межу і називаютьсявідкритими.
Нерівні інтервали використовуються у разі, коли діапазон значень ознаки надто широкий і розподіл сукупності за цією ознакою нерівномірний. Наприклад, розподіл селищ міського типу за кількістю жителів (тис. чол.): до 3; 3-4,9; 5-9,9; 20-49,9.
- Тема 3. Зведення, класифікації та групування статистичних даних
- 1. Суть та організація статистичного зведення
- 2. Класифікації в економічній практиці
- 3. Групування статистичних даних
- 4. Ряди розподілу
- 5. Статистичні таблиці
- 6. Статистичні графіки
- Тема 4. Статистичні показники
- 1. Види, типи та значення статистичних показників
- 2. Абсолютні та відносні величини
- 3. Середні величини
- 4. Показники варіації
- Тема 5. Вибіркове спостереження
- 1. Поняття про вибіркове спостереження. Генеральна та вибіркова сукупність
- 2. Середня помилка вибірки
- 3. Гранична помилка вибірки. Визначення потрібної чисельності вибірки
- 4. Основні види вибірки та їх застосування в статистиці