logo
ctatistika

Тема 3. Зведення і групування статистичних даних

  1. Суть статистичного зведення і групування.

  2. Статистичні таблиці і графіки.

1.

Зареєстровану в процесі спостереження інформацію, характеризує лише окремі одиниці досліджуваної сукупності, подальше дослідження пов’язане з пошуком спільних рис у одиницях, що по суті є переходом від одиничного до загального. Цей перехід є змістом другого етапу статистичного дослідження, який назвали статистичним зведенням.

Суть статистичного зведення полягає у класифікації і агрегуванні даних спостереження.

Класифікація даних є розподіл даних за типами, видами чи класами.

Агрегування даних – це розташування одиниць в межах видів, типів чи класів у певному порядку.

Кожна класифікація є відповіддю на три питання:

  1. Яку ознаку взяти за основу розподілу сукупностей?

  2. На скільки частин сукупність потрібно розділити?

  3. Як розмежувати частини?

Якщо основою класифікації виступає атрибутивна ознака, то число груп сукупності визначається кількістю різновидів цієї ознаки.

Якщо основою класифікації виступає кількісна ознака, то число груп у сукупності залежить від того, якою є групувальна ознака: дискретною чи неперервною.

Дискретні ознаки характеризують сукупність, як таку, що має невелике число елементів (кількість дітей у сім’ї, число тарифних розрядів і т. ін.). Ці ознаки виражаються тільки цілими числами. Неперервні ознаки, навпаки, характеризують сукупність, як таку, що має велике число елементів.

Якщо основою класифікації виступає неперервна кількісна ознака, то кількість груп у сукупності визначається за формулою Стерджеса:

n=1+3.322 lg N; де

n – число груп у сукупності;

N – число одиниць у сукупності.

Число груп у сукупності обумовлює собою інтервали груп. Вони можуть бути рівними і нерівними.

Якщо інтервали рівні, то розмах інтервалу визначається за формулою:

H=(Xmax – Xmin)/n; де

Xmax – максимальне значення ознаки;

Xmin – мінімальне значення ознаки.

Приклад

Число учнівських місць в загальноосвітніх школах міста коливається в межах від 700 до 1600 одиниць. Необхідно визначити розмах інтервалу кожної групи шкіл, якщо кількість дітей шкільного віку у місті становить 100000 осіб.

h=(1600-700)/(1+3.322 lg 100000)=900/(1+16,61)=50

Послідовно додаючи значення розмаху інтервалу до нижньої межі кожного інтервалу, отримаємо значення розмаху інтервалу кожної групи шкіл: 700-750, 750-800, …, 1050-1100, 1500-1550, 1550-1600.

При цьому необхідно правильно визначити верхню і нижню межу кожного інтервалу. Наприклад, до якої групи віднести школу, якщо у ній 750 учнів, - до першої чи до другої. Якщо до числа верхньої межі групи застосувати принцип «включно», то школа відноситься до першої групи, якщо «виключно», - то до другої групи. На практиці використовують обидва принципи, але перевага віддається принципу «виключно».

Якщо інтервали нерівні, то розмах інтервалу не розраховується, а визначається виходячи із змістовної характеристики груп. Мінімальні і максимальні значення інтервалу розглядаються, як умовні межі переходу кількості у нову якість. Наприклад, групуючи чоловіків за ознакою працездатності, виділяють три групи: особи до працездатного віку (до 15 років), особи працездатного віку (16 – 59 років), особи після працездатного віку (60 років і більше).

Розрізняють закриті і відкриті інтервали, у яких максимальні і мінімальні межі інтервалу є визначеними. Відкритими називають інтервали, у яких максимальні або мінімальні межі невідомі. Тому, при групуванні, часто перший і останній інтервали є невизначеними.

Групи, утворені за однією ознакою, можуть бути поділеними на підгрупи за іншою ознакою, а підгрупи, у свою чергу, можуть поділятися за третьою ознакою і т.д.

Результати зведення і групування оформляються у вигляді статистичних таблиць і графіків.

2.

Статистичні таблиці є аналогом граматичному реченню. Підметом у такому реченні є об’єкт дослідження, тобто перелік елементів статистичної сукупності. Присудком таблиці є система показників, які характеризують підмет як об’єкт дослідження.

За зовнішнім виглядом статистична таблиця являє собою перетин вертикальних граф і горизонтальних рядків, які утворюють клітини таблиці. Ліві бічні і верхні клітини призначені для текстових заголовків, а решта клітин – для числових даних. Обов’язковими атрибутами таблиць є загальний і внутрішні заголовки. Загальний заголовок таблиці повинен коротко характеризувати її зміст. У ньому зазначають, до якого об’єкту відносяться дані, що саме характеризується в об’єкті, а також за який період або на який момент часу дані зафіксовані. Внутрішні заголовки розміщують з лівого боку і зверху. У бічних заголовках розкривається зміст підмету, у верхніх – зміст присудка.

Залежно від структури підмета, статистичні таблиці поділяють на прості, групові і комбінаційні.

Коли підмет містить лише перелік одиниць сукупності, тобто у ньому відсутнє групування елементів сукупності,то таблиці називаються простими.

Серед них розрізняють:

Інколи зустрічаються територіально-хронологічні або спискові-хронологічні таблиці.

У групових таблицях підмет групується за однією ознакою. У комбінаційних за двома і більше ознаками.

Приклад простої таблиці.

Таблиця. Споживання деяких продуктів харчування одним мешканцем Львівської області, кг.

Види продуктів

1996

1997

1998

1999

2000

М’ясопродукти

Рибопродукти

Овочеві продукти

Хлібні продукти

28,9

2,9

53,4

120,8

29,3

3,8

55,7

119,9

29,2

4,9

61,5

120,3

31,2

5,7

66,5

125,7

31,5

6,1

84,4

122,1

Приклад групової таблиці.

Таблиця. Підприємства галузі за вартістю основних фондів.

Вартість основних виробничих фондів, млн. грн.

Число заводів

Валова продукція, млн. грн.

Чисельність робітників, чол.

10-25

25-40

40-55

55-і>

3

9

5

3

56

26

23

15

820

1150

1945

1295

Разом

20

120

5210

Приклад комбінаційної таблиці.

Таблиця. Підприємства роздрібної торгівлі, тис. од.

Тип підприємств

Населені пункти

Разом

Міста

Села

СМТ

Магазини

Палатки

252,1

113,4

282,9

47,8

311,4

56,9

846,4

218,1

Всього

365,5

330,7

368,3

1064,5

Для кращого сприйняття і розуміння статистичної інформації використовуються графіки.

Усі графіки мають однакові складові елементи: поле графіка, графічний образ, просторові орієнтири, масштабну шкалу.

Поле графіка – це простір, у якому розміщуються геометричні фігури.

Графічний образ – це сукупність геометричних фігур, які відображають статистичні дані.

Просторовим орієнтиром найчастіше є прямокутна система координат.

Масштабна шкала – це числові позначки на осях, які відповідають певним пропорціям між реальними і нанесеними на поле графіка розмірами геометричного образу.

Графіки мають заголовки над або під полем графіка. У заголовку вказуються показники і масштабна шкала об’єкту.

Є два типи графіків: діаграми і картограми.

Діаграми відтворюють статистичну інформацію у вигляді геометричних фігур. Залежно від вигляду фігур діаграми бувають лінійними, стовпчиковими, стрічковими, секторними.

Приклад

За даними таблиці необхідно відобразити види діаграм.

Таблиця Випуск продукції на підприємстві, тис. грн.

Вид продукції

Випуск по кварталах

Всього

1

2

3

4

А

150

100

250

200

700

Б

400

350

400

300

1450

В

250

300

350

300

1200

Разом

800

750

1000

800

3350

Розв’язок.

1. Лінійні діаграми.

2. Стовпчикові діаграми.

3. Стрічкові діаграми.

4. Секторні діаграми.

Картограма – це статистична карта на якій розподіл певного явища на території зафарбовуються різним кольорами або заштриховуються залежно від густоти поширення цього явища.