Теорія статистики - Мармоза А.Т. -
3.5. Ряди розподілу

Особливим видом групувань в статистиці є ряди розподілу, які є найпростішим способом упорядкування і узагальнення статистичних даних. Групування, в якому виділені групи характеризуються тільки їхньою чисельністю або питомою вагою в загальному обсязі сукупності, називають статистичним рядом розподілу (наприклад, розподіл господарств району за урожайністю, продуктивністю тварин, робітників за тарифним розрядом та ін.).

Статистичні ряди розподілу являють собою упорядкований розподіл одиниць досліджуваної сукупності на групи за групувальною ознакою. Вони характеризують структуру (склад) досліджуваного явища, дають змогу судити про однорідність сукупності, про варіювання досліджуваної ознаки.

Ряди розподілу складаються з двох елементів: найменування групи з відповідними значеннями досліджуваної ознаки і чисельності одиниць, що увійшли до кожної групи. В цьому їх відміна від статистичних групувань, при побудові яких кожна група характеризується системою пов'язаних і взаємозалежних між собою показників.

Найпростішим видом статистичних рядів розподілу є ранжирований ряд, в якому значення досліджуваної ознаки розташовані у порядку зростання або зменшення. Однак ранжирований ряд ще не дає загальної картини розподілу, так як не видно, яка закономірність закладена в розподілі, навколо якої величини концентруються варіанти. Тому виникає потреба подальшого узагальнення статистичних даних, об'єднання їх в окремі групи і підрахунку частот для кожної групи. В результаті здійснення цієї операції одержимо варіаційний ряд розподілу.

Ряди розподілу, утворені за якісною ознакою називають атрибутивними. Прикладом таких рядів можуть бути розподіли населення за статтю (табл. 3.2), освітою, тварин за породою, рослин за сортом і т.д.

Різновидом атрибутивних рядів розподілу є альтернативні ряди. Альтернативними називають ряди якісних ознак, які приймають тільки два значення, що виключають одне одного: так або ні. Прикладом таких рядів може бути розподіл господарств району на прибуткові і збиткові, або на такі, що виконали і не виконали план виробництва продукції тощо.

Ряди розподілу, побудовані за кількісними ознаками, називають варіаційними. Варіаційний ряд розподілу являє собою упорядковану статичну сукупність, в якій значення варіант розташовані в ранжирований ряд із зазначенням для кожного інтервалу (групи) відповідних частот (частостей).

Варіаційні ряди розподілу складаються з двох елементів: варіант і частот. Варіанта - це окреме значення ознаки, яке вона приймає в ряду розподілу. Частотами називають чисельності окремих варіант або кожної групи варіаційного ряду. Частоти можуть бути виражені як в абсолютних величинах, тобто числом будь - яких одиниць, так і у відносних величинах у вигляді часток і процентів до підсумку. Частоти, що виражені в частках одиниці або в процентах до підсумку, називають частостями. Суму частот варіаційного ряду називають його обсягом. Сума частот дорівнює одиниці, якщо вони виражені в частках одиниці, і 100%, якщо виражені в процентах. У математичній статистиці для визначення деяких характеристик (наприклад, медіани) розраховують нагромаджені частоти - сума частот (частостей) варіантів від мінімального значення до даного значення. Нагромаджені частоти визначаються шляхом послідовного додавання до частот (частостей) першої групи частот наступних груп ряду розподілу (див. табл. 3.10).

Варіаційні ряди розподілу підрозділяються на дискретні (перервні) та інтервальні (безперервні).

Дискретні - це такі варіаційні ряди розподілу, в яких варіанти приймають значення тільки цілих чисел. Прикладом дискретного ряду розподілу може бути розподіл господарств району за кількістю бурякозбиральних комбайнів (табл. 3.9).

Таблиця 3.9. Розподіл господарств району за кількістю бурякозбиральних комбайнів

Кількість комбайнів у господарстві, шт.

Кількість господарств

В % до підсумку

2

3

11,5

3

4

15,4

4

5

19,2

5

6

23,1

6

5

19,2

7

3

11,6

Разом

26

100,0

Інтервальними називають ряди розподілу, в яких варіанти дані у вигляді інтервалів. Приклад інтервального ряду розподілу наведено в табл. 3.10, де наводиться розподіл 100 господарств за надоєм молока на корову.

У наведеному прикладі варіантами є значення надою на корову, а частотами - чисельність господарств.

При побудові рядів розподілу виникають запитання щодо числа груп, величини інтервалу, його межі. Методологія побудови рядів розподілу Ґрунтується на викладеній вище методології побудови статистичних групувань.

Якщо варіаційний ряд розподілу має групи з нерівними інтервалами, то частоти в окремих інтервалах безпосередньо неспівставні, так як залежать від ширини інтервалу. Для того щоб частоти можна було порівнювати, обчислюють щільність розподілу та відносну щільність розподілу. Перша характеристика визначається відношенням частоти до величини інтервалу, друга - відношенням частості до величини інтервалу.

Таблиця 3.10. Інтервальний варіаційний ряд розподілу 100 господарств за надоєм молока на корову

Номер групи

Межі інтервалів

Кількість

Питома вага

Нагромаджені частоти

за надоєм молока на корову, ц

господарств (частота)

в % до підсумку

в частках (частота)

I

26 - 28

8

8,0

0,080

8

II

28 - 30

16

16,0

0,160

24(8+16)

III

30 - 32

17

17,0

0,170

41(24+17)

IV

32 - 34

25

25,0

0,250

66(41+25)

V

34 - 36

18

18,0

0,180

84(66+18)

VI

36 - 38

11

11,0

0,110

95(84+11)

VII

38 - 40

5

5,0

0,050

100(95+5)

Разом

X

100

100,0

1,000

-

Для наочності та полегшення аналізу рядів розподілу їх зображують графічно у вигляді: огіви, полігону, гістограми і кумуляти.

Графічне зображення варіаційного ряду розподілу називають кривою розподілу.

Статистична сукупність, представлена у вигляді ранжированого ряду, графічно зображується у вигляді огіви. Огіва будується так: на ось абсцис наносять номери елементів сукупності за ранжиром, а на осі ординат відкладаються значення ознаки (варіант). Огіва наочно показує зміну досліджуваної ознаки.

Послідовність побудови огіви покажемо на такому прикладі ранжированого ряду урожайності хмелю у 18 господарствах району (ц/ га):

Огіва розподілу господарств за урожайністю хмелю

Рис. 3.1. Огіва розподілу господарств за урожайністю хмелю

У вигляді полігону (многокутника розподілу) звичайно зображують дискретні варіаційні ряди розподілу. При цьому на осі абсцис відкладаються значення варіант, а на осі ординат - частота або частість. За даними табл. 3.9 побудуємо полігон розподілу господарств району за чисельністю бурякозбиральних комбайнів (рис. 3.2).

Полігон розподілу господарств району за чисельністю бурякозбиральних комбайнів

Рис. 3.2. Полігон розподілу господарств району за чисельністю бурякозбиральних комбайнів

Для зображення інтервальних варіаційних рядів розподілу застосовується гістограма, яка являє собою фігуру у вигляді прямокутників, що прилягають один до одного. Порядок побудови гістограми такий: на осі абсцис відкладають інтервали варіантів, а на осі ординат - частоти (частості).

Над віссю абсцис будуються прямокутники, площа яких відповідає величинам добутків інтервалів на їх частоти. Ширина стовпчиків при рівних інтервалах однакова, при нерівних - неоднакова. Якщо середини верхніх сторін прямокутників (середини інтервалів) з'єднати, то одержимо полігон розподілу.

За даними табл. 3.10 побудуємо гістограму розподілу 100 господарств за надоєм молока на корову (рис. 3.3).

При зображені інтервальних рядів розподілу з нерівними інтервалами гістограму будують не за частотами (частостями) інтервалів, а за показниками щільності розподілу. При побудові гістограми за абсолютною щільністю розподілу загальна її площа дорівнює чисельності сукупності. При побудові графіка відносної щільності площа гістограми дорівнює одиниці.

При розв'язуванні деяких задач зручніше користуватись нагромадженими частотами. При цьому значення чисельностей окремих варіант замінюється нагромадженими частотами, які одержують підсумуванням частоти даної варіанти з попередніми частотами.

Гістограма розподілу господарств за надоєм молока на корову

Рис. 3.3. Гістограма розподілу господарств за надоєм молока на корову

Варіаційний ряд з нагромадженими частотами на графіку зображується у вигляді кривої, яка одержала назву кумуляти розподілу.

Для побудови кумуляти спочатку підраховують нагромаджені частоти, послідовно підсумовуючи їх (див. графу 6 табл. 3.10). Якщо розподіл має дискретний (перервний) характер, то на графіку на осі абсцис відкладають значення варіант, а на осі ординат - нагромаджені частоти (частості). Якщо розподіл має безперервний характер і дано у вигляді інтервального ряду розподілу, то будують точки абсциси яких є праві (верхні) межі інтервалів, а ординати - відповідні їм нагромаджені частоти (частості).

За даними табл. 3.10 побудуємо кумулятивну криву розподілу 100 господарств за надоями молока на корову (рис. 3.4).

Кумулята зв'язана з огівою таким чином: якщо лист паперу, на якому зображена кумулята повернути на 900 і подивитися на нього з протилежного боку на світло, то можна побачити огіву.

Кумулята розподілу 100 господарств за надоєм молока на корову

Рис. 3.4. Кумулята розподілу 100 господарств за надоєм молока на корову

Побудувавши полігон або гістограму, можна одержати перше уявлення про форму розподілу, під якою розуміють форму його графіка в границі (в математичному розумінні), тобто форму кривої розподілу.

Розрізняють передусім одновершинні (одномодальні) і багатовершинні (багатомодальні) розподіли. До одновершинних відносять криві, які мають один максимум частот. Одновершинний розподіл може бути гостровершинним і плосковершинним. Для багатовершинних розподілів характерна наявність кількох максимумів і мінімумів частот, що переміжаються між собою. Багатовершинність розподілу, як правило, є ознакою неоднорідності досліджуваної сукупності, вказує на наявність диференціації (розшарування) сукупності, а найчастіше є наслідком змішування якісно відмінних сукупностей. В цьому випадку досліджувану сукупність необхідно розчленувати на окремі однорідні сукупності і вивчати їх окремо.

Серед різноманіття форм одновершинних розподілів, що найчастіше зустрічаються на практиці, можна виділити такі характерні розподіли: симетричні, помірноасиметричні, крайньоасиметричні (І - подібні), угнуті (и -подібні) та ін.

Симетричним називають такий розподіл, в якому частоти варіант по мірі віддалення від якогось центра розсіяння зменшуються, залишаючись рівними між собою по обидві сторони до кінців розподілу. Криві таких розподілів симетричні відносно ординати, встановленої у точці, яка відповідає математичному сподіванню.

Симетричний розподіл може бути гостровершинним і плосковершинним. Для гостровершинних розподілів одиниці сукупності зосереджуються біля центральної варіанти, для плосковершинних - навпаки роззосереджуються.

Криві розподілу, побудовані на основі фактичних даних, звичайно рідко бувають ідеально симетричними, хоча ця форма розподілу притаманна багатьом явищам. Емпіричні розподіли, як правило, є асиметричними (скошеними). Такі помірноасиметричні розподіли на практиці зустрічаються частіше. Помірноасиметричними (скошеними) називають такі розподіли, в яких частоти по один бік від центра розсіювання зменшуються помітно бистріше, ніж по другий, внаслідок чого ординати рівновіддалених від центра значень ознаки неоднакові.

При цьому, якщо більш довша гілка кривої припадає на більші значення ознаки, що лежать на правому боці графіка, то таку асиметрію називають правосторонньою або додатньою. У протилежному випадку асиметрія вважається лівосторонньою або від'ємною.

Асиметричний розподіл в границі стає крайньоасиметричним.

Крайньоасиметричними (І - подібними) називають такі розподіли, в яких найбільша частота розташована на одному з кінців розподілу. Такі розподіли за формулою нагадують І і тому називаються І - подібними.

Інколи зустрічаються розподіли, які мають криву угнутої форми, що нагадує латинську букву и, такі розподіли називають и - подібними. и - подібні розподіли характерні тим, що мінімальна частота знаходиться звичайно поблизу центра розсіювання, а по мірі віддалення від неї до кінців розподілу частоти зростають. Такі розподіли на практиці зустрічаються рідко.

Зустрічаються ї - подібні розподіли.

Усі викладені вище форми статистичних розподілів подано у вигляді такої схеми (рис. 3.5).

Зображення варіаційних рядів розподілу в табличній і графічній формах дає змогу одержати лише перше уявлення про найбільш загальні характерні властивості досліджуваного розподілу.

Всебічна характеристика рядів розподілу передбачає з'ясування умов, у яких сформувався досліджуваний розподіл, вираження його основних особливостей числовими характеристиками.

Графіки форм статистичних розподілів

Рис. 3.5. Графіки форм статистичних розподілів

Комплексний опис статистичних розподілів полягає в знаходженні передусім найважливіших узагальнюючих характеристик: середньої величини, ступеня варіації ознаки, скошеності, гостровершинності розподілу. Для їх визначення використовуються відповідні кількісні характеристики. Про них мова буде йти у наступних розділах підручника (див. розд. 4 і 5).

3.6. Статистичні таблиці
3.7. Абсолютні показники
3.8. Поняття про відносні величини, їх види
3.9. Показники диференціації ознак у сукупності
Розділ 4. Середні величини
4.1. Поняття про середні величини
4.2. Види середніх величин і способи їх обчислення
Середня арифметична
Середня гармонічна
Середня геометрична