Теорія статистики - Мармоза А.Т. -
3.3. Методологія статистичних групувань

Статистичні групування здійснюють у кілька послідовних етапів: 1) теоретичний аналіз досліджуваного явища або процесу; 2) вибір групувальної ознаки (ознак); 3) визначення кількості груп і величини інтервалу; побудова інтервального ряду розподілу одиниць сукупності за досліджуваною групувальною ознакою (ознаками); 4) визначення та обґрунтування системи статистичних показників для виділення і характеристики типових груп; складання макетів таблиць; 5) обчислення абсолютних, відносних і середніх показників; 6) табличне і графічне оформлення результатів групування; 7) аналіз одержаних результатів; формулювання висновків та пропозицій.

Безпосередній побудові групування має передувати глибокий теоретичний аналіз досліджуваного явища або процесу, в якому провідна роль належить з'ясуванню тенденцій і закономірностей розвитку явища, характеру його рушійних сил, специфіці виникнення в ході цього розвитку нових типів та форм явищ. Важлива роль в теоретичному аналізі відводиться також вивченню взаємозв'язку досліджуваного явища з іншими явищами, встановленню впливу окремих факторів на результативні показники.

Принципове значення при побудові групувань має вибір групувальної ознаки, визначення кількості груп і величини інтервалу. Вибір групувальної ознаки, тобто ознаки, на основі якої виділяють різні типи, групи, підгрупи, є одним з найважливіших моментів побудови групувань.

Вибір групувальної ознаки має бути оснований на аналізі якісної природи досліджуваного явища. Всебічний теоретично - економічний аналіз суті явища має бути спрямований на те, щоб у відповідності з метою і завданнями дослідження покласти в основу групування суттєві ознаки.

Групувальними ознаками можуть бути кількісні, атрибутивні (якісні), результативні та факторні ознаки.

Відібравши групувальну ознаку (ознаки) і побудувавши ранжирований ряд за цією ознакою, встановлюють кількість груп, на які буде поділено сукупність, що вивчається, і величину інтервалу.

Кількість груп залежить від загальної чисельності одиниць сукупності, характеру групувальної ознаки і виду групувань. Разом з тим при вирішенні цього питання слід дотримуватися двох важливих умов побудови групувань: 1) виділені групи мають відрізнятися якісною однорідністю; 2) кількість одиниць у кожній групі має бути досить великою. Ця вимога випливає із закону великих чисел.

Визначення числа груп і інтервалів у групуванні передусім залежить від того, якою є групувальна ознака - атрибутивною чи кількісною. Якщо групування здійснюють за атрибутивною (якісною) ознакою (стать, сорт, порода, професія тощо), то виділяють стільки груп, скільки є градацій ознаки. Аналогічно виділяють групи і при групуванні за дискретною кількісною ознакою, яка змінюється в невеликих межах (кількість членів родини, оцінки студентів, кількість приплоду від однієї матки, кількість бригад у TOB тощо).

Якщо ж групують за кількісною ознакою (урожайність, собівартість тощо), що змінюється безперервно і набуває в певних межах будь - яких дрібних значень, то групи виділяють шляхом встановлення для кожної з них інтервалів, зазначених верхньою і нижньою межами величини ознаки для даної групи.

При встановленні числа груп і меж інтервалів важливо встановити за кількісними змінами якісні переходи, щоб виділити типи, не змішати суттєво відмінні одиниці спостереження в одній групі. Це завдання вирішується на основі теоретичного аналізу досліджуваного явища (процесу), порівняння групувальної ознаки з раніше оціненими величинами, для яких якісні переходи відомі.

Якщо ж заздалегідь характер зміни кількісної ознаки і якісні переходи в ньому оцінити важко, то групування доцільно проводити в такій послідовності.

1. Побудувати ранжирований ряд розподілу за обґрунтовано виділеною ознакою, в якому всі одиниці спостереження розташовуються у порядку зростання або зменшення групувальної ознаки. Ранжирований ряд показує інтенсивність зміни величини групувальної ознаки. Різка зміна його величини при переході від однієї одиниці спостереження до другої є свідоцтвом якісних відмін між ними. Аналізуючи ранжирований ряд, особливо його графічне зображення, можна виділити якісно відмінні групи.

2. Побудувати інтервальний варіаційний ряд розподілу з виділенням достатньо великого числа груп, який дасть змогу одержати уявлення про склад досліджуваної сукупності і характер розподілу. При встановлені числа груп і величини інтервалу слід уникати як надмірного подрібнювання сукупності на групи (не виявиться властива масовим даним закономірність в розподілі), так і занадто малого числа груп (об'єднуються в групу якісно відмінні одиниці). Інтервальний ряд при поступовій (плавній) зміні ознаки будується звичайно з рівними інтервалами. Якщо групувальна ознака змінюється нерівномірно, то інтервали можуть бути нерівними.

3. Побудувати проміжне аналітичне групування і шляхом об'єднання мілких однорідних груп перейти до типологічного групування. Аналітичне групування дає змогу на основі аналізу його показників дати якісну оцінку виділеним в інтервальному ряду групам. Якщо цей аналіз показує однорідність кількох (двох, трьох і т.д.) послідовно розташованих в інтервальному ряду груп, то є підстави для їх об'єднання в одну типову групу.

Для побудови інтервального варіаційного ряду необхідно встановити число груп і величину інтервалу.

Питання щодо числа груп і величини інтервалу слід вирішувати з урахуванням множини обставин, перед усім виходячи з цілей дослідження, особливостей досліджуваного явища та ін. При цьому число груп і величину інтервала слід встановити такими, які б дозволили більш рівномірно розподілити одиниці сукупності по групах і досягти при цьому їх представництва, якісної однорідності.

При визначенні числа груп потрібно брати до уваги розмах варіації ознаки, тобто різницю між його максимальним і мінімальним значенням. Чим більший цей розмах, тим, як правило, більше утворюється груп. Необхідно також враховувати чисельність досліджуваної сукупності. Доцільно, щоб число груп не було занадто великим і малим і щоб в кожну групу попало достатньо велике число одиниць спостереження.

Число груп наближено можна визначити за формулою Стерджесса

де N - чисельність сукупності.

На основі цієї формули можна встановити число груп для сукупностей, що мають різну чисельність:

чисельність сукупності (N) 25-40 40-60 60-100 100-200 200-500 понад 500 число рекомендованих груп (n) 5-6 6-7 7-8 8-9 9-10 10-15

Виведена на основі теоретичних доведень формула Стерджесса не враховує особливостей і характеру варіації і розподілу досліджуваної ознаки. Тому механічне її застосування може призвести до неправильних висновків.

Визначення числа груп за формулою Стерджесса обґрунтоване в тих випадках, коли розподіл одиниць сукупності за даною ознакою наближається до нормального, застосовуються рівні інтервали в групах і при незначній варіації ознаки. В решті випадків кількість груп має бути визначено у вище викладеній послідовності (побудова ранжированого ряду, інтервального ряду, проміжного аналітичного групування).

Після встановлення числа груп визначають величину інтервалу. Інтервалом групування називають різницю між максимальним і мінімальним значенням ознаки в кожній групі. Однак цю величину можна визначити як різницю між верхніми і нижніми межами значень ознаки в суміжних групах. У практиці статистичних групувань правильне встановлення величини інтервалу має першорядне значення для утворення якісно однорідних груп.

Коли значення групувальної ознаки в ранжированому ряду має плавний наростаючий характер, величина інтервалу визначається за формулою:

де хтп і хш1п - максимальне і мінімальне значення ознаки; п - число груп.

З формули видно, що величина інтервалу знаходиться у прямій залежності від розмаху варіації і в оберненій від числа груп: чим більше розмах варіації, тим більше величина інтервалу, чим більше число груп, тим менше величина інтервалу.

Застосування цієї формули правомірно для випадків, коли всі значення ознаки мають плавний, поступовий характер наростання, а чисельність сукупності достатньо велика. Якщо ж невелика частина сукупності значно віддалена за розміром групувальної ознаки від сукупності основного масиву, то замість хтаз всієї сукупності необхідно взяти хтп основного масиву сукупності, а різко відмінні одиниці виділити в особливу групу. Невиконання цієї вимоги може призвести до того, що переважна частина одиниць сукупності сконцентрується в одній - двох групах, в той час, як в решту груп увійде дуже невелике число одиниць або взагалі не увійде не одної одиниці.

За способом побудови інтервали можуть бути рівними і нерівними, відкритими і закритими, спеціалізованими. Вибір того або іншого виду інтервалу залежить від характеру розподілу одиниць досліджуваної сукупності.

Рівними називають інтервали, у яких різниці між верхньою і нижньою межами однакові. Групування з рівними інтервалами застосовуються тоді, коли варіація ознаки проявляється у порівняно вузьких межах і розподіл носить більш або менш рівномірний характер. Визначення величини інтервалу у випадку групування із застосуванням рівних інтервалів здійснюється за вище наведеною формулою. Припустимо, що площа хмелю в групі господарств коливається від 10 до 110 га. Необхідно побудувати групування за розміром площі, утворивши 5 груп з рівними інтервалами. Величина інтервалу становитиме:

Додаючи до мінімального значення ознаки (в даному випадку 10 га) знайдемо значення інтервалу, одержимо верхню межу першої групи: 10 + 20 = 30 га. Додаючи далі величину інтервалу до верхньої межи першої групи, одержимо верхню межу другої групи: 30 + 20 = 50 га і т.д. У результаті одержимо такі групи господарств за розміром площі хмелю (га): 10-30; 30-50; 50-70; 70-90; 90-110.

Нерівними називають інтервали, у яких різниця між верхньою і нижньою межами неоднакові. Нерівні інтервали обчислюються в тих випадках, коли досліджувана ознака змінюється в широких межах. Прикладом нерівних інтервалів може бути групування господарств за чисельністю великої рогатої худоби (голів): 1-99; 100-299; 300-599; 600-999; 1000-3000; понад 3000.

Відкритими називають інтервали, у яких наперед невідомі максимальне і мінімальне значення. Тому при групуванні перший і останній інтервал залишаються відкритими. Наприклад, групування господарств за урожайністю вівса (ц/ га): до 15; 15 - 20; 20 - 25; 25 - 30; понад 30.

Закритими називають інтервали, у яких максимальне і мінімальне значення відомі. Наприклад, групування працівників за стажем роботи (років): 05; 5-10; 10-15; 15-20; 20-25; 25-30; 30-35; 35-40.

У групуваннях, що мають за мету відобразити якісну своєрідність груп, застосовуються спеціалізовані інтервали. В цьому випадку в кожній групі є особливий свій зміст і межа інтервалу встановлюється там, де відбувається перехід від одної якості до другої. Кількість груп встановлюється відповідно з теорією питання. Наприклад, при характеристиці відгодівельних господарств за чисельністю поголів'я виділяють мілкі, середні і крупні господарства; за рівнем рентабельності - збиткові, низькорентабельні, середньо-рентабельні, високорентабельні.

При групуванні даних за кількісною ознакою важливе значення має правильне позначення нижньої і верхньої меж кожної групи. Це зв'язано з наступним віднесенням окремих одиниць спостереження до відповідної групи. Так, якщо до наведених вище груп господарств за площею хмелю (10-30; 30-50; 50-70; 70-90; 90-110 га) не дати спеціальних вказівок, то виникають труднощі при побудові та аналізі даного групування. Куди, наприклад, віднести господарства з площею, рівною 30 га, в першу чи в другу групу? Для усунення подібної невизначеності потрібні додаткові вказівки про те, рахувати верхні межи груп "включно" (при побудові групувань звичайно користуються цим правилом), то тоді господарства з площею хмелю до 30 га, 50 га і т.д. мають бути віднесені відповідно до першої, другої і т.д. групи. Якщо ж рахувати верхні межи "виключно", то господарства із зазначеними площами мають бути віднесеними до другої, третьої і т.д. групи.

Той самий результат досягається і за допомогою відкритих інтервалів у першій і останній групах. Щоб показати, що господарства з площею хмелю, рівній верхній межі інтервалу, включаються в дану групу, останню групу слід позначити "понад 90 га". Навпаки, щоб показати, що верхні межі інтервалів не входять в дану групу, останню групу потрібно позначити "90 га і більше".

Часто для надання групуванням більшої визначеності верхню межу попередньої і нижню межу наступної групи позначають по - різному. Якщо групувальна ознака може приймати тільки цілі значення, то нижня межа наступної групи відрізняється від верхньої межі попередньої групи на одну цілу одиницю. Наприклад, групування тих же господарств за площею хмелю може бути виконане за такими інтервалами (га): 10 - 30; 31 - 50; 51 - 70; 71 - 90; 91 -110. Аналогічно будуються інтервали з десятими і сотими частинами одиниць. Наприклад, інтервали господарств за собівартістю 1 ц зерна можуть мати вигляд (грн.): до 34,00; 34,01 - 35,00; 35,01 - 36,00 і т.д.

3.4. Вторинне групування
3.5. Ряди розподілу
3.6. Статистичні таблиці
3.7. Абсолютні показники
3.8. Поняття про відносні величини, їх види
3.9. Показники диференціації ознак у сукупності
Розділ 4. Середні величини
4.1. Поняття про середні величини
4.2. Види середніх величин і способи їх обчислення
Середня арифметична