Теорія статистики - Мармоза А.Т. -
Відносні показники варіації

Найпростішим показником варіації є розмах варіації, який представляє собою різницю між максимальним і мінімальним значеннями ознаки.

В інтервальних рядах розподілу розмах варіації визначають як різницю між верхньою межею останнього та нижньою межею першого або як різницю між серединами інтервалів.

Безумовною перевагою показника розмаху варіації є простота його розрахунку. Однак він не може в повній мірі охарактеризувати варіацію ознаки, оскільки не враховує всіх значень ознаки, проміжних між максимальним та мінімальним значеннями. Не враховує він і частот. Особливість показника розмаху варіації полягає у тому, що він залежить лише від двох крайніх значень ознаки, які можуть виявитися не достатньо типовими. В зв'язку з цим розмах варіації відображає інколи випадкове, а не типове для даного ряду коливання. Зазначені недоліки розмаху варіації звужують область його практичного застосування. В основному він використовується для попередньої оцінки варіації. Тому необхідні інші показники варіації, які ґрунтуються на всіх значеннях ознаки в даній сукупності.

Більш досконалим показником вимірювання варіації є середнє лінійне та середнє квадратичне відхилення, які усувають зазначені вище недоліки розмаху варіації.

Середнє лінійне відхилення являє собою середню арифметичну з абсолютних значень відхилень окремих варіант від середньої арифметичної.

Прямі дужки означають, що абсолютні значення відхилень беруться по модулю, тобто підсумовування виконується без врахування знаків (плюс або мінус). Така умовність пояснюється тим, що оскільки сума відхилень індивідуальних значень ознаки від середньої в першому ступені дорівнює нулю (нульова властивість середньої арифметичної), то для одержання суми всіх відхилень, відмінної від нуля, кожне відхилення слід брати як додатну величину.

Показник середнього лінійного відхилення більш обґрунтований порівняно з розмахом варіації. Він не залежить від випадкових коливань крайніх значень, оскільки спирається на всі значення ознаки, враховує всю суму відхилень індивідуальних варіантів від середньої арифметичної та частоти.

Однак і цей показник варіації має суттєві недоліки. Основним є те, що в ньому не враховуються знаки (спрямованість) відхилень. Довільне відкидання алгебраїчних знаків відхилень призводить до того, що математичні властивості цього показника є далеко не елементарними, а це значно ускладнює використання середнього лінійного відхилення при розв'язанні задач, пов'язаних з ймовірнісними розрахунками. Тому середнє лінійне відхилення використовується рідко.

Намагання скласти показник варіації, який би усував недоліки розмаху варіації та середнього лінійного відхилення призводить до дисперсії та середнього квадратичного відхилення.

Дисперсією називають середній квадрат відхилень індивідуальних значень ознаки від середньої арифметичної. її визначають за формулами:

Середнє квадратичне відхилення одержують шляхом добування кореня квадратного з дисперсії:

Змістовне значення середнього квадратичного відхилення таке ж саме, як і середнього лінійного відхилення. Воно показує на скільки в середньому відхиляються індивідуальні значення варіант від їх середнього значення.

Середнє квадратичне відхилення є критерієм надійності середньої. Чим менше воно, тим краще середня арифметична відображає всю досліджувану сукупність. Перевага середнього квадратичного відхилення порівняно з середнім лінійним відхиленням полягає у тому, що при розрахунку ніякого умовного припущення про підсумовування відхилень без врахування знаків не допускається, оскільки всі відхилення підносяться до квадрату.

Середнє квадратичне відхилення ще називають стандартним відхиленням. Воно як розмах варіації й середнє лінійне відхилення є величиною іменованою та виражається в тих самих одиницях вимірювання, що і варіанти досліджуваної ознаки і середня величина (ц, кг, грн., м, ц/га і т.д.)

Дисперсія і середнє квадратичне відхилення широко застосовуються на практиці. Пояснюється це тим, що вони входять в більшість теорем, які є фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, які дають змогу оцінити вплив різних факторів, що зумовлюють варіацію досліджуваної ознаки. В наступних розділах буде показано, як дисперсія використовується для оцінки результатів вибіркового спостереження, побудови показників тісноти кореляційного зв'язку, в дисперсійному аналізі і т.д.

Середнє квадратичне відхилення відіграє важливу роль в аналізі рядів розподілу. В умовах нормального розподілу існує така залежність між величиною середнього квадратичного відхилення і кількістю спостережень: в межах х± 1а розташовується 0,683 або 68,3 % кількості спостережень; в межах х± 2а-0,954 або 95,4%; в межах х ± - 0,997 або 99,7% кількості спостережень. В дійсності на практиці майже не зустрічаються відхилення, які перевищують ± 3ст. Відхилення 3ст може вважатися максимально можливим. Це положення називають "правилом трьох сигм".

Якщо показником центру розподілу використовується медіана, то для характеристики варіації можна застосувати так зване квартальне відхилення:

де 21 і 23 - відповідно перший і третій квартилі розподілу.

Цей показник також можна застосувати замість розмаху варіації, щоб запобігти недоліків, пов'язаних з використанням крайніх значень ознаки.

Між середнім квадратичним відхиленням, середнім лінійним відхиленням, квартальним відхиленням і розмахом варіації в нормально розподіленій сукупності існує таке співвідношення:

Поряд з варіацією кількісних ознак в соціально-економічних явищах має місце і варіація якісних ознак. При цьому якщо є тільки два взаємовиключаючі варіанти, то таку варіацію називають альтернативною. При альтернативній мінливості одні одиниці сукупності володіють даною ознакою, а інші не володіють. Наприклад, розгляд сільськогосподарських тварин з точки зору їх статевого та породного складу (бички та телички, породна та безпородна худоба), придатності продукції (придатна і бракована) і т.д. дає альтернативну ознаку. Наявність ознаки у одиниці сукупності позначають 1, а відсутність - 0; частку одиниць, що володіють даною ознакою, позначають р, а не володіючих - q. Очевидно, що р + q = 1. Звідки р = 1 - q, а q = 1 - р.

Дисперсія альтернативної ознаки визначається за формулою:

Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною ознакою, на частку одиниць, що не володіють нею.

Середнє квадратичне відхилення альтернативної ознаки дорівнює:

Оскільки р + q не може бути більше одиниці (0,5+0,5), то дисперсія не може перевищувати 0,25.

Наприклад, при огляді партії сільськогосподарської продукції 2% виявилося бракованою. Позначимо наявність браку - 1, а відсутність - 0, частку бракованої продукції -р, а доброякісної - д.

Отже, середнє квадратичне відхилення, яке показує як в середньому відхиляються індивідуальні значення ознаки від середньої арифметичної, дорівнює 0,14, або 14%.

При порівнянні коливання сукупностей, що мають різні одиниці вимірювання та значення середніх величин, робити висновки про ступінь варіації за середнім лінійним і середнім квадратичним відхиленнями важко. Тому з метою одержання порівнянних даних необхідно від абсолютних показників варіації перейти до відносних. Ці показники розраховуються як відношення абсолютних показників варіації до середньої арифметичної (медіани). Використовуючи за абсолютні показники варіації розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення та квартальне відхилення, одержимо відносні показники коливання (найчастіше вони виражаються у відсотках):

де Q - квартальне відхилення; Q1 - перший квартиль; Q2 - медіана; Q3 - третій квартиль.

Враховуючи, що середнє квадратичне відхилення дає узагальнену характеристику коливання всіх варіантів сукупності, коефіцієнт варіації є показником відносної варіації, що найчастіше застосовується. Його застосовують не тільки для порівняльної оцінки варіації, але й для характеристики однорідності сукупності. При цьому виходять з того, що якщо коефіцієнт варіації менше 33%, то сукупність вважається однорідною (для розподілів близьких до нормального).

Зазначимо, що наведена межа оцінки однорідності сукупності досить умовна. Питання про ступінь інтенсивності варіації повинне вирішуватися для кожної досліджуваної ознаки індивідуально виходячи з порівняння варіації, що спостерігається, з деякою її звичайною інтенсивністю, прийняту за норму.

Розрахунок перелічених показників варіації здійснимо за даними розподілу 100 господарств за надоєм молока на корову (табл.5.1.).

Нагадаємо, що раніше в розділі 4 за даними досліджуваного розподілу були обчислені такі характеристики: середня арифметична х = 32,64 ц, перший квартиль - Q1 = 30,17 ц, медіана - Q2 = 32,72 ц, третій квартиль - Q3 = 35,00 ц.

Абсолютні показники варіації

Таблиця 5.1. Дані для розрахунку середнього лінійного і середнього квадратичного відхилень

Дані для розрахунку середнього лінійного і середнього квадратичного відхилень

Дисперсія

Середнє квадратичне відхилення

Квартальне відхилення

Відносні показники варіації

Коефіцієнт осциляції

Відносне лінійне відхилення

Коефіцієнт варіації

Відносне квартальне відхилення

Отже, надої молока по даній сукупності господарств коливаються в межах ± 3,2 ц (по а), або на 9,8% по відношенню до середнього надою.

5.2. Математичні властивості дисперсії та спрощені способи її розрахунку
5.3. Види дисперсій і правило їх додавання
5.4. Моменти статистичних розподілів
Розділ 6. Вибіркове спостереження
6.1. Поняття вибіркового спостереження та його теоретичні основи
6.2. Помилки вибірки
6.3. Способи формування вибіркових сукупностей
6.4. Визначення необхідної чисельності вибірки
6.5. Поняття статистичної оцінки. Точкова і інтервальна оцінка параметрів генеральної сукупності
6.6. Закони розподілу вибіркових характеристик