Розміри ознак, які характеризують кількісні зміни тих чи інших явищ, зазнають коливань.
Як відомо, у певних межах коливаються (варіюють) показники рівнів продуктивності праці та її оплати, собівартості та рентабельності виробництва продукції тощо. Ці коливання зумовлені певними факторами, які діють у різних напрямках. Для узагальнюючої характеристики статистичної сукупності за варіюючими ознаками розраховують середні величини. Але середня, характеризуючи варіаційний ряд у цілому, не враховує варіацію ознаки. Вона не показує, як розміщені навколо неї варіанти, тобто, чи зосереджені вони поблизу середньої, чи значно відхиляються від неї. Середня не показує характер варіації ознаки і степінь її коливань.
У деяких випадках та ж сама середня може характеризувати зовсім різні сукупності. Тобто в двох або декількох сукупностях середні величини однакові (за рівнем), а відхилення від цих середніх різні. У таблиці 24 наведено дані про виробничий стаж робітників двох цехів підприємств (А і Б).
Таблиця 24
Вихідні і розрахункові дані для обчислення середньої (х, - стаж у роках, п, - кількість робітників)
А | Б | ||||
Хі | Пі | ХіПі | Хі | Пі | ХіПі |
2 | 1 | 2 | 2 | 30 | 60 |
3 | 5 | 15 | 3 | 20 | 60 |
4 | 30 | 120 | 4 | 10 | 40 |
5 | 60 | 300 | 5 | 50 | 250 |
6 | 30 | 180 | 6 | 10 | 60 |
7 | 5 | 35 | 7 | 20 | 140 |
8 | 1 | 8 | 8 | 30 | 240 |
Всього | 132 | 660 | - | 170 | 850 |
Середні, обчислені для обох сукупностей, будуть однакові
- Т.х[п1 660 5 _ 850
Х1 ~^п~ ~ 132 " ; Х2 = 770 = 5.
Відхилення від обчислених середніх мають різний характер. У першому цеху стаж 120 робітників (30+60+30) із 132 (тобто 91 %) відхиляється від середнього стажу (5 років) не більше як на 1 рік.
У другому цеху 70 випадків (10+50+10) із 170 мають таке ж відхилення -41 %. Зрозуміло, що у першому випадку середня характеристика більш надійна (більш типова), ніж у другому. Якщо значення ознаки більше відхиляється від середньої (другий випадок), то досліджувана сукупність вважається менш однорідною, а середня менш надійною. Тому поряд з середніми величинами важливе теоретичне і практичне значення має вивчення відхилень від середніх. При цьому являють інтерес як крайні відхилення, так і сукупність всіх відхилень. Від розмаху і розподілу відхилень залежить надійність середніх характеристик. Останні, необхідно доповнювати показниками, які вимірюють відхилення від них, тобто показниками варіації.
Для кількісного виміру варіації ознаки математична статистика розробила ряд показників: розмах варіації, середнє лінійне відхилення, середній квадрат відхилень (дисперсія), середнє квадратичне відхилення, коефіцієнт варіації.
У таблиці 25 названі статистичні характеристики представлені структурними їх формулами. Серед коефіцієнтів варіації найбільш вживаний показник, який вираховується за середнім квадратичним відхиленням.
Таблиця 25
Формули розрахунку показників варіації_
Розмах варіації, являючи собою різницю між крайніми (екстремальними) значеннями ознаки варіаційного ряду, дає лише загальне уявлення про розміри варіації, тобто її наближену оцінку. Величина ця нестійка і значною мірою залежить від випадковостей. Вона не дає уявлення про розміри відхилень варіант одна від одної в проміжку між крайніми іх значеннями. Особливістю показника розмаху варіації (Я) є те, що він не відображує відхилень усіх варіант, не враховує частоти, а величина його залежить від двох крайніх значень ознаки.
Тому для узагальненої характеристики розміру цих відхилень розраховують середню із відхилень.
Слід пам'ятати, що термін "відхилення від середньої" означає різницю між варіантою і середньої арифметичною в даній сукупності. У розрахунках завжди віднімають середню від варіант, а не навпаки.
Оскільки сума додатних і від'ємних відхилень завжди дорівнює нулю (властивість середньої арифметичної), умовно припускають, що всі відхилення мають однаковий знак. Сума таких відхилень, поділена на їх число, має назву середнє лінійне відхилення (сі). Цей показник має значну перевагу перед розмахом варіації (Я) у відношенні повноти коливання ознаки. Чим більша його величина, тим менш однорідною вважається сукупність. Показник середнього лінійного відхилення у статистиці застосовують рідко. Для виміру міри варіації частіше отримані відхилення підносять до квадрату, а з квадратів відхилень обчислюють середню величину. Одержана таким чином міра варіації називається середнім квадратом відхилень_або дисперсією (ст ).
Якщо добути корінь квадратний з дисперсії, одержимо середнє квадратичне відхилення Дана статистична величина
характеризує абсолютну міру варіації, це іменоване число і виражається у тих же одиницях виміру, в яких виражені варіанти. Середнє квадратичне відхилення називають також стандартним відхиленням, стандартом або просто "сигмою".
Середнє квадратичне відхилення і дисперсія (ст2) є
загальноприйнятими показниками міри варіації ознаки, мають широке застосування у статистиці.
Здійснимо розрахунок названих статистичних характеристик за даними раніше розглянутого прикладу про середній стаж робітників (табл. 26).
Величина дисперсії відповідно для об'єктів А і Б становитиме:
ді = £( х,- х)2 щ = 118 = 0.89; _ _ 42 Т.п, 132 °Б 170 4,2.
Звідси знаходимо: = ^9 = 0,94; = = 2,05.
Як бачимо, у другому випадку середнє квадратичне відхилення °б більш як у два рази перевищує величинуал. Отже, другий ряд розподілу характеризується більш високою варіацією ознаки, ніж перший.
Таблиця 26
Вихідні і розрахункові дані для обчислення показників варіації
А | Б | ||||||||
х1 | п1 | (*, - -я)2 | (хі - х)ц | х1 | п1 | х1- X | |||
2 | 1 | -3 | 9 | 9 | 2 | 30 | -3 | 9 | 270 |
3 | 5 | -2 | 4 | 20 | 3 | 20 | -2 | 4 | 80 |
4 | 30 | -1 | 1 | 30 | 4 | 10 | -1 | 1 | 10 |
5 | 60 | 0 | 0 | 0 | 5 | 50 | 0 | 0 | 0 |
6 | 30 | 1 | 1 | 30 | 6 | 10 | 1 | 1 | 10 |
7 | 5 | 2 | 4 | 20 | 7 | 20 | 2 | 4 | 80 |
8 | 1 | 30 | 9 | 9 | 8 | 30 | 3 | 9 | 270 |
Разом | 132 | X | X | 118 | X | 170 | X | X | 720 |
Середнє квадратичне відхилення використовується і як самостійна статистична характеристика, і як основа для побудови (обчислення) інших статистичних характеристик: коефіцієнтів варіації, помилок репрезентативності різноманітних характеристик розподілу, коефіцієнтів кореляції і регресії, елементів дисперсійного аналізу, формул регресії.
За своєю величиною ° залежить не тільки від ступеня варіації, а й від абсолютних рівнів варіант і середньої.
Тому порівнювати стандартні відхилення, розраховані за варіаційними рядами з різнойменними ознаками (як і з різними рівнями), безпосередньо не можна.
Можливість такого порівняння забезпечує показник процентного відношення середнього квадратичного відхилення і середньої арифметичної - коефіцієнт варіації (V). Цей показник характеризує відносну міру варіації і дозволяє порівнювати ступінь варіації ознак в рядах розподілу з різним рівнем середніх.
Наприклад, якщо для урожайності зернових культур в одній
області ст1= 9ц і Х1 =30ц, а в другій - °2 = 8г<, і Х2 = 20гьто за абсолютною величиною варіація у першому випадку більша (9 >8) а відносна міра варіації менша:
V = 3-100 = -100 = 30%; V, = 22-100 = -100 = 40%. 1 Х1 30 2 Х2 20
Коефіцієнт варіації зручний для порівняння варіації різних явищ. Наприклад, якщо при порівнянні коефіцієнтів варіації віку робітників до рівня їх трудоучасті (сума відпрацьованого часу - люд.-г) виявиться, що коефіцієнт варіації віку V =5,3 %, а коефіцієнт варіації трудоучасті V= 14,7%, то робиться висновок про те, що рівень трудоучасті варіює більше, ніж вік.
Коефіцієнт варіації є оцінкою надійності середньої. При величині V = 5% варіація вважається слабкою, V = 6-10 % -помірною, V = 16-20 % - значною^ = 21-50 % - великою; V > 50 % -дуже великою.
Для малих вибірок величина коефіцієнта варіації повинна бути не більше 33 %. Якщо х = 1; V = °
5.3.2. Загальна, міжгрупова і внутрішньогрупова дисперсія
5.3.3. Дисперсія альтернативних ознак
§ 5.4. Моменти статистичного розподілу
§ 5.5. Характеристика асиметрії і ексцесу
ТЕМА 6. АНАЛІЗ ПОДІБНОСТІ РОЗПОДІЛІВ
§ 6.1. Статистична оцінка параметрів розподілу
§ 6.2. Закони розподілу вибіркових характеристик
6.2.1. Загальне поняття законів розподілу
6.2.2. Нормальний розподіл