Теорія статистики - Мармоза А.Т. -
5.3. Види дисперсій і правило їх додавання

Дисперсія володіє рядом математичних властивостей, які дають змогу спростити розрахунки. Розглянемо їх.

1. Дисперсія постійної величини дорівнює нулю:

Ця властивість випливає з того, що дисперсія є показником розсіювання варіант навколо середньої арифметичної, а середня арифметична постійної величини дорівнює цій величині.

2. Якщо з усіх значень варіант відняти постійну величину (х0), то дисперсія не зміниться:

Це означає, що дисперсію можна розрахувати не за даними значення ознаки, а за відхиленнями від будь-якого постійного числа.

3. Якщо всі значення варіант зменшити (збільшити) в одне й те ж саме число разів (к), то дисперсія зменшиться (збільшиться) в к2 разів, а середнє квадратичне відхилення в к разів:

Це означає, що всі значення ознаки можна поділити на постійне число (наприклад, на величину інтервалу), обчислити середнє квадратичне відхилення, а потім помножити його на це постійне число:

4. Якщо обчислити середній квадрат відхилень від будь-якої величини А, в тому чи іншому ступені відмінної від середньої арифметичної (х), то він завжди буде більше середнього квадрата відхилень, обчисленого від середньої арифметичної:

При цьому більше на цілком певну величину - квадрат різниці між середньою та цією умовно взятою величиною, тобто на

де а2 - середній квадрат відхилень від середньої арифметичної; а - середній квадрат відхилень від довільної величини А.

Це означає, що дисперсія від середньої завжди менша дисперсій, обрахованих від будь-яких інших довільних величин, тобто вона має властивість мінімальності.

Ряд властивостей дисперсії ґрунтується на рівності:

тобто дисперсія дорівнює різниці між середньою з квадратів варіант та квадратом середньої. Ця рівність випливає з того, що якщо довільну величину А прирівняти до нуля, то попередня формула дисперсії приймає вигляд:

Ця формула широко використовується в статистиці для спрощеного розрахунку дисперсії (табл.5.2).

Отже, одержано такий самий результат, що і при розрахунку дисперсії звичайним способом.

Використання зазначених вище властивостей дисперсії дає змогу спростити її обчислення. Так, використовуючи другу і третю властивості в ряду розподілу з рівними інтервалами, дисперсію можна обчислити способом відліку від умовного нуля (способом моментів) за формулою:

де к - величина інтервалу; х0 - початок відліку.

Перетворюючи наведену формулу, дисперсію і середнє квадратичне відхилення можна визначити через моменти першого та другого порядків:

де - = - відхилення в інтервалах; к

Тоді формули для обчислення дисперсії та середнього квадратичного відхилення можна записати в такому вигляді:

Отже, дисперсія, обчислена з використанням умовних моментів, дорівнює добутку квадрата величини інтервалу на різницю умовних моментів першого і другого порядків. Такий спосіб розрахунку дисперсії дістав назву способу моментів або способу відліку від умовного нуля.

Розрахуємо дисперсію цим способом для нашого прикладу (табл. 5.2.)

Таблиця 5.2. Дані для розрахунку дисперсії спрощеним способом і способом відліку від умовного нуля

Дані для розрахунку дисперсії спрощеним способом і способом відліку від умовного нуля

При цьому візьмемо к = 2 ц, х0 = 33 ц.

Такий самий результат одержимо і через умовні моменти першого і другого порядків.

Отже, розрахунки дисперсії і середнього квадратичного відхилення трьома способами збіглися і дають одні й ті самі результати

5.3. Види дисперсій і правило їх додавання

Вивчаючи коливання ознаки в цілому по всій сукупності і спираючись на загальну дисперсію, ми не можемо визначити вплив окремих факторів на варіацію ознаки, що нас цікавить. Це завдання можна вирішити за допомогою побудови статистичних групувань. Якщо досліджувану сукупність поділити на окремі сукупності (групи) за ознакою, що нас цікавить, то це дасть змогу розкласти загальну дисперсію ознаки на дві дисперсії, одна з яких буде характеризувати частину варіації, зумовлену впливом фактору, покладеного в основу групування, а друга - варіацію, що виникає під впливом інших факторів (крім фактора, покладеного в основу групування). Таким чином, для сукупності поділеної на групи за якою-небудь ознакою, можна визначити такі види дисперсій: загальну, міжгрупову і внутрішньо-групову.

Загальна дисперсія (ст2аг) характеризує коливання (варіацію) ознаки під впливом всіх умов (факторів), що викликали цю варіацію. Вона обчислюється як відношення суми квадратів відхилень індивідуальних значень ознаки (*,) від загальної середньої (х0) до числа одиниць сукупності:

Міжгрупова (факторна) дисперсія (^2мгр) характеризує варіацію ознаки

під впливом досліджуваного фактора (умови), покладеного в основу групування. Вона обчислюється як відношення суми квадратів відхилень групових середніх (х,-) від загальної середньої до числа одиниць сукупності:

де х,- і / - групові середні і чисельності по окремих групах.

Внутрішньогрупова дисперсія (ств2гр) характеризує варіацію ознаки, зумовлену не врахованими при групуванні факторами. Вона залежить від умови (фактора), покладеного в основу групування і характеризує варіацію ознаки тільки за рахунок умов і факторів, що діють всередині групи. Для окремих груп внутрішньогрупова варіація розраховується як відношення суми квадратів відхилень індивідуальних значень ознаки (*,) від групових середніх (х,-) до числа одиниць сукупності:

Вона може бути також визначена як середня арифметична зважена з групових дисперсій (ст,2):

Усі три згадані дисперсії пов'язані між собою такою рівністю: величина загальної дисперсії дорівнює сумі величин міжгрупової та внутрішньогрупової дисперсій:

Ця рівність дістала назву правила додавання дисперсій.

Знаючи будь-які два види дисперсій, завжди можна знайти або перевірити правильність розрахунку третього виду:

Зіставленням міжгрупової та загальної дисперсій ( відповідно обсягів варіації) можна визначити ступінь впливу факторної ознаки, покладеної в основу групування, на коливання результативної ознаки. При цьому визначають так зване кореляційне відношення:

а2 W

^2 _ м_ м.гр , же характеризує частку варіації, зумовлену факторною

азаг фзаг

а1 W

ознакою. Решта варіації = -ф2- = 1 -Т2 визначається неврахованими при групуванні випадковими причинами.

Очевидно, що чим більша частка міжгрупової дисперсії у загальній дисперсії, тим сильніший вплив групувальної ознаки на досліджувану ознаку.

Правило додавання дисперсій знаходить широке практичне застосування в статистичному аналізі оцінки істотності і ступеня впливу окремих факторів на загальне коливання результативних ознак (див. дисперсійний та кореляційний аналіз).

Розглянемо порядок визначення загального обсягу варіації та дисперсій, їх розкладання на міжгрупову та внутрішньогрупову на прикладі даних польового досліду (табл.5.3.).

Таблиця 5.3. Вплив різних доз добрив на урожайність льону-довгунцю (соломка, ц/га)

Вплив різних доз добрив на урожайність льону-довгунцю

Аналіз даних таблиці показує, що урожайність льону-довгунцю коливається як під впливом доз добрив (по варіантах досліду), так і в межах того самого варіанта досліду (по повтореннях). Отже, на урожайність крім добрив впливають й інші фактори.

Потрібно визначити загальний обсяг варіації урожайності льону-довгунцю, розбивши його на варіацію, зв'язану з дією добрив (міжгрупову варіацію) і варіацію, зумовлену неврахованими в досліді факторами (внутрішньо-групову варіацію).

Введемо умовні позначення: т - число варіантів досліду (т = 3); п - число повторень (п = 4); N - загальне число спостережень = т ■ п = 3 o 4 = 12) .

Для визначення відповідних сум квадратів відхилень та дисперсій піднесемо до квадрату урожайність (табл.5.4).

Таблиця 5.4. Квадрати урожайності по повтореннях

Квадрати урожайності по повтореннях

Обчислимо суми квадратів відхилень, що характеризують загальну, між-групову і внутрішньогрупову варіації:

а) загальна Ш,а! = £ -і - N ■ -02 = 16340,40 -12 ■ 36.22 = 615,12;

б) міжгрупова 1¥ЖІр = и(£ -2 - тХ02 )= 4(4080,20 - 3 ■ 36,2)2 = 595,52;

в) внутрішньогрупова

для першого варіанту досліду

Загальна сума внутрішньогрупової варіації становитиме:

Цю ж суму можна знайти і іншим способом, виходячи з правилом додавання (розкладання) варіації:

Таким чином, можна записати, що

Отже, загальна варіація урожайності льону-довгунцю (615,12) розчленована на систематичну, зумовлену впливом різних доз добрив (595,52) і випадкову, викликану дією неврахованих у досліді факторів (19,60).

За зазначеними сумами квадратів відхилень визначимо загальну, міжгрупову та внутрішньогрупову дисперсії:

За правилом додавання дисперсій можна записати:

Отже, доведено, що загальна дисперсія дорівнює сумі міжгрупової і внутрішньогрупової дисперсій.

Співставляючи між собою міжгрупову та загальну дисперсії, визначимо кореляційне відношення, яке характеризує силу впливу досліджуваного фактора на результативну ознаку:

Отже, 96,8% загального коливання урожайності льону-довгунцю припадає на частку добрив, а 3,2% зумовлено іншими неврахованими в досліді факторами.

5.4. Моменти статистичних розподілів
Розділ 6. Вибіркове спостереження
6.1. Поняття вибіркового спостереження та його теоретичні основи
6.2. Помилки вибірки
6.3. Способи формування вибіркових сукупностей
6.4. Визначення необхідної чисельності вибірки
6.5. Поняття статистичної оцінки. Точкова і інтервальна оцінка параметрів генеральної сукупності
6.6. Закони розподілу вибіркових характеристик
Нормальний розподіл
Розподіл Стьюдента