Статистика - Опря А.Т. -
5.3.1. Найважливіші математичні властивості дисперсії

Знаючи математичні властивості дисперсії, можна спростити вирахування її величини. Розглянемо їх.

1. Якщо із усіх значень варіант відняти постійне число А, то величина дисперсії не зміниться

СТ( *,-А) = ^ .

Таким чином, середній квадрат відхилень можна обчислити не за величинами варіант, а за відхиленням їх від якогось постійного

ґг2 = ґг2

числа, тобто ('o-Ау

2. Якщо значення варіант поділити на постійне число А, то величина дисперсії зменшиться в А2, а середнє квадратичне відхилення в А разів:

=ст2: А1.

(7)

Із цього випливає, що всі варіанти можна поділити на будь-яке постійне число, обчислити середнє квадратичне відхилення, а потім

а2г А2

помножити його на це постійне число: ^А >

3. Якщо вирахувати середній квадрат відхилень від будь-якої величини (А), що відрізняється в тій чи інший мірі від середньої (х), то величина його завжди буде більше середнього квадрата відхилень, обчисленого відносно середньої л 2).

Отримане перевищення дорівнює квадрату різниці між середньою і умовно узятою величиною, тобто 1 х -А /2. Це все можна подати у такому запису:

а2А = а2 + (~х - А)2 або а2А = а2 - (х - А)

Розглянута властивість середнього квадрата відхилень дозволяє зробити висновок про те, що дисперсія від середньої (ст2 ) завжди

2

менша за дисперсії, обчислені від будь-яких інших величин ад , тобто вона має властивість мінімальності.

4. Дисперсія постійної величини дорівнює нулю ("^'^ ~0). Ця властивість випливає з того, що дисперсія є показником розсіювання варіант навколо середньої арифметичної, а середня арифметична постійної величини дорівнює цій величині.

Ряд властивостей дисперсії ґрунтується на рівності ° = х ~(х) , Тобто дисперсія дорівнює різниці між середньою арифметичною квадратів варіант і квадратом середньої арифметичної.

5.3.2. Загальна, міжгрупова і внутрішньогрупова дисперсія

Якщо всі значення ознаки статистичної сукупності (генеральної або вибіркової) розділити на декілька груп і розглядати кожну з них як самостійну (окрему) сукупність, то виникає необхідність обчислення трьох видів дисперсій: загальної, міжгрупової і внутрішньогрупової.

Загальна дисперсія - це середній квадрат відхилень значень ознак всієї сукупності відносно загальної середньої.

Міжгрупова дисперсія - це середній квадрат відхилень групових середніх відносно загальної середньої.

Внутрішньогрупова дисперсія - це середня арифметична часткових (групових) дисперсій, зважена обсягами груп.

У таблиці 27 наведена структурні формули обчислення названих видів дисперсій.

Таблиця 27

Формули для обчислення дисперсій

Приклад. За даними врожайності зернових культур 57 підприємств визначити загальну, міжгрупову і внутрішньогрупову дисперсії, утворивши сім груп підприємств за рівнем урожайності.

Для обчислення загальної дисперсії необхідно побудувати дискретний ряд розподілу (табл. 28).

За розрахунковими даними цього статистичного ряду визначаємо

середню арифметичну ( х)і величину загальної дисперсії ( за'-):

- Іхпг 1535.5 " 2 І(хг -х)2пі 1399.06 "",

х = -- =-= 26.9; ашг =---- =-= 24.5.

І,пі 57 І,пі 57

Таблиця 28

Вихідні і розрахункові дані для обчислення загальної дисперсії __ (дискретний ряд)_

Варіанта ,

хі

Частота пі

Розрахункові дані

хі п

хі - Х

( ХІ - Х )2

( Хі - х)2 щ

17,5

1

17,5

-9,4

88,36

88,36

17,6

2

35,2

-9,3

86,49

172,98

36,2

3

108,6

9,3

86,49

259,47

37,6

2

75,2

10,7

114,49

228,98

Разом

57

1535,3

X

X

1399,06

Для визначення міжгрупової дисперсії необхідно обчислити групові

середні (хі) і знайти загальний об'єм їх варіювання відносно загальної середньої (І(хі - х)2 N). За розрахунковими даними таблиці 29 визначаємо розмір міжгрупової дисперсії:

Таблиця 29

Вихідні і розрахункові дані для обчислення міжгрупової дисперсії

Інтервал (група)

Середня по групі,

Обсяг груп,

Розрахункові дані

х] - X

(х, - х)2

(х, - х)2

17,5-20,5

18,9

9

-8,0

64,00

576,0

20,5-23,5

21,9

6

-6,0

25,0

150,0

23,5-26,5

25,4

9

-1,5

2,25

20,3

26,5-29,5

28,2

13

1,3

1,69

22,0

29,5-32,5

30,8

15

3,9

15,21

228,0

32,5-35,5

34,0

3

7,1

50,41

151,2

35,5-38,5

36,9

2

10,0

100,00

200,0

Разом

X

57

X

X

1347,5

Щоб визначити внутрішньогрупову дисперсію, необхідно розрахувати часткові дисперсії у розрізі семи груп. Маючи групові середні |Х] |, знаходимо

..... . у і., ..

по кожної групі відповідну часткову дисперсію і ' 1. За даними прикладу, який

(гг2222 )

розглядається, необхідно обчислити сім таких дисперсій( 1, 11, 111 гп). Необхідні проміжні дані для їх обчислення наведено в таблиці 30.

Таблиця 30

Вихідні і розрахункові дані для обчислення внутрішньогрупової дисперсії (розрахунок часткових дисперсій) ( ')

Інтервал (група)

Варіанта,

хі

Частота,

п,

Розрахункові дані

~х.і

( Х1 - X] )2 Па

17,5-20,5

17,5

1

17,5

-1.4

1,96

1,96

( хі = 18,9)

17,6

2

35,2

-1.3

1,69

3,38

Б(х; - хі )2 п

Всього

X

9

170,0

X

X

9,05

9.051.0

= 9

...

...

...

...

...

...

...

...

35.5-38,5

36,2

I

36,2

-0.7

0,49

0,49

(- 36.9)

37,6

I

37,6

0.7

0.49

0,40

І(х, - хРШ )2 пі

Всього

X

2

73,8

X

X

0,98 =

= 098 = 0,49 2

Початку обчислень часткових дисперсій передує розрахунок групових

- _ їх- _ 170

середніх (Хі). Так, для першого інтервалу 9 =18,9. Аналогічно

розраховуємо середні для інших груп. Потім знаходимо окремі дисперсії °і , величини яких становлять: аі = 1,0; ^ = 0,43; агл = 1,12; Сіу = 0.68; °у = 1.09;гі - 0,58; суп - 0,49 (послідовність розрахунку показано тільки для першого і сьомого інтервалів).

Маючи обчислені значення часткових дисперсій, знаходимо величину внутрішньогрупової дисперсії:

ст2 = о) Х1 + о]1Па + Ощіїщ +... + о2ш = ** N + N1 + Жш І.... + N,1,,

_ 1х 9 + 0.43 х 6 +1.12 х 9 + 0.68 х13 +1.09 х15 + 0.58 х 3 + 0.49 х 2 _ 49.57 _ 0 87 ^ 0 9 9 + 6 + 9 +13 +15 + 3 + 2 ' 57 ~ . ~ .

Відповідно до правила складання дисперсій, яке випливає з доказу, що якщо сукупність складається з кількох груп, то загальна дисперсія дорівнює сумі внутрішньогрупової і міжгрупової дисперсій, маємо:

ст2 =ст2 +ст2 = 23,6 + 0,9 = 24,5

общ "ігр вгр ' ' '

За раніше наведеними розрахунками, величина загальної дисперсії за! дорівнює 24,5, що підтверджує вірність виконаних обчислень.

Теоретичний і практичний інтерес правила додавання дисперсій полягає у тому, що, знаючи дві величини дисперсії, на основі наведеної рівності завжди можна знайти третю. Наприклад:

222 сг = о -о

вгр гаг жгр

Маючи величини міжгрупової і загальної дисперсій, можна мати уяву про силу впливу групувальної ознаки. Про це мова піде при вивченні питань кореляційного і дисперсійного методів аналізу.

5.3.3. Дисперсія альтернативних ознак

Перш ніж розглянути питання про дисперсію альтернативних ознак, слід нагадати, що під альтернативною ознакою розуміють таку ознаку, якою одні варіанти наділені, а другі - ні. Так, якщо у вибірці, яка складається з п одиниць і п" одиниць, наділених даною ознакою, то їх частка ¥ у вибірковій сукупності становитиме:

п"

№ = -.

п

Розрахунок загальної, міжгрупової і внутрішньогрупової дисперсій для альтернативних ознак поданий за формулами в таблиці 31.

Таблиця 31

_Формули обчислення дисперсій для альтернативних ознак_

Вид дисперсії

Формула

Примітка

Загальна

а1, = и(1- И)

і - частка одиниць наділених даною ознакою

Міжгрупова

сг2 --

і,- - частка одиниць, наділених даною ознакою в і -й групі

п - число одиниць в і - й групі

Внутрішньогрупова

2 Т.и>і (1 - иі1 )п Ъп1

^п - об'єм вибірки и, = и)

Розглянемо послідовність розрахунку названих видів дисперсій на конкретному прикладі. У таблиці 32 представлена вибірка 60 підприємств, розподілених за виробничим типом на дві групи з обсягом п кожної і виділенням альтернативної ознаки - кількості збиткових підприємств ().

Підставляючи розрахункові дані таблиці 32 у формули відповідних видів дисперсій, одержимо:

аі = (1 - і) = 0,233/1 - 0,233 / = 0,179; а2 =І, -1)2 п, = 0,134 = 0,002;

мі 60

2 (1 ~ 1,)п, 10,6

=--- -:- = 0,177.

^■Щ = 60

Таблиця 32

Вихідні і розрахункові дані для обчислення дисперсій

Число Розрахункові дані

Група

Обсяг груп,

п

одиниць у

групі, наділених

даною ознакою, п"

п"

И[ =-

п

И = (1 - И>1 )

И(1 - и)п

И - и

(И - И)2

И - и)2 п

I

40

8

0,200

0,16

6,4

-0,03

0,0009

0,036

П

20

6

0,300

0,21

4,2

0,07

0,0049

0,098

Всього

60

14

0,233 (14:60)

X

10,6

X

X

0,134

Ґрунтуючись на правилі додавання дисперсій, маємо:

^ = +°1 або 0,179 =0,002+0,177; 0,179= 0,179.

Середнє квадратичне відхилення альтернативної ознаки в

даному випадку легко знайти шляхом добування кореня з ст" ,

тобто : ° = >/-№) = >/0^179 = 0.42.

5.3.2. Загальна, міжгрупова і внутрішньогрупова дисперсія
5.3.3. Дисперсія альтернативних ознак
§ 5.4. Моменти статистичного розподілу
§ 5.5. Характеристика асиметрії і ексцесу
ТЕМА 6. АНАЛІЗ ПОДІБНОСТІ РОЗПОДІЛІВ
§ 6.1. Статистична оцінка параметрів розподілу
§ 6.2. Закони розподілу вибіркових характеристик
6.2.1. Загальне поняття законів розподілу
6.2.2. Нормальний розподіл
6.2.3. Розподіл Стьюдента