Математична статистика - Руденко В.М. -
Початкові та центральні моменти

Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням:

o математичних операцій за відповідних формул МЦТ і ММ;

o вбудованих статистичних функцій MS Excel;

o спеціального розділу "Описова статистика" пакету "Аналіз даних". Спосіб 1. Результати розрахунку МЦТ і ММ представлено на рис. 2.37,

відповідні математичні вирази, формули і функції MS Excel - на рис. 2.38 .

Рис. 2.38. Математичні вирази для розрахунку МЦТ і ММ

Мода вибірки Мо=2 (значення 2 трапляється у вибірці 5 разів). Медіана дорівнює

Мй - Хп/2 + Хп/2+1 _ Х12/2 + Х12/2+1 _ Х6 + Х7 _ 2 + 2 _ 4 _ 2

~ 2 2 ~ 2 ~ 2 ~2~ .

Середнє арифметичне вибірки X = - v хі = - 28 = 2,33.

п 12

Дисперсія вибірки у2 = ^(п'_1 ) = 1^ = ~ 1,52 .

Стандартне відхилення вибірки ух =^[^ї = 1,52 "1,23. Асиметрія вибірки

Спосіб 2. Результати розрахунків показників описової статистики для чотирьох вибірок представлено на рис. 2.39, графіки розподілу - на рис. 2.402.43. Для розрахунків були використані такі статистичних функцій MS Excel:

Обсяг вибірки =СЧЁТ()

Дисперсія

=дисп()

Середнє =СРЗНАЧ()

Ст. відхилення

=СТАНДОТКЛОН()

Мода =МОДА()

Асиметрія

=СКОС()

Медіана =МЕДИАНА()

Ексцес

=ЭКСЦЕСС()

Рис. 2.39. Розрахунки розподілу, МЦТ і ММ за допомогою функцій табличного процесора MS Excel

Розподіли розраховано за допомогою функції =ЧАСТОТА() і представлено на рис 2.40-2.43.

Як видно, всі вибірки унімодальні, характеризуються приблизно однаковими МЦТ (див. комірки F25:J27). Розподіл вибірки f1(x) має нульову асиметрію (0,00), малий додатний ексцес (0,20) і серед чотирьох вибірок найбільш відповідає властивостям нормального розподілу (рис. 2.40).

Розподіл f2(x) характеризується незначною від'ємною асиметрією (-0,18) і суттєвим від'ємним ексцесом (-0,75) (рис. 2.41). Розподіл f3(x) "деформований" у лівий бік з асиметрією (0,70) і помірним додатним ексцесом (0,26) (рис. 2.42). Розподіл f4(x) має від'ємну асиметрію (-0,68) ще й додатний позитивний ексцес (0,64). У порівнянні зі "стандартом" він менш за все відповідає вимогам нормальності серед досліджуваних вибірок.

Спосіб 3. Отримати показники МЦТ і ММ вибірки за допомогою пакета "Аналіз даних" розділ "Описова статистика" можна у такій послідовності дій:

o виконати команди головного меню Excel [Сервіс -> Аналіз даних], вибрати розділ "Описова статистика (рис. 2.44), викликати діалогове вікно;

Рис. 2.44. Розділ "Описова статистика"

o встановити у діалоговому вікні "Описова статистика" (рис. 2.45) вхідні дані та параметри виводу, виконати команду ОК і отримати результати у комірках стовпчиків С:Б (рис. 2.46);

Рис. 2.45. Параметри діалогового вікна

o порівняти результати з розрахунками емпіричних МЦТ і ММ попереднього способу 1 (рис. 2.37), зробити висновки.

Рис. 2.46. Результати розрахунку основних показників описової статистики

Отже, серед розглянутих способів розрахунку статистик (показників МЦТ і ММ), найбільш ефективним і гнучким вважаються засоби з використанням вбудованих статистичних функцій табличного процесора MS Excel.

Початкові та центральні моменти

Для системної характеристики варіаційного ряду використовують спеціальні показники - початкові та центральні моменти.

Початковий момент к-то порядку варіаційного ряду визначається як:

п

vkхк * Їі . (2.13)

Центральний момент к-то порядку визначається за формулою:

п _

тк "х)к *Л , (2.14)

і=і

де Хі - варіанти розподілу; /і - диференціальні відносні частоти, x - середнє арифметичне.

Очевидно, що перший початковий момент (к=1) має сенс середнього арифметичного варіаційного ряду

п _

т1 =ххі " -/і = х . (2.15)

Перший центральний момент (к=1) дорівнює нулю, що зумовлено властивостями середнього

п _

т =е (х - х) ■ /і = о. (2.16)

Другий центральний момент (к=2) - це дисперсія ¡1 варіаційного ряду

п _

т2(х ~х)2 ■ /і = ях2. (2.17)

Третій центральний момент (к=3) характеризує асиметрію розподілу

тз = £(Хі - X)3/і .

Якщо розділити третій центральний момент т3 на куб середньоквадра-тичного відхилення (ях)3, то отримаємо коефіцієнт асиметрії розподілу ^4х:

7% £ - Х)3 У = А* . (2.18)

С5*) С5*) 1=1

Четвертий центральний момент т4 дає можливість оцінити "загостреність" варіаційного ряду, тобто оцінити ексцес

т4 = £(х, - X)4/ . Коефіцієнт ексцесу Ех визначається через 4-й центральний момент т4 :

-3-[5(х;-Х)3Л]-3-Ех (2.19)

Між центральними і початковими моментами існує зв'язок: т! = 0;

що витікає з перетворень:

п п п п

т2 =£(X "X)2/ =е(*2 "2х,Х + X v, =£х2У) -е(2х,Х-X2)/і = і=і і=і і=і і=і

= уг -х(х,Х+х~Х-X2)/і = уг -Х%/ -Х£(х, -X)/; ^2 -^ -0 = уг -V2

і=1 і=1 і=1

п п

Отже, якщо т2 = v2 =е хі ' ї; , vl =ех;' ї; , то можна отримати ще одне співвідношення, яке використовується для розрахунку дисперсії:

п ( п 2

і=1 v і=1 )

Центральні моменти 3-го і 4-го порядку теж можна записати за допомогою початкових моментів:

т3 = v3 - 3^2 + 2v3, (2.20)

т4 = v4 - 4^3 + 6v12v2 - 3v4 і т.д.

Практика статистичних досліджень обмежується, як правило, використанням моментів до 4-го порядку.

На основі порівняння значень теоретичних і вибіркових моментів виконується оцінювання параметрів розподілів випадкових величин (див., наприклад, розділ 4 "Методи статистичного оцінювання").

Квантилі
Нормовані дані
2.3. КОРЕЛЯЦІЙНИЙ АНАЛІЗ
Сутність кореляції
Лінійна кореляція
Нелінійна кореляція
Коефіцієнти взаємної зв'язаності
2.4. РЕГРЕСІЯ
Одномірна лінійна регресія
Множинна регресія