Математична статистика - Руденко В.М. -
Незгруповані розподіли

Незгруповані розподіли застосовують до емпіричних даних, властивості яких виміряні за інтервальними або відносними шкалами і приймають тільки певні, як правило, дискретні у вузькому діапазоні значення. Процедури розрахунку незгрупованих розподілів простіші за розрахунки розподілів згрупованих.

Приклад 2.2. Розрахувати диференціальні та інтегральні розподіли вико-

7 Дж. Гласс і Дж. Стенді називають їх розподілами "згрупованих" і "незгрупованих" частот [17]; Г.Ф. Лакін - розподілами "неінтервальних і інтервальних" варіант [43]; А.Т. Опря розділяє розподіли на "дискретні" та "інтервальні" ряди [48].

наних студентами завдань за даними табл. 2.1 (обсяг вибірки п =10). Послідовність рішення:

o характер емпіричних даних відповідає умовам для розрахунку незгрупова-них розподілів, оскільки діапазон варіант хі змінної X містить всього 6 дискретних значень варіант {0, 1, 2, 3, 4, 5};

o значення варіант коливаються від 0 виконаних завдань (мінімальне) до 5 виконаних завдань(максимальне), кількість варіант к=6;

o диференціальні абсолютні частоти мі (див. табл. 2.2) такі:

- для х1 =0 частота м1 =0 (немає жодного об'єкта з цим значенням змінної);

- для х2=1 частота м2=1 (один об'єкт з цим значенням змінної);

- для х3=2 частота м3=1 (один об'єкт з цим значенням змінної);

- для х4=3 частота м4=2 (два об'єкта з цим значенням змінної) і т.д. Сума всіх абсолютних частот повинна дорівнювати обсягу вибірки:

к к

£ мі = п, тобто X Мі = м1 + м 2 + ... + мк = 0 + 1 + 1 + 2 + 5 + 1 = 10.

і=1 і=1

Таблиця 2.2

Розподіли кількості виконаних завдань

o диференціальні відносні частоти/ = мі/п (див. табл. 2.2) такі:

- для х1=0 частота м1 = м1 /п = 0/10 = 0,00 (або 0 %);

- для х2=1 частота м2= м2 /п = 1/10 = 0,10 (або 10 %);

- для хз=2 частота тз= тз /п = 1/10 = 0,10 (або 10 %);

- для х4=3 частота т4= т4 /п = 2/10 = 0,20 (або 20 %) і т.д.

Сума всіх відносних частот має дорівнювати одиниці (або 100 %):

к к

£/і ті /п = 0,00 + 0,10 + 0,10 + 0,20 + 0,50 + 0,10 = 1,00.

¿=1 ¿=1

і

o інтегральні абсолютні частоти ^ті (див. табл. 2.2):

;=1

1

- для х1=0 частота £ ті = т1 = 0;

;=1

2

- для х2=1 частота £ ті = т1 + т2 = 0 +1 = 1;

;=1

з

- для хз=2 частота X ті = т1 + тг + тз = 0 +1 +1 = 2;

і=1 4

- для х4=3 частота Xті = т + т2 + тз + т4 = 0 +1 +1 + 2 = 4 і Т.д.

¿=1

Остання інтегральна абсолютна частота дорівнюватиме обсягу вибірки: У ті = т1 + т2 + т3 + т4 + т5 + т6 = 0 +1 +1 + 2 + 5 +1 = 10.

і

o інтегральні відносні частоти Гі =^/і (див. табл. 2.2) такі:

¿=1

- для х1=0 частота ^1 = ^ /і = /1 = 0;

2

- для х2=1 частота Р2 = £ /і = /1 + /2 = 0 + 0,10 = 0,10;

- для хз=2 частота ^ = £ / = /1 + /2 + /з = 0 + 0,10 + 0,10 = 0,20;

- для х4=з частота ^ = £ / = / + /2 + / + / = 0 + 0,10 + 0,10 + 0,20 = 0,40 і т.д.

і=1

Остання інтегральна відносна частота дорівнюватиме одиниці (або 100 %), оскільки сума всіх диференціальних відносних частот складає 1,00 або 100%:

^ =е / = /1 + /2 + oo ■ + /6 = 0 + 0,ю + oo ■ + 0,ю = 1,00 = 1°0%.

¡=1

Для візуалізації результатів використовують графіки, наприклад, відносних диференціальних та інтегральних розподілів рис. 2.3.

Розподіли відносних частот (диференціальні та інтегральні) мають перевага перед розподілам абсолютних частот, оскільки їхні відносні значення приведені до 100 % і не залежать від обсягу конкретної вибірки.

Статистичні розподіли можуть бути представлені у вигляді аналітичної емпіричної функції. Так, для прикладу 2.2 функції диференціального та інтегрального розподілу показано на рис. 2.4 і 2.5.

Важливо усвідомити такі основні властивості функцій / і 7^ :

- диференціальна функція /(X = хі) показує значення частоти/ для змінної X, що дорівнює значенню х,- (тобто X = хі);

- інтегральна функція F (X < хі) показує значення частоти F для змінної X, що не перевищує значення х,- (X < хі тобтоX або менше, або дорівнює х,);

- обидві емпіричні функції є дискретними і пов'язані між собою співвідношенням Fj = ^ fi ;

1=1

- Ft (X < xt) прийнято називати функцією розподілу, a j (X = хі) - функцією щільністю розподілу.

Приклад 2.3. Розрахувати статистичні розподіли за вибірковими емпіричними даними таблиці рис. 2.4. Послідовність рішення:

o у комірках В6 і В7 визначити мінімальне і максимальне значення варіанти х,- за допомогою функцій MS Excel =МИН(Л2:Е5) і =MAKC(A2:E5);

o характер даних відповідає умовам розрахунку незгрупованих розподілів, оскільки діапазон змінної містить всього 7 дискретних значень {0, 1, 2, 3, 4, 5, 6};

o внести у комірки Л12:А18 значення варіант х,- від 0 до 6 (рис. 2.4);

o виділити діапазон В12:В18, натиснути клавішу F2 і за допомогою "Майстра функцій" внести у ці комірки функцію MS Excel =ЧАСТОТА();

o задати аргументи функції =ЧАСТОТА() у діалоговому вікні (рис. 2.5);

o натиснути разом клавіші ЄТЯЬ+8ИІРТ+ЕКТЕЯ і отримати у комірках В12:В18 значення абсолютних диференціальних частот (рис. 2.6);

o для розрахунку диференціальних відносних, інтегральних абсолютних і відносних частот внести у комірки С12:Е19 відповідні формули (рис. 2.7);

o отримати результати табличних розрахунків розподілу частот (рис. 2.8);

o побудувати графіки розподілу (рис. 2.9). Відзначимо, що інтегральний розподіл є дискретним і має форму "сходинок", хоча поширені комп'ютерні засоби, наприклад, MS Excel, "малюють" його ламаною лінією.

Властивості розподілів дозволяють зробити важливі висновки. Так, площа під графіком диференціального розподілу має сенс частоти. Так, відносні диференціальні частоти кількості виконаних завдань у діапазоні варіант х,- від 0 до 3 включно, що складають сумарне значення 0,25=0,05+0,05+0,15 (див. заштриховану частину гістограми на рис. 2.10), відповідають інтегральній частоті 7^=0,25. Це значить, що об'єкти з властивостями х,- < 3 складають 25% від загального обсягу вибірки.

Відносні диференціальні частоти у діапазоні варіант х,- від 3 до 4, що

складають сумарне значення 0,55=0,15+0,40 (див. заштриховану частину гістограми на рис. 2.11), відповідають різниці інтегральних відносних частот F5=0,65 і F3=0,10, тобто 0,65 - 0,10 = 0,55. Це значить, що об'єкти з властивостями 3 < х,- < 4 складають 55 % від загального обсягу вибірки.

Отже у результаті систематизації і обробки первинних вибіркових даних формується важливий показник вибірки - емпіричні розподіли частот: диференціальні та інтегральні, кожний з яких може бути або абсолютним, або відносним. Сума всіх абсолютних частот дорівнює обсягу вибірки, сума всіх відносних частот дорівнює 1 або 100%. Інтегральні (накопичені) розподіли формуються як доданки усіх попередніх диференціальних частот або абсолютних, або відносних. Вони дають значення сумарної частоти для варіанти, яка не перевищує значення х,-.

У психолого-педагогічних дослідженнях переважно розраховуються розподіли відносних частот, оскільки саме відносні частоти представляють собою (це буде доведено нижче) і визначаються як статистичні ймовірності.

Згруповані розподіли
Атрибутивні розподіли
Ранжировані розподіли
2.2. ПОКАЗНИКИ ВИБІРКИ
Міри центральної тенденції (МЦТ)
Міри мінливості (ММ)
Розрахунки та інтерпретація МЦТ і ММ
Початкові та центральні моменти
Квантилі
Нормовані дані