Математична статистика - Руденко В.М.-3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Статистика / Математична статистика - Руденко В.М.

Розподіли випадкових величин

Випадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з певною ймовірністю. Випадковою можна назвати будь-яку (не обов'язково чисельну) змінну x, значення якої х створюють множину випадкових елементарних подій {х}.

Розрізняють дискретну і неперервну випадкові величини.

Дискретною випадковою величиною називається випадкова величина, що приймає скінчене число значень з множини, елементи якої можна пронумерувати. Неперервною випадковою величиною називається випадкова величина, можливі значення якої неперервно заповнюють деякий інтервал.

Рядок розподілу дискретної випадкової величини x може бути представлений як у табличній формі - у вигляді таблиці, де перераховано значення випадкової величини х₁, х₂, х_п з відповідними до них ймовірностямир₁, р₂, р_п (див. табл. 3.2), так і у вигляді графічного зображення (рис. 3.7).

Таблиця 3.2

Рядок розподілу дискретної випадкової величини X

Рис. 3.7. Графік розподілу дискретної випадкової величини X

Рядок розподілу може мати аналітичну форма представлення, наприклад:

В загальному вигляді це можна записати якД(Х) = Р(Х=х) - значення функції /(X) дорівнює ймовірності Р(Х=х) того, що змінна X приймає значення х.

За аналогією з випадковими подіями, можна вважати, що простором елементарних випадкових значень х₁, х₂, х_п змінної X є скінчена множина цих значень С1={х}. Кожному елементарному значенню х₁, х₂, х_п, яке належить до множини СІ, поставлено у відповідність невід'ємне число - ймовірностір₁, р₂, р_п, тобто р! = Р(Х = х{) > 0, причому сума ймовірностей появи всіх елементарних значень змінної x дорівнює одиниці:

Р, = 1. (3.14)

Отже, пару {СІ, Р} можна вважати імовірнісним простором, який складається зі скінченої множини значень О змінної x і невід'ємної функції Р, яка визначена на множині значень О і задовольняє умові (3.14).

Якщо емпіричні дані є результат статистичних випробувань, то емпіричний розподіл частот можна також трактувати як розподіл випадкової величини - співвідношення можливих значень з відповідними ймовірностями їхньої появи. Оскільки класичні ймовірності збігаються з відносними частотами (див. поняття класичної ймовірності), то розподіли частот можна представляти як відповідні розподіли випадкових величин, проте, лише за певними умовами і обмеженнями (мова про них йтиме нижче).

Розглянемо на прикладі побудову розподілу дискретної випадкової величини.

Приклад 3.11. Розрахувати розподіл кількості виконаних завдань за результатами тестування навмання відібраної з академічного потоку вибірки студентів обсягом 20 осіб (табл. 3.3).

Таблиця 3.3

Кількість виконаних завдань

Послідовність рішення:

o представити емпіричні дані табл. 3.3 значеннями хі і відповідними абсолютними частотами виконання завдань. Частоти розрахувати за будь-яким відомим методом і внести у комірки Л3:С9. Сума абсолютних частот по-

винна скласти обсяг вибірки, тобто ^ т_і = 20 (див. комірку С10 рис. 3.8);

і=1

o для розрахунку ймовірностейр = Р(Х = хї) внести в комірку вираз

=С3/$С$10, аналогічні вирази внести у комірки 04:09;

o розрахувати в комірках Е3:Е9 ймовірності р,- = Р(Х < хі);

o побудувати графіки розподілу ймовірностей (рис. 3.9).

Отже, у таблиці рис. 3.8 розраховано розподіли ймовірностей дискретної змінної X (кількості виконаних завдань) р'(х) = Р(Х = х) і р(х) = Р(Х< х), на рис. 3.9 зображено відповідні графіки.

Сукупність ймовірностей р'і = Р(Х = хі) має назву щільності розподілу змінної X (див. стовпчик Б рис. 3.8 і гістограму рис. 3.9). Кожне окреме значення щільності розподілу визначає ймовірність р',- кожного окремого значення X! змінної X , тобто Р(Х = хі). Сума ймовірностей р',- усіх елементарних значень X! змінної X (за умови повної системи випадкових значень) дорівнює

одиниці, тобто ^ р] = 1. Як бачимо з рис. 3.8 (див. комірку 010), ця вимога

і=1

виконується: 0,00+0,05+0,10+0,20+0,25+0,30+0,10= 1,00.

Сукупність ймовірностей р! = Р(Х < X!) має назву розподілу змінної X (див. стовпчик Е рис. 3.6 і дискретний графік рис. 3.7 у вигляді сходинок з насиченням до 1,00). Розподіл випадкової величини показує ймовірність для змінної X, значення якої не перевищує х^ , тобто Р(Х < х^. Кожне значення розподілу є сумою ймовірностей р'і усіх попередніх елементарних значень х, і

змінної X, тобто: р_і =^р'_І. Наприклад, для і = 4 значення ймовірність р₄

і=1

Аналогічно може бути представлено й щільність розподілу Дх). Для дискретної змінної розподіл і щільність розподілу зв'язані співвідношенням:

Р (хі) = ±/ (х,) (3.17)

і=1

Для неперервної змінної можна записати такі співвідношення:

- щільність розподілу Дх) = Р '(х). Це значить, що щільність Дх) є першою похідною від функції розподілу Р(х);

- щільність розподілу для будь-якої випадкової величини невід'ємна, тобто Лх) > 0, і має таку властивість:

складатиме р₄ р'. = 0,00 + 0,05 + 0,10 + 0,20 = 0,35 (див. комірку Е6 рис. 3.6).

¡=1

Ймовірність отримання у випробуванні будь-якого значення з повної системи випадкових значень (фактично, це є ймовірність достовірної події) дорівнює

одиниці. І дійсно, для і = п ймовірність р_п = ^ р] = 1(див. комірку Е9 рис. 3.6

і=1

або останнє значення ймовірності розподілу на графіку рис. 3.7).

Законом розподілу випадкової величини є співвідношення, що встановлює зв'язок між можливими значеннями випадкової величини і відповідними до них ймовірностями. Закон розподілу може бути задано функціями:

o функцією розподілу Р(х)

Р(х) = Р(Х < х); (3.15)

o функцією щільності розподілуДх)

Дх) = Р(Х = х). (3.16)

Для дискретної змінної функція розподілу Р(х) може бути представлена в аналітичній формі. Так, заданими рис. 3.8 функція Р(х) матиме вигляд:

Математичний аналіз надає геометричну інтерпретацію визначеному інтегралові (3.18) як площі (див. зафарбовану площу на рис. 3.10), яка зверху обмежена графіком функції /(х), а знизу - віссю абсцис у межах -ю < х < +со. Розмір площі за інтегралом (3.18) дорівнює одиниці.

Значення функції розподілу ¥(х) для певного значення х (наприклад, х = а) визначається через щільність розподілу /(х) за формулою:

Інтеграл (3.19) і функція ¥(а) розподілу також мають сенс площі (див. зафарбовану площу на рис. 3.11), яка обмежена з трьох боків: зверху - графіком функції Дх), знизу - віссю абсцис у межах -" < х < а, з правого боку -ординатою, яка проходить через точку х = а.

Для х = +со функція розподілу ¥(со)=1, тобто

і (со) = / (х)^х = 1. (3.20)

-ОС

Отже, порівнюючи алгебру випадкових подій з математичним апаратом випадкової величини, можна дійти до висновку про те, що розподіли випадкових величин ізоморфно відтворюються на розподілах випадкових подій.

Розглянемо приклад розподілу неперервної випадкової величини.

Приклад 3.12. Як відомо з психодіагностики, коефіцієнт інтелекту О (показник інтелектуального розвитку сукупності однакових за віком осіб) розподіляється за законом, близьким до нормального¹², щільність розподілу якого визначається формулою:

гґ ¹ -0,5((х-1в)/<7)² _г _г, . 1 | (х - І0² і

де /(х) - ймовірність Р(І<2 = х) того, що ї<2 прийме значення х; І<2 і а -середнє арифметичне і стандартне відхилення генеральної сукупності; % ~ 3,14; е ~ 2,71. Для певного контингенту індивідуумів середнє значення 1<2=100 і а =15.

Завдання: Побудувати розподіл коефіцієнта інтелекту І£) в діапазоні значень від І<2_МІН = 50 до І(2макс = 150. Визначити ймовірності того, що І(2 прийматиме значення: а) І£) < 80; б) Щ > 110; в) у межах 70 < І£) < 90; г) прийматиме значення поза межами інтервалу 80 < Щ < 120.

Рішення:

Розрахуємо значення щільності/(х) нормального розподілу і розподіл і(х) у табличній формі в указаному діапазоні з інтервалом 10 (рис. 3.10). Деталі розрахунку розглянемо пізніше у відповідному розділі. Важливим моментом є досягнення так званої нормалізації, за умови якої площа під кривою щільності розподілу /(х) повинна дорівнювати одиниці. Як бачимо з комірки С14 рис. 3.10, ця вимога виконується.

Побудуємо відповідні графіки розподілу І£) (рис. 3.13). Форма графіка щільності /(ІО) має вигляд "дзвону". Вона є симетричною відносно середнього значення ІО=100. Графік розподіл досягає насичення на рівні 1,00.

¹² Докладніше щодо нормального закону розподілу див. розділ 3.4.

Слід звернути увагу на те, що ймовірність Р(/£> < 100) = 0,50. Інакше кажучи, ймовірність отримати значення 12 на рівні не більше середнього значення ї<2=100 складає 50%. На рис. 3.13 це відповідає зафарбованій площі, яка складає 50% від загальної. Аналітично це можна записати так:

100

Р (х < 100) = | / (х)Сх = 0,50.

-сс

Розглянемо пункти завдання щодо визначення ймовірності отримання конкретних значень коефіцієнта інтелекту

а) Визначити ймовірність того, що 12 прийматиме значення не більше 80, тобто Р(ї<2 < 80). Цій ситуації відповідає зафарбована площа рис. 3.14, для якої Р(80) ~ 0,091 (значення 0,091 можна отримати з табл. рис. 3.12). Аналітичний запис має вигляд:

Р(х < 80) = | Л(х)сІх ~ 0,091.

-сс

Отже, ймовірність Р(І<2 < 80) = 0,091 = 9,1%.

б) Визначити ймовірність того, що значення 12 не менше 110, тобто ,Р(/0>110). Зафарбована площа рис. 3.15 відповідає ситуації, коли треба отримати подію ^4{/2>110}, яка є доповненням протилежної події А{ї<2 < 110}. Сума ймовірностей протилежних подій дорівнює одиниці. Звідси ймовірність бажаної події Р(І2>110) = 1 - Р(ї(2 < 110) і аналітичний запис для визначення відповідної ймовірності за допомогою функцій розподілу такий:

110

Р(х > 110) = 1 - Р(х < 110) = 1 - | Л(х)Сх = 1 - 0,748 = 0,252.

-сс

Значення Р(110) = 0,748 можна отримати з табл. рис. 3.12. Отже, ймовірність Р(/((>110) ~ 25,2%.

в) Визначити ймовірність того, що ¡2 прийматиме значення не менше 70, але не більше 90, тобто Р(70< ¡2 <90). Зафарбована площа рис. 3.16 відповідає ситуації, коли з події ^{¡2 < 90} треба вилучити елементи події А₂{12 < 70}. Тоді ймовірність Р(А) бажаної події А дорівнюватиме різниці ймовірностей Р(40 і Р(А,) подій А_х і ^2, тобто Р(70< 1(2 < 90) = Р(/( < 90) - Р(Р2 < 70). Визначення ймовірності за допомогою функцій розподілу матиме вигляд:

90 90 70

| Л(х)Сх = | Л(х)Сх - | Л(х)Сх = Р(90) - Р(70), або

Р(90) - Р(70) = 0,253 - 0,023 = 0,23. Отже, ймовірність Р(70< ¡2 < 90) = 23%.

г) Визначити ймовірність того, що І<О прийматиме значення поза межами інтервалу 80 < О < 120, тобто ,Р(80 > О >120). Цій події відповідає сума двох зафарбованих частин площі рис. 3.17. Рішення можна отримати у 2-х варіантах:

1-й варіант. Подія А складається з двох несумісних подій А₁{І<2 < 80} і ^₂{І<2 >120} з ймовірностями Р(АА і Р(А₂) відповідно. Ймовірність Р(АА події А₁ визначиться як

|/(х)ах = і(80), або з табл. рис. 3.12 маємо і(80) = 0,091.

Ймовірність Р(А₂) події ^4₂ визначиться як доповнення до протилежної події І2{ІО< 120} або Р(А₂) = 1 - ~Аі{ІО< 120}, а саме

120

і(х > 120) = 1 - | /(х)йх = 1 - і(120) або

-ос

120

і(х > 120) = 1 - і(х < 120) = 1 - | /(х)ох = 1 - 0,909 ~ 0,091.

-ос

Ймовірність Р(А) події А складається з суми ймовірностей Р(АА і Р(А₂) подій А₁ і А₂, тобто Р(А) = Р(А₁) + Р(А₂) = 0,091 + 0,091 ~ 0,182 = 18,2%.

2-й варіант. Подію ^4{80>І< >120} можна звести і розглядати як доповнення до протилежної події А, яку позначимо _8{80 <І(2 < 120} (див. незафарбовану площу рис. 3.17). Тоді Р(А) = 1- Р(В).

Подія _8{80< ¡2 <120} відповідає попередній ситуації (див. вище п. "в"), коли з події В₁ {¡2 < 120} треба вилучати елементи події В₂{2< 80}. Ймовірність Р(В) події В є різниця ймовірностей Р(В{) і Р(В₂)

Р(В) = Р(12 < 120) - Р(12 < 80). Ймовірність Р(А) бажаної події А дорівнюватиме

Р(А) = 1- Р(В) = 1 - [Р(Щ < 120) - Р(12 < 80)]. Визначення ймовірності за допомогою функцій розподілу матиме вигляд:

120 Г120 80 ~|

1 - | Л(х)Сх = 1 - | Л(х)Сх - | Л(х)Сх = 1 - [Р(120) - Р(80)], або 1- [Р(120) - Р(80)] = 1 - [0,909 - 0,091] = 1- 0,818 = 0,182 = 18,2%.

Отже, ймовірність того, що ¡2 не прийматиме значення в діапазоні від 80 до 120, тобто Р(80 > ¡2>120), складає 18,2%.

Зауваження: якщо графік розподілу симетричний і зафарбовані площі однакові за розміром, ймовірність Р(А) розраховується як подвоєна площа однієї з частин, наприклад, Р(А) = 2-Д80 < ¡2) = 2-0,091 ~ 0,182 = 18,2%.

Розподіли дають можливість рішення і зворотної задачі: знаходження значень змінної x, ймовірність якої задано.

Так, за даними прикладу 3.12 можна стверджувати, що на рівні ймовірності 0,05 (5%) коефіцієнт інтелекту ¡2 не перевищуватиме значення 75,3. З графіка функції розподілу Р(2) рис. 3.18 видно, що ймовірності 0,05 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 75,3. Інакше кажучи, Р(!2) = ^(¡2 < 75,3) = 0,05.

Аналогічно можна отримати значення змінної ¡2, ймовірність якої складає 20% або 0,20. З рис. 3.19 видно, що ймовірності 0,20 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 87,4.

Інакше кажучи, Р(!2) = ^(¡2 < 87,4) = 0,20.

На даному етапі вивчення властивостей розподілів доречно згадати поняття "процентиль" і надати йому додаткового змістовного сенсу. Як визначалося вище, процентилі ділять обсяг упорядкованої сукупності на сто частин, тобто відокремлюють від сукупності по 0,01 частки (по 1%). Pj - це z'-й процентиль - межа, нижче за яку лежать /' відсотків значень. Наприклад, якщо п'ятий процентиль дорівнює 30 (записують Р₅ = 30), це значить, що 5% всіх значеньx не перевищують 30.

Значення функції розподілу F(X), які знаходяться у межах від 0 для F(-") до 1 для F(+co), також зручно поділити на сто частин і представляти функцію розподілу у вигляді процентилів. Якщо ціна шкали функції розподілу F(x) становить 0,01 (1%), отримані вище результати можна прокоментувати у такій спосіб:

o для F(IQ) = P(IQ<75,3) = 0,05 = 5% можна записати Р₅ = 75,3 - п'ятому процентилю відповідає коефіцієнт інтелекту, який не перевищує значення у 75,3;

o для F(IQ) = P(IQ <87,4) = 0,20 = 20% можна записати Р₂₀ = 87,4 - двадцятому процентилю відповідає коефіцієнт інтелекту, який не перевищує 87,4.

Значення процентиля для нормального розподілу можна отримати за допомогою функції MS Excel =НОРМОБР(ймовірність; середнє; ст.відхилення). Так, ^₅ = НОРМОБР(0,05;100;15) = 75,3; а Р₂₀ = НОРМОБР(0,20;100;15) = 87,4.

Розподіли випадкових величин
Характеристики випадкових величин
Математичне сподівання
Дисперсія випадкової величини
3.3. ЗАКОН ВЕЛИКИХ ЧИСЕЛ
Повторні випробування
Теорема Бернуллі
Теорема Чебишева
Центральна гранична теорема
3.4. ТЕОРЕТИЧНІ РОЗПОДІЛИ ВИПАДКОВИХ ВЕЛИЧИН

Математична статистика - Руденко В.М. - 3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Статистика / Математична статистика - Руденко В.М.

Розподіли випадкових величин