Математична статистика - Руденко В.М. - Метод найменших квадратів

В основі застосування методу найменших квадратів покладено умову мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою.

Приклад 4.3. Визначити оцінку генерального середнього мнк випадкової величини xза методом найменших квадратів. Рішення:

Згідно з умовою мінімізації можна записати

n

u = £ (x, - її)1 = min. (4.14)

Для визначення екстремуму першу похідну функції u слід прирівняти нулю

-dU- = -l£ (x,-//) = 0, звідки X (xi = Х x, - n<" = 0 і М= - Z xt .

dM ¡=1 i=1 i=1 n ,=1

Отже, /} янк = x. (4.15)

Таким чином, оцінка за методом найменших квадратів математичного сподівання янк випадкової величини x є вибіркове середнє x (ця оцінка співпадає з оцінкою максимальної правдоподібності для випадкової величини, що має нормальний розподіл). Метод найменших квадратів має широке застосування у практиці статистичних досліджень, оскільки не вимагає знання закону розподілу випадкової величини і має достатньо розроблений математичний апарат.

Інтервальне оцінювання

Точкові оцінки навіть у тих ситуаціях, коли вони спроможні (наближуються до значення параметру при збільшені n), незміщені (у середньому збігаються з параметром) і ефективні (мають найменшу ступінь випадкових відхилень), є все ж таки наближеними показниками невідомих параметрів. їхнім головним недоліком вважається те, що при малому обсязі вибірки точкові оцінки можуть мати значне розходження з тим параметром, який вони оцінюють, а це може призвести до грубих помилок.

Інтервальною оцінкою називається чисельний інтервал, який покриває21 з певною ймовірністю невідомий параметр генеральної сукупності. Цей чисельний інтервал (2/1) називається довірчим інтервалом, а ймовірність - довірчою ймовірністю в 22. Найчастіше довірчий інтервал вибирається симетричним до параметру ©, тобто (© -а, © +а ).

Розмір довірчого інтервалу залежить від обсягу вибірки п (зменшується з ростом п) і від значення довірчої ймовірності (збільшується при наближенні

в до одиниці). Відхилення оцінки ©п від параметра ©, що оцінюється з певною довірчою ймовірністю в, називають випадковою похибкою репрезентативності. її найбільше відхилення є граничною похибкою. Випадкова похибка репрезентативності виникає внаслідок того, що досліджується не вся сукупність, а лише її частина (вибірка). її не слід плутати з систематичною похибкою репрезентативності, яка є наслідком порушення принципу випадковості при відборі елементів до вибірки, що може мати місце у практичній діяльності.

Довірча ймовірність в визначається дослідником за принципом практичної неможливості, а саме: події з імовірністю, близькою до 1, вважаються вірогідними (достовірними); події з імовірністю, близькою до 0, визнаються невірогідними (неможливими). Цей принцип не може бути доказаний математично. До того ж його сформульовано до однократного виконання випробування.

Поруч із поняттям "довірча ймовірність" в використовується поняття "рівень значущості" а. Між в і а існує співвідношення: в =1- а.

Рівень значущості а - вказує ймовірність помилки оцінювання. Для практичних цілей використовують різні значення довірчої ймовірності в або

21 С.АЙвазян, Н. Кремер та ін. наполягають на використанні саме слів "інтервал покриває", а не "містить", оскільки межі чисельного інтервалу визначаються за вибірковими даними і тому є випадковими величинами [1, С. 289; 41, С. 320].

22 Іноді довірчу ймовірність називають рівнем довіри або надійністю оцінки. [41, С.

320].

рівня значущості а - усе залежить від ризику помилки, який може собі дозволити дослідник. Якщо в (довірча імовірність) - це своєрідний "рівень довіри" прийняття рішення, то сенс параметра а (рівень значущості) можна трактувати як ймовірність ризику помилитися при прийнятті рішення. У психологічних і педагогічних дослідженнях загальноприйнятими вважаються так звані стандартні значення в і а (див. табл. 4.2).

Таблиця 4.2

Стандартні значення довірчої ймовірності в, рівня значущості " і параметра і

Довірча ймовірність

Рівень значущості

Параметр нормального розподілу

в

а

2 а

2 а/2

0,90 (90% вірогідності)

0,10 (10%-й рівень)

1,28

1,64

0,95 (95% вірогідності)

0,05 (5%-й рівень)

1,64

1,96

0,99 (99% вірогідності)

0,01 (1%-й рівень)

2,33

2,58

0,999 (99,9% вірогідності)

0,001 (0,1%-й рівень)

3,09

3,29

Методи визначення довірчих інтервалів реалізовано в основному на двох підходах: на знанні точного розподілу вибіркових характеристик для малих обсягів вибірок і на асимптотичних властивостях розподілу вибіркових характеристик для значних обсягів вибірок.

Довірчий інтервал розміром 2А - це чисельний інтервал, який з довірчою ймовірністю в покриває дійсне значення параметра генеральної сукупності. Наприклад, генеральне середнє /г може належати до інтервалу значень від (X -А) до (X +А), де вибіркове X є серединою цього довірчого інтервалу. Ширина довірчого інтервалу 2А може бути точно обчислена для заданої довірчої ймовірності в (або рівня значущості а) і цілком певного розподілу ймовірностей. На рис. 4.1 показано ширину симетричного довірчого інтервалу генерального середнього /і для нормального розподілу N(0,1).

Як бачимо, при збільшені довірчої ймовірності в (зменшені значення а) ширина довірчого інтервалу зростає, що знижує точність визначення параметра генеральної сукупності. Для нормального розподілу модель інтервальної оцінки середнього генеральної сукупності /и має вигляд:

/ие(Х-А,Х + (4.16)

де А= аІ2Г х ; X і sx - вибіркове середнє і стандартне відхилення; п - обсяг вибірки; 2а/2 - параметр стандартного нормального розподілу (див. табл. 4.2) ; а - рівень значущості - ймовірність того, що відхилення вибіркового від генерального середнього не перевищить А за абсолютним значенням .

Рис. 4.1. Ширина довірчого інтервалу ТА для середнього /г=0

Вираз (4.16) свідчить, що середнє генеральної сукупності ¡1 покривається

діапазоном значень від (X -А) до (X +А). Оскільки А-то для підвищення

*Jn

точності при заданій довірчій ймовірності слід збільшувати обсяг вибірки n.

Приклад 4.4. Вибірка обсягом 80 осіб має середнє арифметичне X = 100 і стандартне відхилення sx = 5,6. Необхідно оцінити довірчий інтервал середнього генеральної сукупності fi на рівні значущості 0,05.

Послідовність рішення:

o визначити параметр стандартного нормального розподілу для рівня значущості а за допомогою функції MS Excel =НОРМСТОБР(0,05/2), яка повертає значення 1,96;

o довірчий інтервал середнього генеральної сукупності ¡1 дорівнюватиме

Л= = 1,96=56 " 1,23

л/и л/80 '

Відповідь: на рівні значущості 0,05 середнє генеральної сукупності fi належить діапазонові 100,0 + 1,23 . Інакше кажучи, з довірчою ймовірністю 95% середнє fi покривається діапазоном значень у межах від 98,77 до 101,23.

Довірчий інтервал зручно оцінювати за допомогою спеціальної функції MS Excel з відповідними аргументами =ДОВЕРИТ(а; sx; и). Так, для прикладу 4.4, функція =ДОВЕРИТ(0,05; 5,6; 80) повертає вже відоме значення 1,23. Запитання. Завдання.

1. Охарактеризуйте основні методи формування емпіричної вибірки.

2. Розкрийте поняття статистичної оцінки.

3. Чим відрізняються між собою точкове й інтервальне оцінювання?

4. Чим відрізняються "параметри" від " статистик"?

5. Охарактеризуйте основні властивості статистичних оцінок.

6. Яка ідея методу моментів як методи статистичного оцінювання?

7. В чому суть методу максимальної правдоподібності?

8. Які умови покладено в основу методу найменших квадратів?

9. В чому полягає суть інтервального статистичного оцінювання?

10. Охарактеризуйте поняття "довірча ймовірність" і "рівень значущості". Яке співвідношення існує між ними?

11. Що означає довірчий інтервал і як його розрахувати?

12. Повторіть математичні розрахунки за прикладами 4.1 - 4.4.

13. Виконайте лабораторну роботу № 9.

Інтервальне оцінювання
5. ПЕРВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ
Поняття статистичної гіпотези
Статистичні критерії
Параметричні і непараметричні критерії
Рівень статистичної значущості
Правила прийняття статистичних рішень
Помилки прийняття статистичних рішень
Статистичні рішення на основі р-значень
© Westudents.com.ua Всі права захищені.
Бібліотека українських підручників 2010 - 2020
Всі матеріалі представлені лише для ознайомлення і не несуть ніякої комерційної цінностію
Электронна пошта: site7smile@yandex.ru