Математична статистика - Руденко В.М.-Метод найменших квадратів

Статистика / Математична статистика - Руденко В.М.

В основі застосування методу найменших квадратів покладено умову мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою.

Приклад 4.3. Визначити оцінку генерального середнього /й_мнк випадкової величини xза методом найменших квадратів. Рішення:

Згідно з умовою мінімізації можна записати

u = £ (x, - її)¹ = min. (4.14)

Для визначення екстремуму першу похідну функції u слід прирівняти нулю

-^dU- = -l£ (x,-//) = 0, звідки X ^(xi = Х ^x, - ⁿ<" = ⁰ і М= - Z x_t .

^dM ¡=1 i=1 i=1 ⁿ ,=1

Отже, /} _янк = x. (4.15)

Таким чином, оцінка за методом найменших квадратів математичного сподівання /й_янк випадкової величини x є вибіркове середнє x (ця оцінка співпадає з оцінкою максимальної правдоподібності для випадкової величини, що має нормальний розподіл). Метод найменших квадратів має широке застосування у практиці статистичних досліджень, оскільки не вимагає знання закону розподілу випадкової величини і має достатньо розроблений математичний апарат.

Інтервальне оцінювання

Точкові оцінки навіть у тих ситуаціях, коли вони спроможні (наближуються до значення параметру при збільшені n), незміщені (у середньому збігаються з параметром) і ефективні (мають найменшу ступінь випадкових відхилень), є все ж таки наближеними показниками невідомих параметрів. їхнім головним недоліком вважається те, що при малому обсязі вибірки точкові оцінки можуть мати значне розходження з тим параметром, який вони оцінюють, а це може призвести до грубих помилок.

Інтервальною оцінкою називається чисельний інтервал, який покриває²¹ з певною ймовірністю невідомий параметр генеральної сукупності. Цей чисельний інтервал (2/1) називається довірчим інтервалом, а ймовірність - довірчою ймовірністю в ²². Найчастіше довірчий інтервал вибирається симетричним до параметру ©, тобто (© -а, © +а ).

Розмір довірчого інтервалу залежить від обсягу вибірки п (зменшується з ростом п) і від значення довірчої ймовірності (збільшується при наближенні

в до одиниці). Відхилення оцінки ©_п від параметра ©, що оцінюється з певною довірчою ймовірністю в, називають випадковою похибкою репрезентативності. її найбільше відхилення є граничною похибкою. Випадкова похибка репрезентативності виникає внаслідок того, що досліджується не вся сукупність, а лише її частина (вибірка). її не слід плутати з систематичною похибкою репрезентативності, яка є наслідком порушення принципу випадковості при відборі елементів до вибірки, що може мати місце у практичній діяльності.

Довірча ймовірність в визначається дослідником за принципом практичної неможливості, а саме: події з імовірністю, близькою до 1, вважаються вірогідними (достовірними); події з імовірністю, близькою до 0, визнаються невірогідними (неможливими). Цей принцип не може бути доказаний математично. До того ж його сформульовано до однократного виконання випробування.

Поруч із поняттям "довірча ймовірність" в використовується поняття "рівень значущості" а. Між в і а існує співвідношення: в =1- а.

Рівень значущості а - вказує ймовірність помилки оцінювання. Для практичних цілей використовують різні значення довірчої ймовірності в або

²¹ С.АЙвазян, Н. Кремер та ін. наполягають на використанні саме слів "інтервал покриває", а не "містить", оскільки межі чисельного інтервалу визначаються за вибірковими даними і тому є випадковими величинами [1, С. 289; 41, С. 320].

²² Іноді довірчу ймовірність називають рівнем довіри або надійністю оцінки. [41, С.

320].

рівня значущості а - усе залежить від ризику помилки, який може собі дозволити дослідник. Якщо в (довірча імовірність) - це своєрідний "рівень довіри" прийняття рішення, то сенс параметра а (рівень значущості) можна трактувати як ймовірність ризику помилитися при прийнятті рішення. У психологічних і педагогічних дослідженнях загальноприйнятими вважаються так звані стандартні значення в і а (див. табл. 4.2).

Таблиця 4.2

Стандартні значення довірчої ймовірності в, рівня значущості " і параметра і

Довірча ймовірність	Рівень значущості	Параметр нормального розподілу
в	а	2 а	² а/2
0,90 (90% вірогідності)	0,10 (10%-й рівень)	1,28	1,64
0,95 (95% вірогідності)	0,05 (5%-й рівень)	1,64	1,96
0,99 (99% вірогідності)	0,01 (1%-й рівень)	2,33	2,58
0,999 (99,9% вірогідності)	0,001 (0,1%-й рівень)	3,09	3,29

Методи визначення довірчих інтервалів реалізовано в основному на двох підходах: на знанні точного розподілу вибіркових характеристик для малих обсягів вибірок і на асимптотичних властивостях розподілу вибіркових характеристик для значних обсягів вибірок.

Довірчий інтервал розміром 2А - це чисельний інтервал, який з довірчою ймовірністю в покриває дійсне значення параметра генеральної сукупності. Наприклад, генеральне середнє /г може належати до інтервалу значень від (X -А) до (X +А), де вибіркове X є серединою цього довірчого інтервалу. Ширина довірчого інтервалу 2А може бути точно обчислена для заданої довірчої ймовірності в (або рівня значущості а) і цілком певного розподілу ймовірностей. На рис. 4.1 показано ширину симетричного довірчого інтервалу генерального середнього /і для нормального розподілу N(0,1).

Як бачимо, при збільшені довірчої ймовірності в (зменшені значення а) ширина довірчого інтервалу 2А зростає, що знижує точність визначення параметра генеральної сукупності. Для нормального розподілу модель інтервальної оцінки середнього генеральної сукупності /и має вигляд:

/ие(Х-А,Х + (4.16)

де А= ~~^аІ2_Г ^х~~ ; X і s_x - вибіркове середнє і стандартне відхилення; п - обсяг вибірки; 2а/₂ - параметр стандартного нормального розподілу (див. табл. 4.2) ; а - рівень значущості - ймовірність того, що відхилення вибіркового від генерального середнього не перевищить А за абсолютним значенням .

Рис. 4.1. Ширина довірчого інтервалу ТА для середнього /г=0

Вираз (4.16) свідчить, що середнє генеральної сукупності ¡1 покривається

діапазоном значень від (X -А) до (X +А). Оскільки А-то для підвищення

*Jn

точності при заданій довірчій ймовірності слід збільшувати обсяг вибірки n.

Приклад 4.4. Вибірка обсягом 80 осіб має середнє арифметичне X = 100 і стандартне відхилення s_x = 5,6. Необхідно оцінити довірчий інтервал середнього генеральної сукупності fi на рівні значущості 0,05.

Послідовність рішення:

o визначити параметр стандартного нормального розподілу для рівня значущості а за допомогою функції MS Excel =НОРМСТОБР(0,05/2), яка повертає значення 1,96;

o довірчий інтервал середнього генеральної сукупності ¡1 дорівнюватиме

Л= = ^1,96=⁵⁶ " 1,23

л/и л/80 '

Відповідь: на рівні значущості 0,05 середнє генеральної сукупності fi належить діапазонові 100,0 + 1,23 . Інакше кажучи, з довірчою ймовірністю 95% середнє fi покривається діапазоном значень у межах від 98,77 до 101,23.

Довірчий інтервал зручно оцінювати за допомогою спеціальної функції MS Excel з відповідними аргументами =ДОВЕРИТ(а; s_x; и). Так, для прикладу 4.4, функція =ДОВЕРИТ(0,05; 5,6; 80) повертає вже відоме значення 1,23. Запитання. Завдання.

1. Охарактеризуйте основні методи формування емпіричної вибірки.

2. Розкрийте поняття статистичної оцінки.

3. Чим відрізняються між собою точкове й інтервальне оцінювання?

4. Чим відрізняються "параметри" від " статистик"?

5. Охарактеризуйте основні властивості статистичних оцінок.

6. Яка ідея методу моментів як методи статистичного оцінювання?

7. В чому суть методу максимальної правдоподібності?

8. Які умови покладено в основу методу найменших квадратів?

9. В чому полягає суть інтервального статистичного оцінювання?

10. Охарактеризуйте поняття "довірча ймовірність" і "рівень значущості". Яке співвідношення існує між ними?

11. Що означає довірчий інтервал і як його розрахувати?

12. Повторіть математичні розрахунки за прикладами 4.1 - 4.4.

13. Виконайте лабораторну роботу № 9.

Інтервальне оцінювання
5. ПЕРВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ
Поняття статистичної гіпотези
Статистичні критерії
Параметричні і непараметричні критерії
Рівень статистичної значущості
Правила прийняття статистичних рішень
Помилки прийняття статистичних рішень
Статистичні рішення на основі р-значень

Математична статистика - Руденко В.М. - Метод найменших квадратів

Статистика / Математична статистика - Руденко В.М.

Інтервальне оцінювання