Математична статистика - Руденко В.М. -
Критерій Стьюдента t

У дослідженнях з педагогіки чи психології часто виникає необхідність з'ясувати, чи розрізняються генеральні сукупності, з яких узято вибірки. Наприклад, чи відрізняються між собою експериментальна і контрольна група учнів за результатами тестування навчальних досягнень. Методи перевірки статистичних гіпотез про однорідність вибірок можуть бути реалізовані на основі параметричних і непараметричних критеріїв для незалежних (незв'язаних) і залежних (зв'язаних) вибірок. Отже, гіпотези про однорідність вибірок - це гіпотези про схожість або відмінність двох і більше вибірок.

Для варіанту незалежних вибірок постановка математико-статистичної задачі виглядає так: дві вибірки обсягом п1 і п2 взято випадковим методом з двох генеральних сукупностей, неперервні функції розподілу яких Р1(х) і Р2(х) є невідомими. Потрібно перевірити їхню однорідність (неоднорідність). Нульова й альтернативна гіпотези мають вигляд:

Но: Р1(х) = Р2(х); Яі: Р1(х) Ф Р2(х).

В математиці розроблено декілька методів (критеріїв) перевірки однорідності двох незалежних вибірок. Проте з точки зору прикладної статистики у дослідника нерідко виникає проблема оптимального вибору критерію перевірки однорідності. Тому розглянемо і проаналізуємо особливості та можливості використання декількох критеріїв.

Критерій Стьюдента t

Для перевірки однорідності незв'язаних вибірок нерідко використовується критерій Стьюдента і, статистика якого має вид:

де X1 і X2, s12 і sу, п1 і п2 - середні, дисперсії та обсяги першої і другої вибірок відповідно.

Критичне значення критерію ікр для заданого рівня значущості а й числа ступенів вільності (п1+п2-2) можна отримати з таблиць розподілу Стьюдента, а також за допомогою функції =СТЬЮДРАСПОБР(). Якщо | і | > | ікр|, то гіпотезу однорідності (гіпотезу Н0 про відсутність розходження) відхиляють.

Приклад 5.5. Перевірити статистичні гіпотези на рівні значущості 0,05 щодо однорідності двох незалежних вибірок за критерієм Стьюдента (емпіричні дані рис. 5.11 представлено умовними значеннями).

Послідовність рішення:

o Ситуації відповідає варіант неспрямованих гіпотез: Н0: /і} -2 = 0 (ці не відрізняється від /г2);

Ні: ц} - ц2 Ф 0 (и} відрізняється від /г2).

o Перевірка припущень: розподіл досліджуваних параметрів, а також дисперсії невідомі; вибірки незв'язані; обсяги вибірок різні; виміри інтервальні.

o Розрахунки емпіричного критерію показано на рис. 5.11 і 5.12. Емпіричне значення критерію іемп можна оцінити також з елементарних розрахунків:

o Критичне значення ікр для рівня значущості 0,05 можна отримати за

допомогою функції =СТЬЮДРАСПОБР(), яка повертає значення і0 05 ~ 2,03 двобічного ^-критерію, що відповідає варіанту неспрямованих гіпотез.

o Прийняття рішення. Оскільки іемп0о05, тобто 1,77 < 2,04, нульова гіпотеза Н0 приймається на рівні значущості 0,05.

o Формулювання висновків. На рівні значущості 0,05 відсутні підстави стверджувати про неоднорідність незалежних вибірок. Проте слід мати на увазі, що статистика критерію Студента перевіряє не збіг функцій розподілу вибірок, а збіг характеристик випадкових величин - математичних очікувань.

Перевірку гіпотез можна провести шляхом визначення ймовірності ремп за допомогою функції =СТЬЮДРАСП(Б27;Б26+С26-2;2) (див. комірку В29 рис. 5.11 і 5.12 рем" ~ 8,48%). Якщо ремп--0; нульова гіпотеза Н0 відхиляється. Як бачимо, ця умова не виконується: 8,48% > 5%, а це значить, що нульова гіпотеза h0 повинна бути прийнята.

Експрес-оцінювання ймовірності рем" можна провести і за допомогою функції MS Excel =ТТЕСТ(). Аргументами функції виступають: вибіркові масиви і деякі параметри. Для двобічної моделі нульова гіпотеза h0 приймається на рівні значущості а, якщо виконується умова а < ТТЕСТ < 1- а, інакше h0 відхиляється. У комірку В30 внесено вираз =TTECT(B3:B20;C3:C22;2;2) і отримано вже відоме значення, яке дорівнює приблизно 8,48% (див. рис. 5.11 і 5.12). Отже, на рівні значущості а = 0,05(5%) умова 5% < 8,48% < 95% виконується, тому нульова гіпотеза h0 приймається.

Перевірку статистичних гіпотез щодо однорідності двох незалежних вибірок можна здійснити за допомогою пакета "Аналіз даних" розділ "Двови-бірковий t-тест з однаковими дисперсіями" (рис. 5.13).

Рис. 5.13. Меню пакета "Аналіз даних"

Для реалізації цього засобу у відповідне діалогове вікно необхідно ввести параметри, як показано на рис. 5.14, виконати команду "ОК" і отримати результати т-тестування (рис. 5.15).

Рис. 5.14. Діалогове вікно "Двовибірковий ?-тест з однаковими дисперсіями"

Рис. 5.15. Результати двовибіркового ?-тесту

Двовибірковий ?-тест (рис. 5.15) розраховує значення основних статистик (середні, дисперсії), емпіричних і теоретичних критеріїв, що дає можливість приймати статистичні рішення аналогічні попереднім. Проте цей метод передбачає виконання вимоги рівності дисперсій сукупностей.

Критерій Крамера-Велча T
Критерій Колмогорова-Смірнова λ
Критерій Вілкоксона-Манна-Вітні U
Критерій Лемана-Розенблатта w2 n,m
5.4. ПЕРЕВІРКА ГІПОТЕЗ ПРО ЧИСЕЛЬНІ ЗНАЧЕННЯ ПАРАМЕТРІВ
Значущість середнього (критерій Z, дисперсія відома)
Значущість середнього (критерій t, дисперсія невідома)
Значущість дисперсії (критерій х2)
Відмінності у значеннях середніх (F-критерій для двох зв'язаних вибірок)
Відмінності у значеннях дисперсій (F-критерій Фішера для двох незв'язаних вибірок )