Статистичний критерій - це вирішальне правило, що забезпечує математично обґрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні критерії будуються на основі статистики ^(х1, х2, хп) - деякої функції від результатів спостережень х1, х2, хп. Статистика ¥ є випадковою величиною з певним законом розподілу. Серед значень статистики ¥ виділяють критичну область ¥кр з властивістю: якщо емпіричне значення статистики ¥емп належать області ¥ кр, то нульову гіпотезу відхиляють (відкидають), інакше - приймають. Статистичні критерії визначають у практичній діяльності метод розрахунку певного числа, яке позначається як емпіричне значення критерію, наприклад, ґем" для ґ-критерію Стьюдента.
Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростовування гіпотези. Наприклад, у разі застосування ґ-критерію Стьюдента, якщо ґем" > ґкр , то значення статистики належать критичній області і нульова гіпотеза Н0 відхиляється (приймається альтернативна гіпотеза Ні). Правила прийняття статистичного рішення обумовлюються для кожного критерію.
Параметричні і непараметричні критерії
Відповідно до статистичних гіпотез статистичні критерії діляться на параметричні й непараметричні.
Параметричні критерії використовуються в завданнях перевірки параметричних гіпотез і включають у свій розрахунок показники розподілу, наприклад, середні, дисперсії тощо. Це такі відомі класичні критерії, як г-критерій, ґ-критерій Стьюдента, ^-критерій Фішера та ін. Непараметричні критерії перевірки гіпотез засновані на операціях з іншими даними, зокрема, частотами, рангами тощо. Це А-критерій Колмогорова-Смірнова, [/-критерій Вілкок-сона-Манна-Вітні та багато інших.
Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних сукупностей, різниці середніх і відмінності в дисперсіях. Критерії спроможні виявити тенденції зміни ознаки при переході від умови до умови, оцінити взаємодію двох і більш факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, ніж не-параметричні, за умов, якщо ознака виміряна за інтервальною шкалою і нормально розподілена. Проте з інтервальною шкалою можуть виникнути певні проблеми, якщо дані, представлено не в стандартизованих оцінках. До того ж перевірка розподілу "на нормальність" вимагає досить складних розрахунків, результат яких заздалегідь невідомий. Найчастіше розподіли ознак відрізняються від нормального, тоді доводиться звертатися до непараметричних критеріїв.
Непараметричні критерії позбавлені перерахованих вище обмежень. Проте вони не дозволяють здійснити пряму оцінку рівня таких важливих параметрів, як середнє або дисперсія, з їхньою допомогою неможливо оцінити взаємодію двох і більше умов або факторів, що впливають на зміну ознаки. Непараметричні критерії дозволяють вирішити деякі важливі завдання, які супроводжують дослідження в психології і педагогіці: виявлення відмінностей у рівні досліджуваної ознаки, оцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах ознак.
Застосування критеріїв для прийняття (відхилення) статистичних гіпотез завжди здійснюються з довірчою ймовірністю, інакше кажучи, на певному рівні значущості.
Рівень статистичної значущості
Рівень статистичної значущості - це ймовірність того, що ми визнали відмінності істотними (прийняли альтернативну гіпотезу і відхилили нульову), а вони насправді випадкові. Наприклад, якщо вказується, що відмінності достовірні на 5%-му рівні значущості, то мається на увазі ймовірність 0,05 того, що вони все ж таки недостовірні. Рівень значущості - це ймовірність
23 Див. також розділ 4 "Інтервальне оцінювання"
відхилення нульової гіпотези, тоді як вона правильна.
Історично склалося так, що в психолого-педагогічних дослідженнях прийнято вважати нижчим рівнем статистичної значущості 5%-й рівень (а<0,05), достатнім - 1%-й рівень (а<0,01) і вищим - 0,1%-й рівень (а<0,001). Тому в таблицях критичних значень звичайно приводяться значення критеріїв, відповідних рівням статистичної значущості а<0,05 і а<0,01, інколи а<0,001. Пропонуємо дотримуватися правила відхилення гіпотези про відсутність відмінностей (Н0) і прийняття гіпотези про статистичну достовірність відмінностей (ні), доки рівень статистичної значущості не досягне а=0,05.
Помилки прийняття статистичних рішень
Статистичні рішення на основі р-значень
Типи і загальна схема перевірки статистичних гіпотез
5.2. ГІПОТЕЗИ ЩОДО НОРМАЛЬНОГО РОЗПОДІЛУ ОЗНАК
Критерії асиметрії та ексцесу
Критерій згоди х2
Критерій Шапіро-Вілка W
5.3. ПЕРЕВІРКА ОДНОРІДНОСТІ ВИБІРОК
Критерій Стьюдента t