Теорія статистики - Мармоза А.Т. -
7.3. Загальна схема перевірки статистичної гіпотези

Підсумовуючи, можна навести загальну схему (алгоритм) перевірки статистичної гіпотези. Ця перевірка, як зазначалося вище, може бути проведена з використанням параметричних і непараметричних критеріїв. Наведемо схему перевірки гіпотези, що передбачає знання закону розподілу генеральної сукупності, тобто для випадку застосування параметричних критеріїв.

Перевірка цієї статистичної гіпотези передбачає послідовне виконання таких етапів.

1. Оцінка вихідної інформації та описування статистичної моделі вибіркової сукупності.

2. Формулювання нульової і альтернативної гіпотез.

3. Встановлення рівня значущості, за допомогою якого контролюється помилка І роду.

4. Вибір найпотужнішого критерію для перевірки нульової гіпотези. Застосування найпотужнішого критерію дозволить контролювати ймовірність появи помилки II роду.

5. Обчислення за певним алгоритмом фактичного значення критерію.

6. Визначення критичної області та області згоди з нульовою гіпотезою, тобто встановлення табличного значення критерію.

7. Зіставлення фактичного і табличного значень критерію і формулювання висновків за результатами перевірки нульової гіпотези.

На практиці найчастіше доводиться розв'язувати задачі двох типів по перевірці гіпотез. Задачі першого типу пов'язані з перевіркою гіпотез про істотність відмінностей між параметрами статистичних сукупностей. Прикладом таких задач може бути оцінка вірогідності відмінностей між середніми, дисперсіями, коефіцієнтами кореляції, регресії та ін.

Задачі другого типу пов'язані з перевіркою гіпотез про істотність відмінностей законів розподілу. До них відносять задачі по визначенню відповідності вибіркового розподілу теоретичному, частіше всього нормальному, оцінці близькості двох емпіричних розподілів, однорідності складу кількох сукупностей тощо.

Кожен з перелічених типів задач підрозділяють на різні види. Всі вони знаходять широке прикладне застосування в дослідженнях по галузях економіки.

Розглянемо деякі важливі передумови і особливості перевірки статистичних гіпотез задач першого типу, пов'язаних із застосуванням параметричних критеріїв і припущення нормального розподілу в генеральній сукупності.

Вибір конкретної схеми перевірки гіпотези залежить від характеру досліджуваної гіпотези, особливостей вихідної інформації та інших умов. Розглянемо основні з них.

1. Обсяг вибіркової сукупності.

При перевірці гіпотез за даними великих вибірок (п > 30) доцільно застосовувати Х-критерій нормального розподілу, а за даними малих вибірок (п < 30) - Х-критерій розподілу Стьюдента.

2. Рівність вибірок за чисельністю.

Вибіркові сукупності за чисельністю можуть бути рівними і нерівними. Ці властивості необхідно враховувати при практичній перевірці гіпотез про істотність відмінностей між середніми, зокрема, при розрахунку середньої помилки двох вибіркових середніх.

3. Схема формування вибірок.

Прийоми перевірки статистичних гіпотез залежать від характеру формування вибіркових сукупностей. Якщо спостереження однієї вибірки не протиставляються спостереженням другої вибірки, то такі вибірки називають незалежними. Якщо ж спостереження однієї вибірки в деякій мірі пов'язані з спостереженнями другої вибірки, то такі вибірки називаються залежними. Прикладом незалежних вибірок може бути дослід з двома групами тварин, одна з яких є контрольною, а на другій випробовують якийсь препарат. При цьому дослідна і контрольна група формуються випадково. Проте, якщо при проведенні цього досліду тварини будуть попередньо розподілені на групи за будь-якими ознаками (наприклад, за біологічними властивостями, продуктивністю тощо), а потім від кожної пари аналогів буде відібрано по одному представнику до контрольної і дослідної групи, то спостереження за такими вибірками вже не можна розглядати як незалежні.

Формування вибіркових сукупностей зумовлює різні прийоми оцінки вірогідності між середніми двох малих вибірок. Якщо вибірки незалежні, то статистичній оцінці підлягає різниця середніх, якщо залежні - середня різниця.

4. Рівність дисперсій.

При перевірці гіпотез щодо середніх можливі два випадки щодо вибіркових дисперсій:

2 _ 2

1) дисперсії рівні ( °1 ~°2 );

22

2) дисперсії нерівні ( а1 ).

В зв'язку з цим виникає спеціальне завдання перевірки гіпотези про істотність відмінностей двох дисперсій. Для перевірки гіпотези про рівність двох дисперсій в генеральних сукупностях використовується критерій Б-розподілу Фішера, який ґрунтується на співвідношенні двох вибіркових

скоригованих дисперсій: і 512, що замінюють значення дисперсій в генеральних сукупностях, які, як правило, невідомі:

Критичні значення Б-критерію Фішера Еа знаходять за спеціальними таблицями (дод. 4 і 5) при відповідному числі ступенів свободи і заданому рівні значущості а. Перевірка Н0 зводиться до такого. Спочатку визначають фактичне значення критерію Рф^. Потім за таблицями знаходять його критичне значення Ба. Якщо виявиться, що ЕфВКІ > Ба, то Н0 відхиляється, якщо ж Бфакг < Ба, то Н0 приймається.

Залежно від того, рівні чи нерівні дисперсії в генеральних сукупностях, потрібно видозмінювати схему перевірки гіпотези.

Розв'язування задач другого типу пов'язано з перевіркою гіпотез відносно законів розподілу генеральних сукупностей. У практичних дослідженнях часто виникає необхідність встановити характер розподілу генеральних сукупностей. При цьому можуть виникати задачі трьох видів:

1) про узгодженість емпіричного (вибіркового) і теоретичного (генерального) розподілу;

2) про незалежність розподілу однієї ознаки від другої;

3) про однорідність двох та більше емпіричних розподілів.

Такі гіпотези, як і гіпотези відносно параметрів розподілу, перевіряють за допомогою спеціальних критеріїв згоди.

Критерієм згоди називають критерій перевірки гіпотези щодо передбачуваного закону невідомого розподілу в генеральній сукупності.

Є ряд критеріїв згоди: К. Пірсона, О.М. Колмогорова, М.В. Смирнова, Б.С. Ястремського та ін. Ці критерії дозволяють встановити, узгоджуються чи не узгоджуються досліджувані розподіли з теоретичними розподілами, а також те, наскільки істотними є розбіжності між цими розподілами.

7.4. Перевірка статистичних гіпотез щодо середніх величин
7.5. Перевірка статистичних гіпотез щодо розподілів
7.6. Перевірка статистичної гіпотези про істотність розбіжностей між дисперсіями
Розділ 8. Дисперсійний аналіз
8.1. Теоретичні основи і принципова схема дисперсійного аналізу
8.2. Дисперсійний аналіз при групуванні даних за однією ознакою
8.3. Застосування дисперсійного аналізу для оцінки вірогідності різниці двох середніх
8.4. Дисперсійний аналіз при групуванні даних за двома ознаками
Розділ 9. Кореляційний аналіз
9.1. Поняття про кореляційний аналіз