7.1. Поняття про статистичні гіпотези
В практичній і науковій діяльності часто для доведення справедливості того або іншого факту удаються до висловлювання гіпотез, які можуть бути перевірені на основі даних вибіркового спостереження.
Перевірка статистичних гіпотез має велике значення для практики. Зокрема, на ній ґрунтуються прийоми статистичного контролю якості продукції. Припустимо, що на підприємстві про якість продукції роблять висновки за результатами вибіркового контролю. Якщо вибіркова частка браку не перевищує заздалегідь встановленої (нормативної) величини, то партія продукції приймається. Однак висновок щодо відповідності якості продукції встановленим вимогам робиться на основі вибіркової перевірки і тому носить імовірнісний характер. Таким чином, судження про якість продукції не може розглядатися як категоричне. По суті, мова йде про припущення (гіпотезу), що частка, браку у всій генеральній сукупності дорівнює або менше нормативної величини. Ця гіпотеза і має бути перевірена на основі результатів вибіркового спостереження.
Теорія перевірки статистичних гіпотез також має велике значення в статистичній обробці експериментальних даних. Так, якщо на основі експериментальних даних ставиться питання про заміну одного сорту пшениці іншим, то необхідно перевірити припущення (гіпотезу) про те, що новий сорт пшениці має більш високу врожайність порівняно з старим сортом. Перевірку таких припущень на основі даних вибіркового спостереження називають статистичною перевіркою гіпотез. Перевірка гіпотез проводиться за допомогою методів математичної статистики.
Гіпотеза в широкому розумінні - це деяке наукове припущення щодо властивостей явищ, що їх вивчають, яке потребує перевірки та доведення.
Статистичною гіпотезою називається припущення відносно параметрів або форми розподілу генеральної сукупності, яке перевіряється на основі даних вибіркового спостереження. Позначається гіпотеза літерою Н від латинського слова hypothesis.
Із визначення статистичної гіпотези випливає, що вона може стосуватися або окремих параметрів розподілу, або законів розподілу.
Прикладом статистичних гіпотез можуть бути припущення про те, що жива маса телят в господарствах району підпорядкована закону нормального розподілу; середня урожайність картоплі одного сорту перевищує середню урожайність другого сорту; середні розміри деталей, що виготовляються на однотипних верстатах в ремонтній майстерні підприємства, однакові.
В ході перевірки статистичної гіпотези необхідно встановити, чи узгоджуються дані спостереження з висунутою гіпотезою, чи можна відмінності між гіпотезою і результатами спостереження віднести до випадкових або ж ці відмінності зумовлені впливом яких-небудь систематично діючих причин. В результаті перевірки гіпотези слід прийняти рішення про вибір одного з можливих двох взаємовиключаючих висновків, які називають альтернативними. Наприклад, при випробуванні добавок мікроелементів у кормовий раціон тварин такими висновками будуть: а) добавка мікроелементів сприяє росту продуктивності тварин; б) добавка мікроелементів не сприяє росту, продуктивності тварин. За підсумками перевірки гіпотеза або приймається, або відхиляється.
Найбільш часто перевіряється припущення про те, що отримана за вибіркою величина незначно відрізняється від гіпотетичної (теоретично припустимої) або встановленої величини в генеральній сукупності. Для перевірки цього положення висувається гіпотеза про те, що істинна різниця між фактичними і гіпотетичними показниками дорівнює нулю. В зв'язку з цим гіпотезу, що перевіряється, називають нульовою і позначають Н0. Нульову гіпотезу ще називають основною або робочою гіпотезою.
У кожному випадку нульовій гіпотезі протиставляється альтернативна (конкуруюча) гіпотеза (На), яка заперечує нульову гіпотезу. Наприклад, якщо нульова гіпотеза полягає в припущенні, що середня урожайність зернових культур в генеральній сукупності дорівнює 35 ц/га, то альтернативна гіпотеза, зокрема, може полягати в тому, що середня урожайність в генеральній сукупності не дорівнює 35 ц/га. Зміст гіпотези записується після двокрапки, а сам запис має вигляд:
Щодо до нульової гіпотези може бути вказана нескінчена множина альтернативних гіпотез. Зміст Н0 і На залежить від характеру вибіркової сукупності і конкретних завдань, які вирішуються за допомогою перевірки статистичних гіпотез. Формально будь-яка з двох протилежних гіпотез може виступати як нульова. Однак практичні наслідки будуть різними в зв'язку з різним характером можливих помилок, отриманих в результаті неправильного прийняття або заперечення нульової гіпотези. Тому вибір нульової гіпотези має принциповий характер і потребує спеціального обґрунтування. Про це докладно йтиметься при розгляді можливих помилок при перевірці гіпотез.
Гіпотези про параметри генеральної сукупності називають параметричними, про розподіли - непараметричними. За формою побудови гіпотези можуть бути простими і складними. Простою називають гіпотезу, яка містить тільки одне припущення, складною - гіпотезу, яка містить два і більше припущення. Наприклад, гіпотеза Н0 : ст = 3 є простою гіпотезою, а гіпотези Но : ст > 3 і Но : ст < 3, які включають деяку область імовірних значень досліджуваного параметра, є складними. Очевидно, що складні гіпотези включають множину простих гіпотез.
7.3. Загальна схема перевірки статистичної гіпотези
7.4. Перевірка статистичних гіпотез щодо середніх величин
7.5. Перевірка статистичних гіпотез щодо розподілів
7.6. Перевірка статистичної гіпотези про істотність розбіжностей між дисперсіями
Розділ 8. Дисперсійний аналіз
8.1. Теоретичні основи і принципова схема дисперсійного аналізу
8.2. Дисперсійний аналіз при групуванні даних за однією ознакою
8.3. Застосування дисперсійного аналізу для оцінки вірогідності різниці двох середніх
8.4. Дисперсійний аналіз при групуванні даних за двома ознаками