Поняття статистичного оцінювання параметрів
Основною метою статистичного оцінювання є визначення дійсних параметрів генеральної сукупності на основі вивчення вибіркових показників. При цьому вибірка повинна достатньо добре відтворювати властивості генеральної сукупності, тобто бути представницькою або репрезентативною. Щоб досягти репрезентативності, використовують спеціальні методи формування вибірки. Найпоширенішими вважаютьсярандомізовані (прості і систематичні), стратифіковані та кластерні вибірки.
Проста рандомізована вибірка формується зі списку об'єктів генеральної сукупності за системою відбору, що гарантує рівну ймовірність попадання кожного об'єкта у вибірку. У цьому варіанті розрізняють три групи: всю генеральну сукупність; групу рандомізації, з якої проводиться відбір; експериментальну рандомізовану вибірку. На практиці способом випадкового відбору формують спочатку будь-яку групу потенційних випробовуваних. Після вимірювань властивостей їх розподіляють по групах рівноімовірнісним способом. В основу технологій рандомізації покладено процес генерації послідовності псевдовипадкових чисел.
Систематична рандомізована вибірка відповідає принципам рівноімові-рнісного відбору і вважається оптимальною тоді, коли генеральна сукупність складає великий список об'єктів. Наприклад, для вибірки обсягом 100 об'єктів з генеральної сукупності обсягом 100000 можна визначити перший випадковий об'єкт (індекс), а потім взяти ще 99 випадкових індексів, причому кожний наступний об'єкт повинен відстояти від першого взятого на к позицій.
Стратифікована вибірка гарантує репрезентативність вибраних осіб по відношенню до обраних у дослідженні властивостей. Наприклад, якщо у складі досліджуваної сукупності присутніми є 600 осіб жіночої і 400 - чоловічої статі, то репрезентативна вибірка обсягом у 100 студентів повинна зберегти пропорційне (60% і 40%) представництво осіб кожної статі. У разі простої (або систематичної) рандомізованої вибірки якісне і кількісне співвідношення осіб може бути неадекватним до генеральної сукупності. Використання стратифікованої вибірки обмежено тим, що досить часто склад генеральної сукупності щодо основних підгруп залишається невідомим.
Кластерна вибірка здатна вирішувати проблему неповноти складу підгруп формування. Кластерний метод передбачає поетапний вибір груп (кластерів), а не окремих елементів. Наприклад, на першому етапі отримання репрезентативної вибірки студентів може виконуватися формування списку базових навчальних дисциплін. Тоді групою може бути список студентів різних спеціальностей, що відвідують заняття з певного навчального предмета. Якщо список дисциплін достатньо великий (30-40 груп), можна випадковим методом відібрати 8-10 таких груп. Якщо групи нечисленні, можна досліджувати всіх студентів, якщо ні - можна сформувати більш дрібні рандомізовані вибірки. Ступінь і глибина розгалуження (кількість етапів групування) визначається метою та умовами дослідження. Кластерні вибірки менш надійні, ніж імовірнісні із-зі наявності декількох етапів відбору, кожний з яких додає свою похибку. У разі ж рандомізованої вибірки дослідник ризикує лише один раз. Тому математична теорія вибіркового методу здебільшого базується на аналізі власно імовірнісної вибірки.
Теоретичну основу оцінювання з використанням вибіркового методу складає закон великих чисел, згідно з яким при необмеженому збільшені обсягу вибірки випадкові характеристики вибірки наближаються (сходяться за ймовірністю) до певних параметрів генеральної сукупності (див. розділ 3.3).. Наприклад, для скінченної генеральної сукупності вибіркове середнє Х і дисперсія 8х2 наближаються до своїх генеральних показників (середнього ц і дисперсії а2 відповідно). У разі нескінченної генеральної сукупності n = <") замість середнього ц і дисперсії а2 мається на увазі математичне сподівання мх] і дисперсія вх розподілу досліджуваної випадкової величини x.
Отже, генеральна сукупність (обсяг n і вибірка (обсяг п) можуть характеризуватися тими ж самими змістовними показниками: для генеральної сукупності вони мають назву "параметри", для вибіркової сукупності - "статистики" (табл. 4.1). Статистики, що використовуються як наближене значення невідомого параметра генеральної сукупності називається статистичною оцінкою.
Таблиця 4.1
Основні показники генеральної і вибіркової сукупностей
Показники сукупностей | Генеральна сукупність | Вибірка |
параметри: | статистики: | |
Середнє арифметичне | ц | X |
Дисперсія | 2 а | 2 Sx |
Стандартне відхилення | а | 5х |
Коефіцієнт кореляції | Рху | |
Обсяг | N | п |
Таким чином, статистична оцінка 0- це вибіркова статистика, яка містить інформацію про відповідний параметр генеральної сукупності 0. Більш того, оцінювання параметра виконується на основі статистики, яка в свою чергу є випадковою величино, оскільки реалізується у випробуваннях як п незалежних результатів спостережень (наприклад, значень х1, х2, хп випадкової величини X). Отже, оцінка © як випадкова величина залежить і від закону розподілу досліджуваної випадкової величини x, і від обсягу вибірки п.
Узагальнюючи вищесказане, оцінкою можна називати будь-яку функцію результатів спостережень &(х1, х2, ooo хп) , за допомогою якої роблять висновки щодо значення параметру генеральної сукупності ©(X) .
Проте в дослідженнях можна отримати декілька різних функцій від результатів спостережень, які можна використовувати у якості оцінки параметру. Наприклад, для оцінки математичного сподівання випадкової величини (генерального середнього) можна запропонувати вибіркові показники: середнє, моду, медіану, які (див. розділі 2.2) можуть приймати різні значення. Назвати "найкращий" показник як оцінку на основі індивідуального значення неможливо. Принципово це можна зробити лише на основі вибіркового розподілу оцінки, а саме: якщо розподіл оцінки &" концентрується поблизу істинного значення параметру & , то з більшою ймовірністю можна прийняти, що оцінка незначно відрізнятиметься від параметру. Строго кажучи: математичне сподівання квадрату відхилення оцінки від параметра має бути якнайменшим:
M[0n -0]2 = min. (4.1)
Така основна умова стосовно "найкращої" оцінки.
Статистичне оцінювання підрозділяють на точкове та інтервальне.
Методи статистичного оцінювання параметрів
Метод моментів
Метод максимальної правдоподібності
Метод найменших квадратів
Інтервальне оцінювання
5. ПЕРВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ
Поняття статистичної гіпотези
Статистичні критерії