Коефіцієнти кореляції як міри зв'язку між випадковими величинами є також величинами випадковими, носять імовірнісний характер. Статистичні висновки про кореляційний зв'язок між величинами роблять не з генерального коефіцієнта кореляції р (значення цього параметра є звичайно невідомим), а за його вибірковим аналогом г. Оскільки коефіцієнти кореляції г розраховується за значеннями змінних, які випадково потрапили у вибірку з генеральної сукупності, то й статистика г є величиною випадковою, яка потребує статистичної оцінки.. Як правило, перевіряють нульову гіпотезу про відсутність кореляційного зв'язку між змінними у генеральній сукупності, тобто Н0: р = 0. Достовірність (вірогідність) коефіцієнтів кореляції залежить від прийнятого рівня значущості а і обсягу вибірки п.
Коефіцієнт лінійної кореляції Персона rху
Коефіцієнт кореляції гху як вибіркова статистика є мірою оцінкою свого генерального параметра рху. Статистика лінійного коефіцієнта кореляції має розподіл Стьюдента:
г
г 7(1 - гі)/(п - 2) o (530)
Нульову гіпотезу Н0 відхиляють на рівні значущості а, якщо критичне значення ґ-критерію не перевищує емпіричного значення ґг.
Приклад 5.21. Оцінити значущість кореляційного зв'язку між успішністю виконання тестових завдань з фізики (X) і математики (У) учнями загальноосвітньої школи (табл. 5.46).
Послідовність рішення:
o за емпіричними даними В2:С13 (рис. 5.46) оцінити характер лінійності зв'язку між ознаками x і У за допомогою діаграми розсіяння (рис. 5.47);
o переконатися, що кореляція лінійна. З діаграми видно, що зв'язок прямий і лінійний (рис. 5.47).Це дає підстави для застосування критерію tr для оцінювання значущості коефіцієнта кореляції Пірсона rxy;
o у комірці В14 розрахувати коефіцієнт кореляції Пірсона за допомогою функції MS Excel =nnPCOH(B2:B13;C2:C13). Значення = +0,77 свідчить про сильний прямий зв'язок між ознакамиx і Y;
o у комірці В15 розрахувати емпіричний критерій tr за допомогою виразу =В14*КОРЕНЬ((СЧЕТ(Л2:Л13)-2)/(1-В14Л2)) і отримати значення tr~ 3,87;
o отримати однобічне критичне значення t-критерію Стьюдента за допомогою функції =СТЬЮДРАСПОБР(), яка повертає t0ioi ~ 2,76. Для цього у комірку В17 внести вираз =СТЬЮДРАСПОБР(2*В16;СЧЕТ(Л2:Л13)-2).
o Прийняття рішення: Оскільки tr >t001 (3,87>2,76), нульова гіпотеза відхиляється.
o Висновки: значення ~ +0,77, яке свідчить про суттєвий прямий лінійний зв'язок між результатами виконання учнями тестових завдань з фізики і математики, можна вважати істотними на рівні значущості а=0,01.
Коефіцієнт рангової кореляції Спірмена rs
Коефіцієнт рангової кореляції Спірмена г8 використовується для визначення тісноти зв'язків між кількісними і якісними ознаками, якщо їх значення проранжовані. Коефіцієнт кореляції рангів г8 розраховується за формулою:
де: п - обсяг сукупності об'єктів; (х,-у) - різниця рангів /-го об'єкта. Коефіцієнт г8 приймає значення в інтервалі від -1 до +1.
Приклад 5.22. Оцінити наявність і значущість зв'язку між оцінками експертів толерантності студентів до викладача (змінна X) і толерантності до інших студентів (змінна У). Дані представлено в таблиці рис. 5.48.
Послідовність рішення:
o Для обчислення коефіцієнта кореляції г8 внести відповідні вирази:
- у комірку вираз =В4-С4, аналогічні вирази -у комірки Б5: Б15;
- у комірку Е4 вираз =Б4Л2, аналогічні вирази внести у комірки Е5: Е15;
- у комірку Е16 вираз =СУММ(Е4:Е15);
- у комірку В17 вираз = 1-6*Е16/Л15/(Л15л2-1), отримати значення 0,77:
r = 1--2-" 0,77 .
s 12 o (122 -1)
o Оцінка значущості коефіцієнта рангової кореляції rs. Вибірковий розподіл rs, що характеризує нульову кореляцію між двома групами рангів, пов'язаний з t-розподілом Стьюдента. Якщо значення rs дорівнює 0 і n >10, емпіричний критерій для ступенів вільності (n-2) визначається за формулою:
r
t = s .
ЄМП І Z
V(1" rs2)/(n - 2)
У комірку В18 внести вираз: =В17/КОРЕНЬ((1-Б17л2)/(Л15-2)), отримати значення teMn ~ 3,81. Для малих сукупностей (n<10) перевірка нуль-гіпотези вимагає точного визначення вибіркового розподілу rs.
o Критичне значення t-критерію отримати для а =0,01 і n=15. У комірку В19 внести функцію =СТЬЮДРАСПОБР(0,01/2;Л15-2), яка дасть tKp~ 3,58.
Висновки: оскільки teM" > tKp (3,81 >3,58), нуль-гіпотеза про відсутність кореляції відхиляється на рівні 0,01. Чисельне значення г^=0,77 свідчить про суттєвий прямий зв'язок.
Точково-бісеріальний коефіцієнт кореляції rpb
6. ДИСПЕРСІЙНИЙ АНАЛІЗ
Дисперсійний однофакторний аналіз
Дисперсійний двофакторний аналіз
ЛІТЕРАТУРА
Вступ
МОДУЛЬ 1
ТЕМА 1. МЕТОДОЛОГІЧНІ ЗАСАДИ СТАТИСТИКИ
§ 1.1. Загальне поняття статистики, її галузі