Математична статистика - Руденко В.М. -
Нелінійна кореляція

Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y). Упорядковані за віком дані 15 осіб представлено у таблиці рис. 2.58.

Послідовність рішення:

o оцінити характер лінійності (нелінійності) зв'язку між значеннями ознак віку (X) і тесту (Y) за допомогою діаграми розсіяння (рис. 2.57);

Рис. 2.57. Діаграма розсіяння ознак

o переконатися, що кореляція нелінійна - спочатку результати тестування круто зростають для осіб віком від 10 до 22 років, досягають максимального значення, а потім повільно зменшуються. Якісна картина дає підстави для застосування кількісної міри нелінійності - кореляційного відношення, чисельне значення якого знаходиться у межах від 0 до 1:

лень у і від середнього у; загап = s у ■ (п -1) - загальна сума квадратів;

o розрахувати квадрати різниць s¡ окремо для кожної вікової групи (вікові групи виділено зафарбованими рядками, результати розрахунків і відповідних формул показано на рис. 2.58 і 2.59);

o внести у комірку вираз =(С3-СРЗНАЧ($С$3:$С$4))Л2. Аналогічний вираз внести у комірки (вікова група 10 містить лише два значення тесту);

o визначити Si для інших вікових груп, де х = 14, 18, 22, 26, 30, 34 і 38;

o у комірці Б18 розрахувати 88внутр (вираз =СУММ(03:017));

o у комірці Б19 розрахувати 88шгал (вираз =ДИСП(С3:С17)*(А17-1));

o у комірці Б20 отримати відношення п2ухс (внести вираз =1-018/019);

o у комірці Б21 розрахувати коефіцієнт кореляції Пірсона для всього масиву за допомогою функції MS Excel =ПИРСОН(В3:В17;С3:С17). Коефіцієнт кореляції дорівнюватиме приблизно нулю (rxy ~ -0,04), що свідчить про (нібито) відсутність будь-якого зв'язку між змінними;

o розрахувати коефіцієнти кореляції окремо для частин масиву: у комірці D22 для віку від 10 до 22, у комірці D23 для віку від 26 до 38 .

Отже, для віку від 10 до 22 років коефіцієнт кореляції має високе додатне значення (rxy=+0,83), що підтверджує прямий зв'язок, який можна спостерігати на діаграмі. Для віку від 26 до 38 років коефіцієнт кореляції має від'ємне значення (^=-0,69), що інтерпретується як зворотний зв'язок. Значення кореляційного відношення " 0,67 підтверджує високій рівень не лінійності зв'язку змінних X Y.

Слід звернути увагу на те, що для коефіцієнта rfyxc спочатку вказують індекс у, а потім - х, який є мірою прогнозування Y по X. Важливо зазначити, що для лінійного кореляційного зв'язку виконується співвідношення rxy = ryx, проте rfyxc і rfxyy матимуть різні значення. Якщо звернутися до діаграми розсіяння (рис. 2.57), то можна відзначити той факт, що для особи, наприклад, віком 10 років (Х=10), можна прогнозувати середню оцінку тесту у 8 балів (Y=(7+9)/2=8), у той час як для оцінки тесту, наприклад, у 8 балів вік особи може бути як близько 10, так і близько 38 років.

Розрахунки важливих для психолого-педагогічних досліджень коефіцієнтів кореляції приведено разом з оцінкою їхньої вірогідності у розділі 5.6.

Коефіцієнти взаємної зв'язаності

Коефіцієнти взаємної зв'язаності, наприклад, Чупрова K і Пірсона С застосовуються для оцінки зв'язку у ситуаціях, коли кожна якісна ознака складається більш ніж з двох груп. Коефіцієнт Чупрова К використовується у разі неоднакової кількості рядків і стовпчиків таблиці спряженості (k, Ф k2):

де к] і к2 - кількість груп першої і другої ознаки (параметри xі У). Коефіцієнт взаємної зв'язаності Пірсона с застосовується, коли кількість рядків і кількість стовпців у таблиці спряженості збігаються (к; = к2):

Значення коефіцієнтів Чупрова К і Пірсона с змінюються від 0 до 1. Приклад 2.9. Оцінити зв'язаність між приналежністю осіб до певної соціальної групи та їх психічними станами (табл. 2.5).

Таблиця 2.5

Розподіл груп за психічними станами

Послідовність рішення:

o Для ситуації з неоднаковою кількістю рядків і стовпчиків (к; Ф к2) використати коефіцієнт взаємної зв'язаності Чупрова К.

o Внести емпіричні дані у таблицю рис. 9.20 і виконати такі дії: - розписати докладніше вираз 2, виходячи з умов к, = 3 і к2 = 4:

Рис. 2.60. Результати розрахунку коефіцієнта Чупрова К

Рис. 2.61. Формули для розрахунку коефіцієнта Чупрова К

- визначити параметр ф2:

2 = 0,538+0,454+0,513-1 = 0,505. - отримати чисельне значення коефіцієнта взаємної зв'язаності Чупрова К

К -і = , ^ 0,45.

У(к1 - 1)(к2 -1) V л/(3 " 1)(4 -1)

Висновки. Значення коефіцієнта Чупрова К ~ 0,45 свідчить про помірну взаємну зв'язаність між параметрами У і x. Направлення зв'язаності коефіцієнт К не вказує. Це можна оцінити за формою спільного розподілу.

Запитання. Завдання.

1. Що таке кореляція? Охарактеризуйте особливості кореляційного зв'язку.

2. Які види зв'язків (три типи залежностей) між змінними X і У можна виділити?

3. Доведіть, що вибірковий коефіцієнт кореляції є випадковою величиною.

4. Який кореляційний зв'язок називають прямим, а який - зворотним?

5. Як якісно оцінити лінійність (нелінійність) кореляції?

6. В яких межах знаходиться чисельне значення коефіцієнтами кореляції?

7. Як кількісно оцінити лінійність (нелінійність) кореляції?

8. Запишіть формулу коефіцієнта лінійної кореляції Персона.

9. В яких межах знаходиться чисельне значення кореляційного відношення?

10. Охарактеризуйте особливості використання коефіцієнтів взаємної зв'язаності Чупрова К і Пірсона С.

11. В яких межах знаходиться значення коефіцієнтів взаємної зв'язаності Чупрова К і Пірсона С?

12. Повторіть математичні процедури завдань за прикладами 2.7 - 2.9.

13. Виконайте лабораторні роботи № 4 - № 6.

Коефіцієнти взаємної зв'язаності
2.4. РЕГРЕСІЯ
Одномірна лінійна регресія
Множинна регресія
3. ОСНОВИ ТЕОРІЇ ЙМОВІРНОСТЕЙ
3.1. ВИПРОБУВАННЯ ТА ПОДІЇ
Основні поняття і означення
Операції над подіями
Ймовірність подій
Умовна ймовірність