Соціологія - Макеєв С.О. - Коефіцієнт кореляції та рівняння регресії

Якщо певному значенню однієї величини відповідає не одне, а ціла сукупність значень іншої величини, то вважають, що між цими двома величинами існує кореляційний зв'язок. Кореляційний зв'язок наявний тоді, коли явище, що вивчається, піддається впливові не одного, а багатьох різних факторів. Так, стаж впливає на продуктивність праці, але не визначає її повністю, оскільки продуктивність праці залежить також від рівня освіти, віку робітника, його кваліфікації та ін. Оскільки явища суспільного життя складні та багатофакторні, зв'язок між ознаками практично завжди кореляційний.

Якщо кожному значенню однієї ознаки відповідає така сукупність значень іншої ознаки, що досить близько розміщена навколо свого середнього (тобто всі значення сукупності не дуже відрізняються від свого середнього арифметичного), то такий кореляційний зв'язок вважають більш тісним. Кількісно тіснота кореляційного зв'язку оцінюється за допомогою коефіцієнтів кореляції.

Для оцінки лінійного кореляційного зв'язку між двома ознаками, що виміряні в метричних шкалах, часто використовують коефіцієнт кореляції Пірсона (його ще називають коефіцієнтом добутку моментів). Цей показник завжди набуває значення в числовому інтервалі від -1 до +1. Знак коефіцієнта показує "напрямок" зв'язку. Додатний коефіцієнт кореляції (r > 0) свідчить про "прямий" зв'язок між ознаками (тобто такий, коли збільшення значення однієї ознаки збільшує значення іншої ознаки), а від'ємний (г < 0) — про "зворотний" зв'язок (такий, коли зростання однієї ознаки веде до зменшення іншої ознаки). Так, між заробітною платою робітника та кількістю вироблених ним деталей існує прямий зв'язок (чим більше вироблено деталей, тим вищою буде заробітна плата), а між заробітною платою та кількістю бракованих деталей існує зворотний зв'язок (адже чим більше бракованих деталей було виявлено в продукції певного робітника, тим меншою буде його заробітна плата).

Щільність зв'язку оцінюється за абсолютним значенням коефіцієнта кореляції. Нуль (r = 0) свідчить про відсутність лінійного зв'язку між ознаками. Максимальні значення (r= 1 та r=*-1) коефіцієнта свідчать про повний (або функціональний) лінійний зв'язок між ознаками (відповідно функціональний прямий зв'язок та функціональний зворотний зв'язок). Проміжні значення (-1 <г<0та0<г<1) інтерпретуються так: чим більшим є абсолютне значення показника, тим тісніший кореляційний зв'язок. Як правило, якщо абсолютне значення коефіцієнта перевищує 0,3, то можна вести мову про помірний лінійний зв'язок між ознаками, а якщо перевищує 0,8 — про дуже тісний зв'язок між ознаками.

Коефіцієнт кореляції Пірсона оцінює зв'язок між двома ознаками, лише припускаючи, що значення однієї ознаки пов'язані з відповідними середніми іншої ознаки лінійною залежністю, тобто оцінює лише лінійний за формою кореляційний зв'язок. Отже, якщо дві ознаки пов'язані між собою тісно (навіть функціонально), але їх зв'язок за формою істотно відрізняється від лінійного, коефіцієнт кореляції Пірсона може набувати значення "нуль". Отже, якщо коефіцієнт кореляції Пірсона між двома істотно дорівнює нулю, то не можна говорити про відсутність кореляційного зв'язку між ними; це свідчить лише про відсутність лінійного кореляційного зв'язку.

Для ознак, заданих у порядкових шкалах, обчислюють рангові коефіцієнти кореляції (Спірмена та Кендела), які також набувають значення між -1 та +1 і інтерпретуються так само, як і коефіцієнт кореляції Пірсона.

Кореляція між двома ознаками свідчить про причинний зв'язок між ними, коли або одна з ознак є частковою причиною іншої, або обидві ознаки пов'язані спільними причинами. Кількісна оцінка кореляційних зв'язків може допомогти дослідникові відкинути несуттєві зв'язки, чіткіше окреслити напрям пошуків, порівняти вплив різних факторів тощо.

Методи регресивного аналізу дають змогу оцінити щільність зв'язку між двома ознаками й оформити уявлення про вид цього зв'язку у вигляді рівняння (так званого рівняння регресії), що описує залежність між середнім значенням однієї ознаки (залежної, поведінку якої вивчають) та значеннями деякої сукупності ознак (незалежних факторів, вплив яких на залежну ознаку намагаються оцінити). В соціологічних дослідженнях, як правило, здійснюється пошук такої залежності у лінійному вигляді (тобто у вигляді лінійного рівняння), тому йдеться про рівняння лінійної регресії.

Знання залежності у вигляді рівняння дає змогу не тільки пояснити поведінку залежної ознаки, а й прогнозувати значення її за різних змін значень незалежних ознак. Наприклад, нехай на основі аналізу факторів, які впливають на рівень заробітної плати на певному підприємстві, було побудовано рівняння лінійної регресії

що описує зв'язок між заробітною платою (залежна ознака) та двома такими незалежними ознаками, як стаж %. (вимірюється роками) та рівень освіти %2 (вимірюється роками) працівника. Аналізуючи це рівняння, ми бачимо, що зі зростанням трудового стажу працівника на рік його середня заробітна плата зростає на 16,82 грн, а із підвищенням рівня освіти на рік середня заробітна плата зростає лише на 11,56 грн. Отже, на цьому підприємстві трудовий стаж має більший вплив на середню заробітну плату працівника, ніж рівень його освіти.

Дуже важливою для отримання надійних та статистично обґрунтованих результатів є оцінка значущості статистичних показників. Це цілий комплекс математичних процедур, що дають змогу відповісти на низку запитань щодо обчислених статистичних показників та параметрів вибіркової сукупності. Так, якщо ми обчислили коефіцієнти кореляції між двома ознаками й отримали число, що не дорівнює нулю, нас має зацікавити, чи справді цей коефіцієнт істотно відрізняється від нуля (а отже, фіксує наявність лінійного кореляційного зв'язку), чи ця різниця випадкова і спричинена лише похибкою нашої вибірки. На таке запитання може відповісти процедура оцінки значущості відмінності коефіцієнта кореляції від нуля, яка враховує обсяг вибірки та потрібний досліднику рівень надійності (тобто ймовірність прийняття хибного рішення), про який уже йшлося при розгляді критерію ^-квадрат для двовимірних таблиць. Для кожного обчисленого коефіцієнта кореляції робиться оцінка на рівні надійності 1 % та 5 %.

Крім оцінки значущості відмінності від нуля коефіцієнта кореляції між двома ознаками, досить часто застосовують також процедуру оцінки значущості різниці між двома відсотковими значеннями (наприклад, опитуваних, різниці між відсотками не задоволених умовами праці на цьому підприємстві серед жінок та серед чоловіків), різниці між двома середніми (наприклад, між середньою заробітною платою на одному та на іншому підприємстві), між двома коефіцієнтами кореляції.

Методи багатовимірної статистики
Частина перша ОСНОВИ СОЦІОЛОГІЇ: загальна теорія
Передмова
І. ОСНОВНІ ПОНЯТТЯ СОЦІОЛОГІЇ
Тема 1. СОЦІОЛОГІЯ ЯК НАУКА. ПРЕДМЕТ, СТРУКТУРА ТА ФУНКЦІЇ СОЦІОЛОГІЇ
1. Соціологія як наука про суспільство
2. Місце соціології серед інших наук
3. Структура соціологічних знань
4. Функції соціології
Тема 2. СОЦІАЛІЗАЦІЯ ЛЮДИНИ. ОСОБИСТІСТЬ ТА СУСПІЛЬНЕ ЖИТТЯ
© Westudents.com.ua Всі права захищені.
Бібліотека українських підручників 2010 - 2020
Всі матеріалі представлені лише для ознайомлення і не несуть ніякої комерційної цінностію
Электронна пошта: site7smile@yandex.ru