Дослідники можуть вивчати не всіх людей (генеральну сукупність, популяцію), а тільки певну вибірку. Якщо досліджують відносно невелику групу людей, наприклад тих, хто страждає на певне захворювання, то малоймовірно, що дослідник має належні ресурси або необхідність тестувати кожну хвору людину. У таких ситуаціях тестують вибірку з популяції, оскільки це зручніше і займає менше часу. У такому разі необхідно переконатися, що результати, отримані у вибірці, представляють всю групу, тобто дослідження правильно описує всю популяцію, вибірку з якої використовують. Для цього визначають статистичну значущість результатів тестування.
Статистична значущість (р-рівень значущості) - вірогідність того, що отриманий результат правильно представляє популяцію, вибірка з якої досліджувалася.
Неможливо стверджувати, що дослідження правильно описує всю популяцію, за рівнем значущості можна лише з'ясувати, що це ймовірно. Тому необхідно визначити, яким має бути рівень значущості, щоб отриманий результат можна було вважати правильною характеристикою популяції. Традиційно вважають, що 95 або більше шансів зі 100 означають, що вірогідність правильності результатів достатньо висока для того, щоб їх поширювати на всю популяцію. Цю цифру було встановлено емпірично в процесі науково-практичної діяльності, для її обґрунтування теоретичних підстав немає. Психологи цією вірогідністю оперують дещо незвично. Замість вірогідності того, що вибірка представляє популяцію, вказують, вірогідність того, що вибірка не представляє популяцію, тобто, що знайдений зв'язок або відмінності мають випадковий характер і не є властивістю сукупності. Отже, замість того щоб стверджувати, що результати дослідження правильні з вірогідністю 95 зі 100, психологи зазначають, що є 5 шансів зі 100, що результати неправильні. Значення вірогідності іноді виражають у відсотках, але частіше його записують у вигляді десяткового дробу. Наприклад, 10 шансів зі 100 представляють у вигляді десяткового дробу 0,1; 5 зі 100 записують як 0,05; 1 зі 100 - 0,01. За такої форми запису граничним значенням є 0,05. Щоб результат вважався правильним, його рівень значущості повинен бути нижчим за це число (вірогідність того, що результат неправильно описує популяцію). Вірогідність неправильності результату (яку правильніше назвати рівнем значущості) зазвичай позначають латинською буквою "р". В опис результатів експерименту зазвичай включають висновок, наприклад: "результати виявилися значущими на рівні достовірності (р<0,05)". Це означає, що вірогідність неправильності результатів (р) менше 0,05 (тобто менше 5%).
Отже, рівень значущості (р) вказує на вірогідність того, що результати не представляють популяцію. На думку психологів, результати достовірно відображають загальну картину, якщо значення р менше 0,05 (тобто 5%). Проте цей висновок може виявитися неправильним. За значущості 0,05 в 5 зі 100 випадків результати, ймовірно, неправильні. Однак 5 шансів зі 100 - це те саме, що 1 з 20, тобто в одному з кожних 20 випадків результат виявиться неправильним. Такі шанси не надто сприятливі, і дослідники повинні остерігатися помилки першого виду - помилки, яка виникає, коли дослідники вважають, що знайшли реальні результати за їх відсутності. Протилежні помилки, які полягають у тому, що дослідники вважають, ніби вони не знайшли результату, а реально він наявний, називають помилками другого виду. Ці помилки виникають тому, що не можна виключити можливість неправильного статистичного аналізу. Оскільки вірогідність помилки залежить від рівня статистичної значущості результатів, то чим менше значення р, тим більша впевненість у правильності результатів.
У табл. 2.18 наведено традиційну інтерпретацію рівнів значущості, які використовують у психології.
Практичні дослідження свідчать, що для уникнення помилок першого і другого видів слід приймати рішення про наявність відмінностей (зв'язки), орієнтуючись на рівень р < 0,01 або на обчислений статистичний критерій для меншої кількості значень (п) ознаки.
Статистичний критерій є інструментом визначення рівня статистичної значущості, що забезпечує прийняття істинної гіпотези і відхилення помилкової з високою вірогідністю.
Таблиця 2.18. Традиційна інтерпретація рівнів значущості, які використовують у психології
Статистичні критерії позначають також метод розрахунку певного числа і саме це число. У психології використовують такі типи статистичних критеріїв: інструменти для аналізу відмінностей між результатами груп; інструменти для виявлення зв'язку між результатами груп; інструменти для аналізу часткових відмінностей, які мають різні групи.
Вибір конкретного критерію часто залежить від того, чи дані, які необхідно піддати статистичному аналізу, отримані на популяції з нормальним розподілом. Параметричні критерії можна використовувати тільки для нормально розподілених даних (якщо ознака виміряна за ін-тервальною шкалою). За допомогою непараметричних критеріїв можна аналізувати дані з будь-яким законом розподілу.
Параметричні критерії включають у формулу розрахунку параметрів розподілу, тобто середніх і дисперсії (t-критерій Стьюдента, f-критерій Фішера та ін).
Непараметричні критерії не включені у формулу розрахунку параметрів розподілу і засновані на операції з частотами або рангами (критерій Q Розенбаума, критерій U Манна - Вітні та ін.).
За співвідношенням емпіричного (обчисленого) і критичного значень табличного критерію можна зробити висновок, наскільки підтверджується чи спростовується гіпотеза. Як правило, необхідно, щоб емпіричне значення критерію перевищувало критичне, хоча є критерії (наприклад, критерій Манна - Вітні або критерій знаків), у яких дотримуються протилежного правила.
Зазвичай перевагу надають параметричним критеріям як надійнішим та інформативнішим, придатним для глибокого аналізу.
Застосування у психодіагностиці математично-статистичного аналізу забезпечує психолога інформацією про достовірність і статистичну значущість отриманих тестових даних, без яких неможливо робити висновки про зв'язки між досліджуваними явищами, в т. ч. причинно-наслідкові.
Математична статистика дає змогу розглядати психологію загалом і психодіагностику зокрема у контексті точних дисциплін. Без її застосування всі висновки можуть сприйматися не як умоглядні, а з певною долею суб'єктивності. Водночас у процесі накопичення практичного досвіду, бази даних емпіричних досліджень постає завдання їх узагальнення, виявлення тенденцій, динаміки, особливостей, які неможливо обґрунтовано інтерпретувати, не застосовуючи методів математично-статистичного аналізу.
Запитання. Завдання
1. Охарактеризуйте основні принципи постановки психологічного діагнозу.
2. Розкрийте сутність поняття "психодіагностичний процес".
3. Дайте характеристику сутності загальної та диференційноТ психометрії.
4. Проаналізуйте типи шкал і особливості їх застосування у психодіагностиці.
5. Опишіть основні етапи конструювання тесту.
6. Поясніть необхідність та особливості адаптації діагностичних методів.
7. У чому полягає сутність репрезентативності норми вибірки?
8. Вкажіть умови, що забезпечують репрезентативність вибірки даних.
9. Охарактеризуйте види надійності та процедуру її визначення. 10. Проаналізуйте види валідності та порядок роботи психолога при перевірці валідності.
11. Розкрийте особливості застосування математично-статистичних методів у психологічних вимірюваннях.
12. Доведіть необхідність застосування непараметричної і параметричної статистик при обробленні емпіричних даних.
13. Поясність особливості застосування кореляційного аналізу у психологічних дослідженнях.
14. З'ясуйте сутність меж довірчого інтервалу у психологічних вимірюваннях.
15. Охарактеризуйте поняття статистичної значущості і статистичного критерію у психологічних вимірюваннях.
3.1. Сутність інтелекту, підходи до його вивчення і моделі структури
Основні підходи до вивчення інтелекту
Соціокультурний підхід
Генетичний підхід
Процесуально - діяльнісний підхід
Освітній підхід
Інформаційний підхід
Феноменологічний підхід
Функціонально-рівневий підхід