Його можна визначити, поділивши досліджуваних на приблизно однакові групи. Потім одній з них пропонують форму А тесту, іншій - форму Б. Через певний час (не більше ніж тиждень) організовують повторне тестування, замінюючи форму А на форму Б, і навпаки. Така процедура обстеження має переваги, оскільки за ретестування використовують інший за змістом матеріал, можливість тренування і запам'ятовування окремих рішень зменшується, тимчасовий інтервал перед повторним обстеженням скорочується. Основним показником надійності є коефіцієнт кореляції між результатами первинного і вторинного обстежень, що оцінює і тимчасову стабільність тесту (власне надійність), і ступінь відповідності результатів обох форм тесту.
Обидва набори завдань повинні відповідати однаковим вимогам, бути відносно незалежними. На практиці це не завжди можливо, особливо для особистісних методик, опитувальників, що обмежує сферу застосування методу рівнобіжного застосування. Ще одним недоліком є можливість засвоєння досліджуваними основного принципу розв'язання. Вплив тренувань і навичок знижується, однак не усувається.
Коефіцієнт надійності обчислюють за формулами розрахунків коефіцієнтів кореляції (залежності від шкали вимірювання даних) між першим і наступним вимірами чи між рівнобіжними формами тесту.
Розрахунок коефіцієнта надійності при дослідженні гомогенності тесту здійснюють шляхом поділу тесту на рівні субтести і розрахунку кореляції між цими частинами. Для визначення загальної надійності тесту отримані
коефіцієнти кореляції вводять у формулу Спірмена - Брауна:
Якщо частини тесту є окремими дихотомічними завданнями, наприклад питаннями, на які може бути дві відповіді ("так" чи "ні"), чи завданнями з оцінкою результату (правильного і неправильного), використовують формулу:
Надійність частин тесту також розраховують за формулою Кудера - Річардсона:
Надійність окремих пунктів
Для підвищення ретестової надійності тесту, апробованого у пілотажних психометричних експериментах, з нього вибирають пункти, на які досліджувані дають стійкі відповіді. Для дихотомічних пунктів ("розв'язав - не розв'язав", "так - ні") стійкість зручно вимірювати з використанням чотирьохклітинкової матриці спряженості:
У клітинці А підсумовують частоту відповідей "правильно" на завдання першого і другого тестування, у клітинці В - кількість випадків, коли досліджуваний при першому тестуванні відповідав "правильно", а при другому - "неправильно". Як міру кореляції вираховують <р-коефіцієнт:
Зручністю використання коефіцієнта є те, що він одночасно оцінює ступінь оптимальності пункту за силою (труднощі): ф-коефіцієнт виявляється меншим, якщо більша різниця між частотою відповідей "так" і частотою відповідей "ні". Чотирьохклітинкова таблиця дає змогу простежити можливу несиметричність у стійкості відповідей "так" і "ні". Виявлені у результаті такого аналізу слабкі і неінформативні пункти слід вилучити з тесту. Пункти варто вважати недостатньо стійкими, якщо на репрезентативній вибірці
Для того щоб підвищити одномоментну (синхронну) надійність тесту, вилучають ті пункти, що недостатньо погоджені з іншими. За відсутності комп'ютерного оброблення погодженість між пунктами визначається з допомогою чотирьохклітинкової кореляції. Тоді у першому стовпчику таблички додаються відповіді досліджуваних із "високої" групи (за величиною сумарного бала), у другому - з "низької".
Отже, надійність тесту характеризує ступінь точності вимірювання, який не розкриває ознаку вимірювання. Така надійність є передумовою наявності іншої важливої якості - валідності.
Змістова валідність
Критеріальна валідність
Конструктна валідність
Послідовність перевірки валідності
Стандартизація і норми тестових показників
2.3. Застосування математично-статистичних методів аналізу у психологічних вимірюваннях
Типи емпіричних даних "L"-,"Q"-, "Т" - дані
Оцінювання розподілу емпіричних даних
Застосування непараметричної і параметричної статистик при обробленні емпіричних даних