При застосуванні тесту як єдиного еталона виміру властивості зважають на місце розташування бала на кривій розподілу. У такий спосіб формується процентильна шкала, яка має універсальну міру тестів - процентильну міру.
Процентиль (лат. pro centum - на сто) - відсоток досліджуваних, які належать до вибірки стандартизації, що отримали однакові бали або нижчі бали, ніж бали, встановлені за первинною оцінкою.
Він вказує на відносне розміщення досліджуваного у вибірці стандартизації: чим нижчий процентиль, тим слабша позиція особи в сенсі досліджуваної ознаки.
Процентильні шкали є основою усіх традиційних шкал, які застосовують у тестології (Т-бали ММРІ, бали IQ, стени 16 PF та ін.). Вони належать до порядкових шкал, оскільки інформують про те, у кого з досліджуваних більше виражена вимірювана властивість, не вказуючи, на скільки або у скільки разів більше. Для побудови на базі таких шкал кількісного прогнозу потрібно підвищити рівень виміру. До шкал інтервалів переходять шляхом емпіричного розподілу або спираючись на довільну модель теоретичного розподілу. Здебільшого теоретичною моделлю є модель нормального розподілу, однак можуть використовувати і будь-яку іншу.
У диференціальній психометриці використовують абсолютні тестові норми, шкалою для діагностування яких є шкала "сирих" оцінок та критеріальні тестові норми. Застосовують їх тоді, коли тестова "сира" шкала має практичний сенс (наприклад, студент, що вивчає іноземну мову, повинен мати значний лексичний запас); "сирий" бал з тесту внаслідок емпіричних досліджень пов'язують із заданою імовірністю успішності певної практичної діяльності (імовірністю успіху "критерільної" діяльності може стати синхронний переклад монологу впродовж ЗО хв.).
Відсоткова рангова шкала
Її застосовують для наочної демонстрації відносної позиції досліджуваного. Таку шкалу поділяє на дві частини медіана - 50 процентиль. Процентилі вище 50 вказують на результати, вищі від середніх, і навпаки. Квадрилями називають 25 і 75 процентилі, які відсікають верхню і нижню межі розподілу результатів. Відсоткова рангова шкала не дає змоги обчислити середню арифметичну величину чи величину розсіювання, однак визначає позицію досліджуваного всередині певної групи щодо конкретної ознаки.
Статистичні шкали
У диференційній психометриці найчастіше використовують номінальну, порядкову (рангову), інтервалів, відношень (пропорцій) шкали, тобто статистичні
Номінальна шкала
Шкала найменувань (номінальна шкала) утворюється шляхом привласнення "імен" об'єктам. При цьому об'єкти поділяють на непересічні підмножини. Об'єкти порівнюють один з одним і визначають їх еквівалентність-нееквівалентність. Внаслідок цієї процедури утворюється сукупність класів еквівалентності. Об'єкти, що належать до одного класу, еквівалентні один одному і відрізняються від об'єктів, що належать до інших класів. Еквівалентним об'єктам привласнюють однакові "імена".
Для побудови будь-якої шкали потрібно, щоб об'єкт дорівнював або був подібний сам до себе (х = х для всіх значень х), тобто на безлічі об'єктів повинно бути реалізовано відношення рефлексії. Для психологічних об'єктів, наприклад досліджуваних осіб або психічних образів, це відношення реалізується, якщо абстрагуватися від часу. Оскільки операції попарного порівняння безлічі об'єктів емпірично реалізуються неодночасно, то у процесі емпіричного вимірювання навіть цю найпростішу умову не виконують.
Отже, будь-яка шкала є ідеалізацією, моделлю реальності, навіть така найпростіша як шкала найменувань.
На об'єктах повинно бути реалізовано відношення симетрії R (X = В) R (В - X) і транзитивності R (X - В, В = X) -> R (X = Z) але протягом психологічних експериментів ці умови можуть порушуватися. Багатократне повторення експерименту (накопичення статистики) призводить до "змішування" складу класів: у кращому разі можна отримати оцінку, що вказує на вірогідність належності об'єкта до класу.
У шкалі найменувань емпіричні об'єкти просто "позначають" числом, наприклад номери на майках футболістів: цифру "1" за традицією отримує воротар. Це означає, що за функцією він відрізняється від решти гравців. Його функція на футбольному полі еквівалентна функції інших воротарів.
Психологи дуже часто застосовують шкалу найменувань. Прикладом типології є класифікація класичних темпераментів: холерик, сангвінік, меланхолік і флегматик.
Номінальна шкала є "найнижчим" рівнем вимірювання, що припускає наявність мінімальних передумов для проведення виміру. При вимірах на рівні номінальної шкали відносно рідко використовують числа. Важливо тільки встановити подібність або відмінність об'єктів за певною ознакою, тобто якісну однорідність ознаки. Наприклад, учнів піддають систематизації або класифікації на підставі їхньої належності до того чи іншого класу, за статевою ознакою, віросповіданням, місцем проживання, щоб створити передумови для відповідного підрахунку. Несуттєво, як проводиться класифікація (за дихотомічними категоріями, наприклад: переведений - не переведений з класу в клас; чи декількома, наприклад: учень гімназії, ЗОШ чи спецшколи, неодружений, одружений, вдівець, розведений тощо). Однак завжди повинна бути присутня можливість однозначного зв'язку, тобто досліджуваний є або учнем гімназії, або учнем ЗОШ. Якщо можливо одночасно і те, й інше, то класифікацію змінюють.
За допомогою підрахунку можна визначити частотність заміщення тієї чи іншої категорії. Величиною основної тенденції на номінальній шкалі є модальна величина (мода), тобто величина, що найчастіше трапляється.
Якщо в якомусь класі 14 дітей є єдиними дітьми в сім'ї, 11 дітей мають брата або сестру, 5 дітей - двох, З дитини - трьох і 1 дитина - чотирьох братів і сестер, то 14 (єдина дитина в родині) є тут модальною величиною.
Порядкова рангова шкала
Вона утворюється, якщо на множині реалізовано одне бінарне відношення - порядок (відношення "не більше" і "менше"). Побудова шкали порядку є складнішою процедурою, ніж створення шкали найменувань. На шкалі порядку об'єкт може знаходитися між двома іншими, причому якщо а > b, b > с, то а>с(правило транзитивності відносин).
Класи еквівалентності, виділені за допомогою шкали найменувань, можуть бути впорядковані за певною підставою. За змістом така шкала може бути строгого порядку (строга впорядкованість) і шкалою слабкого порядку (слабка впорядкованість). У першому випадку на елементах множини реалізуються відношення "не більше" і "менше", у другому - "не більше або дорівнює" і "менше або дорівнює".
Порядкова шкала зберігає свої властивості при ізотонічних (однозначні, однакові за напруженням) перетвореннях. Всі функції, які не мають максимуму (монотонні), відповідають цій групі перетворень. Значення величин можна замінювати квадратами, логарифмами, нормалізувати тощо. При таких перетвореннях значень величин, визначених за шкалою порядку, місце об'єктів на шкалі не змінюється, тобто не відбувається інверсій.
Ці шкали використовують у психології пізнавальних процесів, експериментальній психосемантиці, соціальній психології. Класичним прикладом використання порядкових шкал є тестування особистісних рис чи здібностей. Більшість фахівців із тестування інтелекту вважає, що процедура вимірювання цієї властивості дає змогу використовувати інтервальну шкалу і навіть шкалу відносин.
Порядкова шкала допомагає запровадити лінійну впорядкованість об'єктів на деякій осі ознаки. Тим самим запроваджують поняття "властивість, що вимірюється", або "лінійна властивість", тоді як шкала найменувань послуговується "виродженим" варіантом інтерпретації поняття "властивість": "точковою" властивістю ("властивість є" - "властивості немає").
Перехідним варіантом шкали порядку є дихотомічна класифікація, яку здійснюють за принципом "є властивість" - "немає властивості" (1; 0) при 1 > 0. Дихотомічне розбиття множини дає змогу застосовувати не тільки порядок, а й метрику. Для інтерпретації даних, отриманих за допомогою порядкової шкали, можна використовувати більш широкий спектр статистичних заходів (на додаток до тих, які допустимі для шкали найменувань).
Порядкова (рангова) шкала вказує лише на послідовність носіїв ознаки і напрям ступеня вираженості ознаки, на її підставі не слід виводити середню арифметичну величину.
Як характеристику центральної тенденції можна використовувати медіану, а як характеристику розкиду - процентилі. Для встановлення зв'язку між двома вимірюваннями допустима порядкова кореляція (т-Кенделла і р-Спірмена). Числові значення порядкової шкали не можна додавати, віднімати, ділити і множити.
Шкала інтервалів
Вона визначає величину відмінностей між об'єктами у вияві властивості і дає змогу порівнювати два об'єкти, з'ясовуючи, наскільки більше чи менше виражена у них певна властивість. Цю шкалу часто використовують дослідники, наприклад у фізиці - вимірювання температури за Цельсієм. Вона має масштабну одиницю, але розміщення на ній нуля довільне, тому неможливо з'ясувати, у скільки разів більша або менша ранкова температура повітря, ніж денна.
Масштаб шкали можна змінювати, множачи кожне з її значень на константу, і проводити її зсув щодо довільно вибраної точки на будь-яку відстань праворуч або ліворуч (додавати або віднімати константу).
Крім медіани і моди, для характеристики центральної тенденції послуговуються середнім арифметичним, а для оцінки розкиду - дисперсією. Можна обчислювати коефіцієнти асиметрії і ексцесу та інші параметри розподілу. Для оцінювання величини статистичного зв'язку між змінними застосовують коефіцієнт лінійної кореляції Пірсона тощо.
Більшість фахівців з теорії психологічних вимірювань вважає, що тести вимірюють психічні властивості за допомогою шкали інтервалів. Насамперед це стосується тестів інтелекту і досягнень. Числові значення одного тесту можна переводити в числові значення іншого за допомогою лінійного перетворення: х'= ах + b.
Деякі дослідники стверджують, що зараховувати тести інтелекту до шкал інтервалів немає підстав, оскільки кожний тест має "нуль", тобто будь-який індивід може отримати мінімальний бал, якщо не розв'яже жодного завдання у відведений час. Тест також має максимум шкали - бал, який досліджуваний може отримати, розв'язавши всі задачі за мінімальний час, а різниця між окремими значеннями шкали неоднакова. Немає ніяких теоретичних і емпіричних підстав стверджувати, що 100 і 120 балів за шкалою IQ відрізняються на стільки ж, на скільки 80 і 100 балів. Проте ці міркування не заважають тестологам розглядати шкалу IQ як інтервальну, перетворюючи "сирі" значення на шкальні за допомогою відомої процедури "нормалізації" шкали.
Точку відліку в ретельно сконструйованих і стандартизованих тестах інтелекту встановлюють так само довільно, як і на шкалі Цельсія. Навіть якщо при виконанні тесту інтелекту не буде розв'язане жодне завдання, не можна стверджувати, що розумовий розвиток досліджуваного дорівнює нулю або те, що особа з коефіцієнтом інтелекту IQ 140 у два рази розумніша, ніж особа з коефіцієнтом 70. Відомо лише, що різниця між показниками величини І<3 140 і 70 настільки велика, як і між 19130 і ІQ 60, а саме 70 одиниць
Хоча шкала інтервалів не дає змоги зробити висновок про пропорції між різними значеннями шкали, вона називається метричною шкалою і з її допомогою можна виконувати звичайні алгебраїчні операції типу додавання величин і обчислення середньої арифметичної величини. Тому шкала інтервалів порівняно з номінальною і порядковою шкалами має значні переваги щодо техніки вимірювання.
Шкала відношень (пропорцій)
Вона дає змогу зробити висновки про пропорції (удвічі більше, удвічі менше, у чотири рази важче тощо), тому її широко застосовують у фізиці. Ідеалом вимірювальної процедури є отримання таких даних про властивості об'єктів, за якими можна з'ясувати, у скільки разів один об'єкт більший або менший за інших. Це можливо лише тоді, коли, крім визначення рівності, рангового порядку, рівності інтервалів, відома рівність відношень. Значення шкали відношень не тільки однакові, а й співвідносні із природною і довільно обраною точкою відліку. Ці відношення ілюструють міри довжини (метри, сантиметри тощо), міри ваги (кілограми і грами). Якщо довжина дошки становить 3 м, то ця дошка в два рази довша, ніж та, довжина якої дорівнює 1,5 м, а предмет вагою 170 кг у 1,7 раза важчий, ніж той, що важить 100 кг.
Ця шкала дає змогу робити висновки про тотожність (сум, кратних, часток), виконувати всі статистичні підрахунки.
У суспільних науках шкалу використовують, коли виміру підлягають розмір, вага, інші подібні ознаки досліджуваних, час реакції і виконання тестового завдання тощо.
У психології шкали відношень практично не застосовують. Винятком є шкали оцінювання компетентності, засновані на моделі Раша. Можна уявити "нульовий" рівень обізнаності досліджуваного в певній галузі знань (наприклад, знання ескімоської мови) або "нульовий" рівень володіння навиком. Деякі автори стверджують, що, запроваджуючи єдину шкалу "труднощі задачі" - "здібності досліджуваного", можна виміряти, у скільки разів одна задача важча за іншу або один досліджуваний компетентніший за іншого.
Значення шкали відношень інваріантні щодо перетворення вигляду: х' = ах.
Значення шкали можна множити на константу. До них застосовують будь-які статистичні заходи.
У разі використання шкали критеріальних тестових норм задають відповідність між тестовими балами за шкалою вимірювальної властивості і рівнем критеріального показника.
Отже, шкалювання дає змогу розв'язувати кілька типів завдань. Шкали установок є основою діагностування особистості при дослідженнях самооцінки, вираженні досліджуваним суб'єктивного ставлення до будь-чого, коли проектують внутрішній зміст, мотиви, тенденції особистості. Вимірювальні шкали є засобом збору і аналізу статистичного матеріалу як у прикладних, так і в теоретичних дослідженнях.
Статистичні шкали
2.2. Психометрія у структурі й психодіагностичних методів
Технологія конструювання тесту
Адаптація діагностичних методів
Надійність тестів, її обчислення
Визначення коефіцієнта надійності
Надійність окремих пунктів
Валідність тестів, особливості її визначення і перевірки
Змістова валідність