Експериментування— процедура контрольованого спостереження, яка, як сподівається дослідник, може стати основою для якогось узагальненого висновку. Валідність цього висновку пов'язана як з результатами експерименту, так частково і з тим, в якій мірі досліджувані адекватно представляють генеральну сукупність, відносно якої робиться узагальнення.
У даному розділі ми розглянемо проблеми, які мають безпосереднє відношення до вибору досліджуваних і репрезентативності вибірки.
Поняття вибірки. Теоретична гіпотеза експерименту, як очікує дослідник, спрямована на адекватне відображення ситуації з досить широкою групою суб'єктів, навіть якщо само по собі дослідження і тестування, яке проводиться в рамках експерименту, включає достатньо специфічні конкретні риси і базується на вивченні конкретних явищ.
Розглянемо один із можливих тестів загальної теоретичної гіпотези відносно того, що фрустрація породжує агресію. Перевірка цієї теоретичної гіпотези може бути здійснена, як ми зазначали вище, в термінах добре операціоналізованих понять, таких як образа, дратування досліджуваних, які зайняті виконанням певної діяльності (у випадку, який наводився вище) як фактору, що породжує фрустрацію. Кількість застосувань елетрошоку по відношенню до ображальника розглядається як форма прояву агресії.
Специфічні операції, як можна очікувати, відносяться до більш широких понять, так само як експериментування вимагає уточнення понять, в термінах яких проводиться дослідження теоретичної гіпотези, оскільки всі можливі ситуації, що описуються за допомогою однієї і тієї ж теоретичної гіпотези, передбачити в експерименті неможливо. У такий же спосіб необхідно уточнити склад досліджуваних, які обираються для участі в експерименті, оскільки всі суб'єкти, на яких планується поширити результати експерименту, не можуть бути практично протестовані. Отже, гіпотеза про зв'язок фрустрації і агресії орієнтована на те, щоб описати всі ситуації виникнення фрустрації і появи агресії як її наслідку, так само як і довести можливість прогнозування її спрямованості не тільки на людей, а й на тварин в ситуаціях подібних, які існували в минулому, існують зараз та існуватимуть у майбутньому.
Оскільки цілком очевидно, що всі індивідуми в популяції не можуть виступити в ролі досліджуваних в експерименті з агресією, вчений змушений обирати обмежену її кількість із загальної генеральної сукупності, по відношенню до якої теоретична гіпотеза має силу. Поняття генеральної сукупності, яке застосовується в більш широкому значенні, відноситься до частотного розподілення всіх членів певного класу, які мають одну чи більше властивостей, що їх об'єднують. Генеральна сукупність може включати, скажімо, всіх учнів середньої школи, індивідумів з різними рівнями інтелекту, віку, показниками психологічних тестів особистості і т. ін. У психології поняття популяції чи генеральної сукупності зазвичай застосовується по відношенню до всіх членів даного класу суб'єктів, які в певних ситуаціях можуть поводитись однаково. У разі якщо вимірюються характеристики всіх членів популяції, можна отримати середні показники і стандартні відхилення для цієї групи. Такі показники, які можуть бути застосовані для описання всієї вибірки, називаються параметрами генеральної сукупності. Проте дуже рідко має сенс прагнути отримати виміри певних характеристик для всієї генеральної сукупності. Учений повинен обмежитись вибором підгрупи, яку називають вибіркою, і виміряти певні явища, що його цікавлять. Показники, які базуються на даних вибірки, називаються статистичними даними. На підставі їх аналізу можна оцінювати і робити висновки щодо параметрів тієї генеральної сукупності, з якої була сформована вибірка.
Поняття рандомізованої вибірки. Оскільки статистика вибірок використовується для того, щоб представити параметри генеральної сукупності, основна проблема, яку повинен вирішувати дослідник, полягає в тому, щоб забезпечити надійну репрезентативність вибірки по відношенню до генеральної сукупності. Ступінь, в якому вибірка адекватно репрезентує сукупність, що вивчається, є мірою, в якій статистика вибірки віддзеркалює параметри генеральної сукупності. Центральною проблемою щодо досягнення цієї відповідності є адекватний вибір щодо і призначення досліджуваних, які задіяні в експериментальних та контрольних умовах.
Існує декілька способів, за допомогою яких можна конструювати вибірки, щоб забезпечити їх репрезентативність. Можливо найбільш доцільним з них є рандомізація. Якщо кожний член генеральної сукупності отримує рівну вірогідність бути включеним у вибірку, процедура відбору розглядається як рандомізація, а сама вибірка зветься рандомізованою. Рандомізована вибірка гарантує, що підгрупа суб'єктів, відібрана з генеральної сукупності у такий спосіб, що вірогідність їх вибору була така ж сама, як і вірогідність вибору будь-якої іншої групи досліджуваних з тієї ж генеральної сукупності. В експерименті щодо зумовленості агресивних виявів фрустрацією, рандомізовані вибірки для експериментальних умов "ображання і дратування", з одного боку, і "не-дратування" — з іншого, забезпечили, щоб індивідуми всіх вікових груп, статі, рівня освіти, релігійних переконань тощо мали рівні шанси бути обраними. Це не означає, що все різноманіття видів досліджуваних у генеральній сукупності має бути репрезентовано у вибірці. Наприклад, людина, з 20-ма роками освіти мала значно меншу вірогідність опинитися у цій вибірці, ніж людина з 12-річною освітою. Віртуально кожний параметр тесту вірогідності репрезентації у вибірці різних суб'єктів базується на положенні, що рандомізований вибір був здійснений на якомусь етапі формування вибірки. Слід враховувати, що й рішення щодо статистичного відхилення нульової гіпотези відносно розбіжностей між середніми показниками теж пов'язане з процедурою рандомізованого формування вибірки.
Рівномірні і нерівномірні вибірки. Якщо не існує певних обмежень щодо можливого включення кожного суб'єкта з генеральної сукупності у дану вибірку, або якщо обмеження, які накладаються на нього, не заважають забезпечити істинну репрезентативність популяції, дослідники вважають, що обрана ними вибірка є рівномірною. Причина для такого припущення може бути з'ясована в термінах природи теоретичного вірогіднісного розподілу в .статистиці, який базується на існуванні безкінечної кількості подібних можливих вибірок. Якщо вона з рівною кількістю об'єктів була незалежно від іншої обрана із генеральної сукупності і їх середні показники відносно частотного розподілу були виміряні, то середні арифметичні показники такої дистрибуції (розподілу) будуть дорівшовати середнім популяції. Це досить складне твердження є не що інше як констатація того, що вибірка є рівномірною. Скажімо, якщо середній показник інтелекту у вибірці належить до середніх значень розподілу інтелекту, який складає 100 одиниць, тоді ця вибірка є рівномірною і рівномірно відбиває показник середньої всієї популяції незалежно від конкретної величини середніх показників цієї вибірки.
Звідси висновок: нерівномірною є вибірка, для якої теоретичний розподіл показників частотності середніх того параметру, що вивчається, не буде дорівнювати параметру популяції. Будь-яке обмеження на можливе включення індивідуму з генеральної сукупності у вибірку робить останню нерівномірною, не репрезентативною відносно генеральної сукупності, для якої результати дослідження вважаються такими, що адекватно описують ситуацію. Наприклад, учений може висунути гіпотезу, що певна експериментальна процедура підвищить показник інтелекту в експериментальній групі на відміну від контрольної. При доборі досліджуваних для цих вибірок будь-яке обмеження, яке зменшує шанси обрати конкретних досліджуваних в ту чи іншу вибірку, буде призводити до нерівномірності вибірок.
Таким чином, нерівномірною за визначенням є така вибірка, яка не є репрезентативною через певні обмеження, що були внесені при доборі досліджуваних.
Отже, важливою властивістю вибірки є її репрезентативність, тобто ступінь адекватності характеристик досліджуваних (вік, освіта, стать, соціально-економічні умови існування тощо) відповідним характеристикам популяції, на яких планується поширити експериментальні результати. Ступінь репрезентативності визначає, серед інших факторів, зовнішню валідність експерименту, тобто ступінь відповідності реального експерименту об'єктивній реальності, що вивчається за його допомогою.
При формуванні вибірок важливо забезпечити адекватний розподіл досліджуваних на групи, які вивчаються в різних експериментальних умовах. Це робиться з урахуванням критерію еквівалентності учасників експерименту, що означає необхідність урахування всіх значущих їх характеристик, розбіжності в яких можуть суттєво вплинути на перебіг і характеристики явищ, що вивчаються.
Крім рандомізації, тобто стратегії випадкового відбору досліджуваних, існують інші стратегії. Справа в тому, що навіть цей найбільш розповсюджений підхід до відбору досліджуваних припускає вірогідність випадкових помилок, найбільш типовими з яких вважаються такі [68, с. 80].
Помилки типу "Б". У вибірку випадково може потрапити непропорційно велика кількість досліджуваних, які різко відрізняються від інших учасників експерименту, скажімо, високими показниками інтелекту, низькою інтровертованістю, більшою демократичністю, ніж типові представники генеральної сукупності. Ці "нерепрезентативні" індивідуми можуть спричинити так зване "забруднення" експериментальних даних.
Наявність помилок типу Б у вибірці може збільшити шанси помилкового відхилення або прийняття нульової гіпотези залежно від того, в яку з вибірок (експериментальну чи контрольну) потрапили суб'єкти такого типу.
Помилки типу Є. Навіть якщо помилок типу Б вдалося значною мірою запобігти і вибірка відповідає за усіма важливими показниками генеральній сукупності, випадкові зміни у фізичному чи соціальному оточенні під час експерименту можуть непередбачено вплинути на показники залежної змінної цілої підгрупи (експериментальної чи контрольної).
У підручнику з експериментальної психології Андерсона і Борковські наводиться такий приклад помилки при проведенні соціально-психологічного експерименту на оцінку толерантності до тривоги. В обох групах досліджуваних (експериментальній і контрольній) пропонувалися для наступного пригадування слів, що мали нейтральну та емоційно забарвлену конотацію. Одній із груп була дана інструкція просто пригадати усі слова, а іншу повідомили, що це тест на толерантність до тривоги.
Сталося так, що один із суб'єктів першої підгрупи запідозрив, що експеримент має якусь іншу мету, ніж перевірку запам'ятовування, і публічно піддав критиці інструкцію. Звичайно, що ставлення суб'єктів до експерименту різко змінилося.
Помилки типу R — це ще один із типів помилок, які пов'язані з попереднім досвідом та умовами життя досліджуваних, що можуть суттєво впливати на їхню поведінку в експериментальних умовах.
Як зменшити кількість помилок, пов'язаних з формуванням вибірок?
Щоб знизити вірогідність впливу не репрезентативних вибірок, тобто помилок типу S, рекомендують застосовувати великі, або стратифіковані, вибірки. Велика вибірка знижує вірогідність помилок, бо зменшується варіабельність статистичного розподілу розбіжностей між середніми показниками залежної змінної окремих досліджуваних. Чим більша вибірка, тим ближчими є середні показники розподілу вибірки і популяції. Проте занадто великі вибірки підвищують вірогідність відхилення нульової гіпотези, якщо, фактично експериментальний вплив міг і не призводити до надійного ефекту. Тому рекомендують обирати помірні за чисельністю вибірки — до 25 осіб у кожній з підгруп, за даними одних авторів [68, с. 83], або до 30-35 осіб — за даними інших [21].
Логіка відбору помірних вибірок полягає в тому, що якщо різниця між середніми арифметичними виявляється достатньо великою при значній стандартній помилці, зумовленій бути величиною N, ця різниця має більше шансів науково значущою, ніж при більш численних вибірках. Існує статистичний прийом, який дослідники можуть застосовувати, щоб визначити наукову значущість експериментальних результатів, який зветься Omega [82; 89].
Інших можливих випадкових помилок, пов'язаних з формуванням вибірок (помилки типу G і R), можна уникнути за допомогою застосування спеціальних експериментальних планів, варіанти яких детальніше будуть розглянуті у спеціальному розділі підручника.
З можливими помилками при відборі рандомізованих вибірок допомагає впоратись стратометрична стратегія відбору досліджуваних. Зміст її полягає в тому, що в генеральній сукупності виокремлюють страти — групи людей з різними показниками певних властивостей. Потім з кожної зі страт рандомізовано і пропорційно обираються реальні учасники експерименту.
Важливим фактором при застосуванні стратифікації є наявність попередньої інформації відносно того, що той показник, за яким здійснюється ця процедура, може бути дійсно релевантним результатам експерименту. Інакше стратифікація може виявитися марною тратою часу й зусиль. Показник, за яким вона здійснюється, повинен значно корелювати з вимірами залежної змінної, щоб виправдати зусилля на здійснення цієї процедури.
Поширеною є також стратегія попарного відбору, коли в експериментальну і контрольну групи добираються досліджувані, еквівалентні за значеннями проміжних змінних. Для цього проводиться попереднє тестування за значущими змінними. За його результатами складаються пари досліджуваних із приблизно рівними значеннями вимірюваних змінних (один досліджуваний пари призначається в експериментальну групу, другий— в контрольну). Різновидом цієї стратегії є відбір груп досліджуваних, вирівняних за всіма показниками, крім того, який цікавить експериментатора і яким він маніпулює.
Інколи, якщо неможливо створити репрезентативну групу, використовують реальні групи. Застосування таких груп може призвести до змішування показників незалежної змінної та індивідуальних відмінностей, у зв'язку з чим виникає необхідність застосувати спеціальний квазіекспериментальний план, ознаки якого будуть проаналізовані у розділі "планування досліджень".
Можливо, найбільш надійним підходом до подолання різних типів помилок, пов'язаних з формуванням вибірок, є реплікація (повтор) експерименту з додатковими рандомізованими групами. Він може здійснюватися у двох варіантах.
Рекомендують, зокрема (Lindquist, 1953 [96]), підбирати декілька рандомізованих вибірок з однієї генеральної сукупності і досліджувати кожну з них тільки в одній із декількох (скажімо, двох) експериментальних ситуаціях. Наприклад, якщо в районі налічується 50 шкіл, дослідник може рандомізовано відібрати 16 з них, потім у такий же спосіб запропонувати досліджуваним восьми з цих шкіл експериментальний вплив, решті — створити "контрольні" умови. Після цього підраховуються сумарні по різних вибірках (по 8 шкіл у кожній) усереднені показники залежної змінної. Є всі підстави очікувати, що, попри можливі випадкові помилки, пов'язані з індивідуальними, ситуаційними та іншими розбіжностями між підгрупами досліджуваних, вплив різних експериментальних умов виявиться відносно помітним. ,
Другий варіант цього підходу передбачає збільшення кількості рандомізованих вибірок, в кожній з яких створюються експериментальні та контрольні групи.
Типи шкал
Незалежна змінна
Залежна змінна
Множинні вимірювання залежної змінної
Типи відношень між залежною та незалежною змінними
Побічні змінні
РОЗДІЛ 4. ПОБІЧНА (НЕЗАПЛАНОВАНА) ВАРІАТИВНІСТЬ І СТРАТЕГІЇ ЇЇ КОНТРОЛЮ
4.1. Важливість контролю побічної варіативності
4.2. Джерела побічних змінних у психологічному експерименті