Обробка зібраних даних — важливий етап емпіричного дослідження. Від того, як вирішено питання обробки інформації, значною мірою залежать строки, вартість і взагалі успіх дослідження. Відповідь на нього має бути знайдена до тиражування анкети, оскільки від програмного забезпечення, що використовуватиметься для обробки матеріалу, залежить кодування анкети.
До початку збирання інформації бажано визначитись, які методи аналізу даних застосовуватимуться (побудова таблиць певного виду, факторний аналіз тощо), а також які конкретно ознаки аналізуватимуться за допомогою того чи іншого методу. Зрозуміло, що такий план може бути лише приблизним, оскільки аналіз даних — ітераційний процес, розвиток якого відбувається в діалозі (безпосередньому або заочному) з комп'ютером. План потрібний для того, щоб дібрати необхідне програмне забезпечення, а також як початковий етап аналізу.
Зібрану інформацію обробляють або вручну, або за допомогою І комп'ютера. Ручні методи обробки інформації застосовуються (і тепер досить рідко і переважно у разі, якщо соціолог не має змоги працювати на комп'ютері, а треба обробити невеликий за обсягом (ЗО—50 одиниць) масив анкет з незначною (від 10 до 20) кількістю запитань. Це можуть бути, наприклад, дані пілотажного дослідження або дані експертного опитування. При проведенні обчислень під час ручної обробки даних широко використовують калькулятори.
Для обробки великих масивів, що містять дані стосовно тисяч Ц об'єктів, які описуються кількома сотнями ознак, слід застосовувати обчислювальну техніку, що має достатній обсяг пам'яті та ^високу швидкість обчислень.
Основні етапи обробки емпіричних даних
У процесі обробки даних соціологічних досліджень можна виокремити такі змістовні етапи:
1) кодування інформації;
2) введення інформації в комп'ютер;
3) перевірка введених даних та коригування помилок;
4) проведення обчислень та аналіз результатів.
Якщо передбачається обробка даних на комп'ютері, слід разом із фахівцем з інформатики метод кодування зібраної інформації (нумерація запитань та варіантів відповідей в анкеті для опитування, нумерація пунктів і варіантів значень у кодувальному листку контент-аналізу та ін.) узгодити з можливостями відповідного програмного забезпечення. Немає загальновизнаних стандартів на кодування інформації. Наприклад, є пакети програм, що вимагають нумерувати всі варіанти відповідей в анкеті послідовними натуральними числами (1, 2, 3...), а є інші, які наполягають на нумеруванні варіантів відповідей окремо в межах кожного запитання. Таких прикладів можна навести дуже багато. Тому обраний без урахування можливостей і особливостей програмного забезпечення метод кодування може призвести до необхідності після завершення збирання інформації проводити велику ручну роботу з перекодування інформації перед введення її в комп'ютер. У ряді ситуацій для однієї частини значені обирають коди до початку збирання інформації, для другої — коди обирають лише після того, як всю інформацію зібрано (на приклад, відкриті запитання в анкетах для опитування). Цю роботу також слід планувати з урахуванням методів майбутньої обробки та можливостей програмного забезпечення.
Після того як інформація зібрана і закодована, переходять де введення даних в комп'ютер. Ця трудомістка робота потребує багато часу. Вводять дані, як правило, не соціологи, а оператори. Вони повинні швидко і без помилок перенести закодовану інформацію з одного носія (наприклад папір) на інший (магнітний диск) і не приймати жодних рішень щодо цієї інформації (наприклад, вирішувати, чи вводити анкету, яка не цілком заповнена). Тому навіть у разі, коли всі коди обрані до початку етапу збирання інформації, перед тим як передати зібрану інформацію до введення, слід уважно переглянути всі анкети.
У процесі введення оператори можуть припускатися помилок. Крім того, помилки можуть бути і в самих анкетах. Так, у відповіді на запитання анкети "Де Ви зараз працюєте?" респондент вказав, що він безробітний, а на запитання "Ким Ви зараз працюєте?" (на іншій сторінці анкети) дав відповідь — "слюсарем". Тому або в процесі введення (що більш бажано), або відразу після закінчення введення слід проконтролювати введену інформацію і або скоригувати помилки (якщо це помилки введення), або відкинути ті анкети, що містять недостовірні дані. Для цієї роботи бажано мати спеціальні програми, які на основі вимог соціологів відбирають ті анкети, що цих вимог не задовольняють. Вимоги стосуються можливих значень кодів для певних ознак. Наприклад, "Коди ознаки 23 мають бути тільки 1, 2, 3" або "Якщо ознака 23 має значення 3, то ознаки 24 та 26 мають мати значення або 2, або З".
Тільки після завершення контролю починається власне аналіз даних — побудова таблиць, обчислення статистичних показників, перевірка статистичних гіпотез, побудова нових (додаткових) ознак та ін.
Результати обчислень на комп'ютері подаються в більшості випадків у вигляді надрукованих на папері таблиць. Корисним для змістовного аналізу даних є подання результатів у вигляді різного типу графіків (гістограм, діаграм, полігонів тощо). Графіки дають змогу наочно представити зв'язки та залежності між ознаками, роблять аналіз ефективнішим.
Аналіз однієї ознаки
Графічне зображення даних
Аналіз двовимірних таблиць
Коефіцієнт кореляції та рівняння регресії
Методи багатовимірної статистики
Частина перша ОСНОВИ СОЦІОЛОГІЇ: загальна теорія
Передмова
І. ОСНОВНІ ПОНЯТТЯ СОЦІОЛОГІЇ
Тема 1. СОЦІОЛОГІЯ ЯК НАУКА. ПРЕДМЕТ, СТРУКТУРА ТА ФУНКЦІЇ СОЦІОЛОГІЇ