цієї сукупності. При невідомій генеральній сукупності таку схему побудувати неможливо і кількісні характеристики генеральної сукупності не можуть бути використані для оцінки одержаних вибіркових характеристик.
Для оцінки різниці між вибірковою і генеральною характеристиками застосовують так звані "прямі" теореми теорії ймовірності (теореми Бернулі, Муавра - Лапласа, Чебишева та ін.) лише у разі, коли генеральна характеристика - величина постійна, а вибіркова - випадкова змінна. Оскільки в нашому випадку дана умова не витримується, при вирішенні завдання одержання оцінки виходять з припущення, що невідома нам генеральна характеристика може мати ті чи інші значення з відповідними їм ймовірностями, тобто вона розглядається як випадкова змінна. Теорія ймовірностей для вирішення цього завдання застосовує так звані "обернені" теореми Бернулі, Лапласа, "другий закон великих чисел" та ін. Застосування їх поширюється лише на вибірки необмеженого обсягу і не може бути застосовано для оцінок точності кінцевих вибірок.
4. У зв'язку з тим, що в практиці вибіркового обстеження виникають помилки ( чи похибки ), розміри яких певною мірою зумовлені способом застосованого відбору та обсягом вибірки, постає питання оцінки того чи іншого способу відбору. Отже, виникає завдання оцінки точності способу, за яким здійснюється відбір у вибіркову сукупність. Це завдання вирішується шляхом з'ясування таких питань: чи відомі дані про всю сукупність; яким способом здійснюється вибірка ; якими будуть результати, тобто якими властивостями буде володіти вибіркова сукупність. Чи будуть ці властивості і характеристики вибіркової сукупності відрізнятися від відомих досліднику властивостей і характеристик генеральної сукупності? Наскільки великими будуть відхилення (помилки вибірки)? Чим вони зумовлюють і чи можуть бути зменшені і наскільки?
Вирішення цього завдання ґрунтується на всебічному аналізі властивостей досліджуваної сукупності і врахуванні властивостей застосованого способу відбору. Важлива роль тут належить теорії ймовірностей, адже мова йде про оцінку точності вибірки. Дослідник розглядає всі можливі варіанти вибірок, зіставляючи результати аналізу з характеристиками заданої генеральної сукупності. Застосовуються тут "прямі" теореми теорії ймовірностей.
Вирішення зазначених вище завдань вибіркового спостереження можливе лише за умов знання теорії вибіркового методу. Вони спрямовані на досягнення основної мети вибірки - відтворення генеральної сукупності. їх вирішення потребує детального розгляду питань про помилки вибіркового обстеження, точкову і інтервальну оцінки, нормоване відхилення, довірчу ймовірність і довірчий інтервал. Цим питанням присвячуються окремі параграфи посібника.
Оскільки вибіркове спостереження відбирає, "вихоплює" факти з досліджуваної генеральної сукупності, при невдалій його організації можуть бути зареєстровані явища, не пов'язані одне з одним, перед організацією вибіркового обстеження стоїть завдання здійснити відбір таким чином, щоб існуючі взаємозв'язки між одиницями знайшли відображення у вибірковій сукупності. Таке завдання вирішується шляхом укрупнення одиниць відбору, переходу до серійної вибірки. Остання гарантує охоплення в цілому групи взаємно пов'язаних фактів. А це означає, що створена можливість для вивчення їх взаємодії і взаємозалежності.
В організації вибіркового спостереження мають місце випадки, коли поєднується відбір серій з відбором одиниць всередині останніх. Така вибірка називається комбінованою. Трапляються випадки організації вибіркового спостереження, при якій відбір здійснюється всередині однієї з пов'язаних між собою сукупностей, а з другої сукупності в обстеження включають ті одиниці, котрі свідомо пов'язані з відібраними одиницями першої сукупності.
В організації вибіркового спостереження виняткового значення набуває питання про визначення таких категорій обстеження, як одиниця відбору і одиниця спостереження. Під одиницями відбору розуміють частини сукупності, які включені у склад вибірки. Одиницями спостереження називають такі частини сукупності, ознаки яких підлягають спостереженню і реєструються окремо від інших в процесі обстеження. Одиниця відбору - це категорія, притаманна виключно вибірковому методу, у той час як одиниця спостереження є категорією загальностатистичною, яка має відношення і до суцільного і до несуцільного спостереження.
Відмінність понять одиниці відбору і одиниці спостереження особливо різко виявляється при серійній вибірці, при організації якої відбір здійснюється групами (серіями) одиниць, які складають досліджувану сукупність, а спостереженню підлягає кожна одиниця спостереження. В серійних вибірках одиниця спостереження є частиною одиниці відбору.
Як правило, у вибірковому обстеженні одиниця відбору і одиниця спостереження збігаються між собою. Але одиниця відбору не повинна бути меншою за одиницю спостереження. Наприклад, якщо одиницею спостереження є підприємство, то одиницями відбору не можуть бути відділки, бригади, ферми тощо. З іншого боку, при фіксованій чисельності вибірки або частки явища одиниця відбору не повинна значно перевищувати одиницю спостереження. Якщо, наприклад, при серійному відборі відокремлюється 60 одиниць з 1000, то краще відібрати 6 серій по 10 одиниць, ніж 3 серії по 20 одиниць.
Досить важливим питанням організації вибіркового обстеження є визначення схеми і способу відбору. При його вирішенні виходять перш за все з розміру помилки вибірки.
Наступним важливим питанням вважається вирішення завдання щодо чисельності вибіркової сукупності. Тут статистик повинен орієнтуватися стосовно граничних помилок розміру досліджуваного явища і ймовірності, з якою ці границі повинні бути гарантовані.
Організація вибірки передбачає попередню перевірку її репрезентативності. Із цією метою за даними поточного або минулого періоду розраховують кілька найбільш важливих показників для генеральної і для вибіркової сукупностей. Одержані показники зіставляють і таким чином знаходять різницю між ними. У соціально - економічних дослідженнях вважається задовільним відхилення вибіркових даних від даних по генеральній сукупності в межах 5 %. Якщо відхилення перебільшують зазначений рівень, вибірка вважається нерепрезентативною, і відбір повторюють. У випадках, коли повторний відбір не дає бажаних наслідків, збільшують чисельність вибіркової сукупності.
Організація вибіркового спостереження потребує врахування всіх можливих умов і обставин, в яких буде відбуватися обстеження. Якщо ж виникають нові обставини в ході обстеження - в організацію вибірки вносять відповідні корективи.
Викладене вище зумовлює здійснення вибіркового спостереження за такими етапами: 1) формування мети спостереження; 2) відмежування генеральної сукупності; 3) встановлення системи відбору одиниць для спостереження; 4) визначення числа одиниць, які підлягають відбору; 5) підготовка основи вибірки (відбору); 6)проведення статистичного спостереження, тобто планомірного, науково організованого збору даних про досліджуване явище (процес); 7) розрахунок вибіркових характеристик і їх помилок; 8) поширення вибіркових даних на генеральну сукупність. Перелічені вище етапи знаходять своє відображення у висвітленні теоретичних і практичних аспектів вибіркового методу.
При організації вибірки значення має визначення необхідної її чисельності ("). Остання залежить від варіації одиниць обстежуваної сукупності. Чим більша коливність, тим більшою повинна бути чисельність вибірки. Зворотний зв'язок існує між чисельністю вибірки її граничною помилкою. Прагнення отримати меншу помилку вимагає збільшення чисельності вибіркової сукупності.
Необхідна чисельність вибірки визначається на основі формул граничної помилки вибірки (А) із заданим рівнем ймовірності (р). Шляхом математичних перетворень отримують формули розрахунку чисельності вибірки (табл. 88).
Таблиця 88
Розрахунок необхідної чисельності вибірки
Спосіб відбору | Чисельність вибірки (") при визначенні та оцінці параметра | |
середньої(х) | частки (у) | |
Повторний | ' V | '2и>(1 - і лі |
Безповторний | '2И<(1 - №)И | |
Д2К +' 2ст2 | А2"К +' 2и<1 -1) |
При вирішенні питання про визначення чисельності вибірки дослідник вимушений роботи припущення про генеральні характеристики або здійснювати для них пробну вибірку. Лише за таких умов буде об'єктивною величиною чисельність вибіркової сукупності, розрахована за розглянутими формулами.
Для розрахунку чисельності вибірки можна користуватися стандартними таблицями і номограмами, в яких для певних величин граничної помилки і довірчої ймовірності наводиться рекомендована чисельність одиниць вибіркового спостереження. Прикладом такої довідкової таблиці є таблиця 89. Останню можна перебудувати таким чином, що заданими величинами будуть чисельність вибірки і гранична помилка. У такому разі можна знайти рівень ймовірності або величини чисельності вибірки та рівня ймовірності, за якими знаходиться можлива гранична помилка (табл. 90).
Таблиця 89
Чисельність вибірки при заданих рівнях граничної помилки(А) і ймовірності (Р)
р | А | |||||||||
0,10 | 0,09 | 0,08 | 0,07 | 0,06 | 0,05 | 0,04 | 0,03 | 0,02 | 0,01 | |
0,85 | 51 | 63 | 80 | 105 | 143 | 207 | 323 | 575 | 1295 | 5180 |
0,90 | 67 | 83 | 105 | 138 | 187 | 270 | 422 | 751 | 1090 | 6763 |
0,95 | 96 | 118 | 150 | 195 | 266 | 384 | 600 | 1067 | 2400 | 9603 |
0,99 | 165 | 204 | 359 | 338 | 460 | 663 | 1036 | 1843 | 4146 | 16587 |
0,997 | 220 | 271 | 344 | 449 | 611 | 880 | 1376 | 2446 | 5504 | 22018 |
0,999 | 270 | 334 | 422 | 552 | 751 | 1082 | 1691 | 3007 | 6767 | 27069 |
Таблиця 90
Рівень довірчої ймовірності при заданому числі спостережень (и) і граничній помилці(А)
п | А | |||||||||
0,10 | 0,09 | 0,08 | 0,07 | 0,06 | 0,05 | 0,04 | 0,03 | 0,02 | 0,01 | |
50 | 0,843 | 797 | 242 | 678 | 604 | 520 | 428 | 329 | 223 | 112 |
100 | 0,954 | 928 | 890 | 838 | 770 | 689 | 576 | 452 | 310 | 159 |
200 | 0,995 | 989 | 976 | 952 | 910 | 843 | 742 | 604 | 428 | 223 |
300 | 0,999 | 998 | 994 | 985 | 962 | 917 | 834 | 701 | 511 | 271 |
500 | 0,998 | 993 | 975 | 926 | 820 | 629 | 345 | |||
1000 | 0,998 | 989 | 942 | 794 | 473 | |||||
2000 | 0,993 | 926 | 629 | |||||||
5000 | 0,995 | 843 | ||||||||
10000 | 0,954 |
Одержані в результаті вибіркового спостереження статистичні характеристики з врахуванням їх точності можуть бути поширенні на генеральну сукупність. Пов'язану із цим обчислювальну роботу здійснюють двома способами, які вважаються найпростішими у статичній практиці: 1) спосіб прямого перерахунку; 2) спосіб поправочних коефіцієнтів.
Спосіб прямого перерахунку полягає у тому, що вибіркові характеристики (середня, частка) помножують на відповідний показник обсягу генеральної сукупності з врахуванням значення граничної помилки репрезентативності . Наприклад : вибірковим обстеженням 10 % приватних господарств при загальній їх кількості 2500 встановлено, що середня чисельність птиці на одне подвір'я становить 30 голів. Щоб визначити загальну чисельність поголів'я птиці в приватному секторі обстежуваного об'єкта, необхідно загальну кількість дворів перемножити на середню чисельність птиці в одному дворі (2500 o 30=75000).
Спосіб поправочних коефіцієнтів - застосовується для перевірки і уточнення даних суцільного спостереження. Із цією метою проводять контрольні вибіркові спостереження. Суть його полягає у тому, що по одних і тих же об'єктах зіставляють дані суцільного і контрольного вибіркового обстеження. У результаті такого зіставлення обчислюють поправочні коефіцієнти. Останні використовують для внесення відповідних поправок по даних суцільного спостереження.
Наприклад, у результаті суцільного обстеження фермерських господарств району встановлено, що кількість поголів'я свиней в них становить 7000 гол. Контрольне вибіркове обстеження 10 % фермерських господарств показало, що в них при суцільному обстеженні зареєстровано 800 голів, а при контрольному обстеженні 816 голів. Отже, при суцільному обстеженні було недорахована 16 голів, що становить 2 % від 800 голів. Поправочний коефіцієнт тут становить 102 % (1,02). Цей показник використовується для внесення поправок у результати суцільного спостереження. В нашому прикладі слід вважати загальну чисельність поголів'я свиней не 7000, а 7140 голів (7000 ■ 1,02).
При поширенні даних вибіркової сукупності на генеральну слід враховувати таку важливу обставину, як однорідність вибірки і всієї досліджуваної сукупності. Тому зазначеним способом треба користуватися з обережністю. Особливо це стосується дослідження соціально - економічних явищ і процесів, яким притаманна риса мінливості.
§ 12.1. Статистичні таблиці, їх види і правила оформлення
§ 12.2 Графічний метод
12.2.1. Роль і значення графічного методу в наукових дослідженнях
12.2.2. Основні елементи статистичного графіка
12.2.3. Види статистичних графіків і способи їх побудови
ПРОГРАМОВАНИЙ КОНТРОЛЬ ЗНАНЬ
МОДУЛЬ І
Тема 1. Методологічні засади статистики
Тема 2. Статистичне спостереження