Статистика - Опря А.Т. -
7.2.6. Логіка побудови множинних кореляційно - регресійних моделей

Як було сказано, геометрична природа рівняння множинної регресії визначає положення в просторі площини відповідних змінних х123^, хп і у. Саме рівняння характеризує кількісний зв'язок між досліджуваними ознаками і дозволяє вирахувати очікувані значенням результативної ознаки під дією включених в аналіз ознак - факторів, пов'язаних даним рівнянням.

Найважливіше питання кореляційно - регресійного аналізу є підбір типу аналітичної функції при вивченні множинних зв'язків. Наскільки важливе це положення свідчить розгорнута ще в 60- х роках минулого століття нині триває дискусія. Наприклад, відомі американські економетрики Е.Хедді і Д.Диллон вважають, що для "... економічних явищ є неймовірним, щоб всім умовам найбільш відповідав один тип... функції. До того ж різні люди можуть привести в однаковому ступені обґрунтовані доведення на користь вибору того чи іншого типу функції". Деякі автори стверджують, якщо теоретично неможливо обґрунтувати тип функції, то це можна зробити емпірично, на основі графічного аналізу парних зв'язків . (Лукомський Я.І., 1961) Таке твердження треба вважати невірним. Економічні явища, як ніякі інші, взаємозв'язані. Отже, графічний аналіз парних зв'язків між функцією і аргументами мало, що дає для обґрунтування форми множинного зв'язку.

Окремі економісти і статистики пропонують використовувати для побудови кореляційних моделей, степеневу функцію виду:

у = а0 ■ хі"1 ■ х212 ■... o х"п .

Як аргумент виставляється те, що : зручною формою взаємозв'язку економічних показників є добуток показників. Це підтверджується всім комплексом існуючих формул. Показники норми амортизації, виробітку, рентабельності, ланцюгові аналітичні показники - отримують методом алгебраїчного множення. Поняття форми добутків полегшить також наступний аналіз змін норм виробітку впливу різних об'єктивних причин 3.

В.П.Хайкін та інші, наприклад, обґрунтовують застосування степеневих моделей тим, що при плануванні, головним чином, враховують найменші відносні відхилення фактичних значень від розрахункових, одержаних за рівнянням регресії.

Подібна аргументація непереконлива. Відносні відхилення можна одержати, не використовуючи логарифмічної лінійною форми зв'язку, наприклад, уявляючи вихідні дані у вигляді індексів, прийнявши при цьому гіпотезу про лінійну залежність між результативною ознакою і ознаками - факторами. Але справа в тому, що застосування кореляційного і регресійного аналізу ефективне лише тоді, коли модельована сукупність представлена широкою варіацією рівнів показників, що входять в модель. При використанні відносних чисел ця умова часто порушується.

Незважаючи на ряд переваг степеневої функції (простота лінеаризації, зручність інтерпретації і т.п.), вона має певні недоліки. Так , окремі ознаки - фактори, які входять вхідні в кореляційну модель (такі, як рівень механізації рівень рентабельності та ін.) можуть виявитися рівними нулю. Якби в даному випадку вибрати тип функції у вигляді добутку факторів, то вона в ряді випадків виявилася б рівної нулю, а рішення системи рівнянь було б пов'язано із значними обчислювальними труднощями. Так, при лінеаризації доводиться стикатися з тим, що в рівняннях ні один із членів не піддається логарифмуванню, оскільки ^ 0= - °° .

Отже, математична природа кореляційних моделей свідчить про те, що функція повинна насамперед обґрунтовуватись економічно. Якщо цього зробити не можна, то тип функції визначається емпірично, тобто шляхом побудови ряду функцій і оцінки їх адекватності певними критеріями.

Е.Хедді і Д.Діллон у даному випадку вказують: "Для емпіричного дослідження недостатньо тільки логічно обґрунтовувати модель. Вона до того ж повинна піддаватися математичній обробці. Дослідник повинен піти на компроміс з теоретично ідеальною моделлю. По - перше, число розглядуваних окремих змінних повинне бути визначене з врахуванням як можливості одержання даних, так і наявності ресурсів для проведення розрахунків. По - друге, необхідно використати такий функціональний вираз, який статистично припустимий як при оцінці, так і при випробуванні істотності. Тому побудова економічної моделі даного економічного явища залежить від проблем, пов'язаних з одержанням даних їх статистичної оцінки" (Хедді Є. і Діллон Д., 1965).

Природа множинних кореляційних моделей і процес їх побудови зобов'язують враховувати об'єктивні особливості, наприклад, сільськогосподарських підприємств, де, як правило, розглядають дві групи факторів. Перша з них зв'язана із природними, друга - з матеріальними умовами, які є продуктом діяльності людей.

Фактор природніх умов суттєво впливає на процес виробництва, а разом з ним і на процес утворення вартості. Дія цього фактору підвищує або знижує рівень затрат на виробництво одного і того ж обсягу споживної вартості.

До другої групи відносять фактори, які випливають з виробничо господарської діяльності. Це, насамперед, напрям і рівень спеціалізації підприємств, розмір і структура виробничих фондів, об'єм виробництва і т.п. Дана група факторів істотно впливає на ефективність виробництва і тому повинна особливо враховуватися при кореляційному моделюванні.

Факторам - аргументам, відібраним для включення в регресійну модель, пред'являються також, крім основної вимоги про відображення об'єктивних особливостей сільськогосподарських підприємств, також і деякі інші вимоги. Насамперед фактори повинні бути кількісно вимірні, оскільки кореляційні формули за своєю природою відображають зв'язок тільки між кількісно визначеними ознаками. У випадку включення в кореляційну модель якісних ознак їм необхідно надати кількісну визначеність. Це може бути зроблено, наприклад, за допомогою бальної оцінки, шляхом присвоєння рангів і т.д.

Проблема аналізу ще більш ускладнюється, коли якісно варірює залежна змінна величина. Які б перетворення при цьому не застосовувалися, природа кореляції орієнтує тут лише на наближеність у відображенні досліджуваних залежностей.

Природа кореляції вимагає, дотримання умови, обов'язкової для підбору залежної і незалежної змінних. Жодна із змінних не повинна знаходитись у функціональній залежності від іншої, або їх групи. З одного боку, ця вимога випливає з того, що немає сенсу шукати кореляційну залежить там, де заздалегідь відомо існування функціональної залежності. З іншого боку, при існуванні функціональних зв'язків між включеними в кореляційну модель показниками, які утворюються в ході вирішення моделі, система нормальних рівнянь може вийти погано або в зовсім не обумовленою, а одержані результати - ненадійними.

Необхідно звернути увагу ще на один момент методологічного порядку. При побудові кореляційних моделей у них не можна включати групу факторів, лінійна комбінація яких дорівнює постійній величині або близька до неї. У цьому випадку система нормальних рівнянь для визначення коефіцієнтів регресії або не має рішення, або його одержують в результаті випадкових відхилень. У подібних випадках, якщо парний коефіцієнт кореляції між двома ознаками - факторами перевищує 0,8 (з певним довірчим рівнем), то включати в кореляційну модель можна один з факторів.

Неможливо не відмітити, що відбір вихідних даних для розрахунків кореляційного аналізу вимагає великої уваги і обережності. Справа в тому, що, з одного боку, надійність кореляційних формул безпосередньо залежить від обсягу статистичної сукупності. Адже в основу кореляційних розрахунків покладено усереднення - усередняються як характер впливу кожного врахованого фактора на залежну змінну, так і загальний вплив решти, неврахованих причин. Загальновідомо, що середні тим надійніші, чим за більшим обсягом даних вони розраховувались.

З іншого боку, включення в кореляційну модель додаткових даних, якщо воно було зроблено без належного якісного відбору, може призвести до того, що формулою неможливо буде користуватися. Відомо, що середні лише тоді мають реальний економічний зміст, коли вони ґрунтуються на якісно однорідному матеріалі. Теорія середніх величин вчить нас застосовувати їх для кількісної характеристики тільки однорідної сукупності.

Як правило, економічні явища складуються під дією багатьох факторів. Але бажання враховувати їх у кореляційній моделі в можливо більшій кількості досить рідко себе виправдує. Така кореляційна модель занадто громіздка, причому вплив великої частини факторів виявляється статистично неістотним.

Таким чином, природа кореляції і регресії вводить певні обмеженні в частині практичного використання кореляційно -регресійного методу в аналізі соціально - економічних процесів. Одержання вірогідних висновків за результатами кореляційно -регресійного аналізу можливе тільки при дотриманні певних, вимог. Останні випливають із самої природи кореляції. Назвемо основні з них: визначеність характеру залежності (прямолінійної, криволінійної), статистична однорідність досліджуваної сукупності, кількісний вимір ознак, достатній обсяг вибірки.

Інколи дослідники з метою одержання корисної практичної інформації намагаються виявити залежності в ідеальному їх вигляді, коли дуже високі коефіцієнти кореляції. В результаті має місце така серйозна помилка: одночасно розглядається дуже велика кількість факторів, причому деякі з них тісно пов'язан між собою. Зміна одного фактора в такому випадку безумовно викличе зміну іншого, в результаті чого важко відокремити чистий вплив одного фактора від впливу іншого і задовільнити природу, на якій ґрунтується теорія множинної кореляції . Через це введення в аналіз великої кількості факторів з метою вивчення їх впливу на результативну ознаку іноді зовсім не так доцільно, як це здається з першого погляду. Методологічна буде більш правильним відбирати ті з них, які є основними.

Для успішного практичного використання кореляційних моделей як об'єктивного критерію найкращого рівняння зв'язку можуть бути використанні коефіцієнт множинної кореляції і стандартна помилка оцінки за рівнянням множинної регресії при задовільній економічній інтерпретації самої моделі множинної регресії. Зокрема, напрям і сила впливу окремих факторів на залежну змінну, яка характеризується параметрами рівняння, повинні відповідати емпіричним уявам про цей вплив, тобто крім підтвердження рівня значимості спостережуваної взаємозалежності статистичними методами необхідно ретельно вивчити її логічну обґрунтованість.

Враховуючи, що взаємодія одних і тих же факторів з врахуванням і без врахування впливу інших причин може виявлятися по - різному, всілякі висновки про можливу форму зв'язку у багатофакторній моделі, зроблений на підставі аналізу парних залежностей, не повинні трактуватися як абсолютно вірогідності, до них необхідно відносити дуже обережно. У цьому відношенні переваги віддаються методу часткової кореляції.

Застосування даного методу в економічному аналізі носить у відомій мірі умовний характер. Причини, які впливають на досліджувані явища в галузях народного господарства, дуже різноманітні. Тому необхідно завжди пам'ятати, якщо виключити вплив одного фактора ті що залишилися несуть на себі дію ряду інших умов, не врахованих в дослідженні. І все ж таки застосування методу часткової кореляції має важливе значення при поглибленому аналізі множинної кореляції.

Існують й інші принципові (і дискусійні) питання теорії, які орієнтують на правомірність використання методу кореляційно -регресійного аналізу соціально - економічних явищ. Розгляд їх виключено, у зв'язку з метою і завданнями даного посібника. Тезисність викладення окремих питань даного розділу обумовлена тими ж причинами.

МОДУЛЬ 4
ТЕМА 8. АНАЛІЗ ІНТЕНСИВНОСТІ ДИНАМІКИ
§ 8.1. Статистичні ряди динаміки, основні правила їх побудови
§ 8.2. Види рядів динаміки, їх аналітичні показники
ТЕМА 9. АНАЛІЗ ТЕНДЕНЦІЙ РОЗВИТКУ ТА КОЛИВАНЬ
§ 9.1. Прийоми аналітичного вирівнювання рядів динаміки
§ 9.2. Статистичні прийоми виміру сезонних коливань
§ 9.3. Особливості кореляційного аналізу рядів динаміки та методичні основи статистичного прогнозування їх рівнів
ТЕМА 10. ІНДЕКСНИЙ МЕТОД
§ 10.1. Загальне поняття статистичних індексів. Основи індексного методу