Значення та етапи кореляційного аналізу. Методика розрахунку основних показників зв'язків. Сфера і порядок застосування результатів кореляційного аналізу.
Прийоми кореляційного аналізу застосовують для виміру впливу факторів у стохастичному аналізі, коли взаємозв'язок показників неповний, імовірнісний.
Розрізняють парну і множинну кореляції. Парна кореляція - це зв'язок між двома показниками, один з яких є факторним, а другий - результативним. Множинна кореляція виникає від взаємодії кількох факторів і результативного показника.
Необхідні умови застосування кореляційного аналізу такі.
1. Наявність достатньо великого числа спостережень за величиною досліджуваних факторів і результативних показників (у динаміці або за поточний рік за сукупністю однорідних об'єктів).
2. Досліджувані фактори належить вимірювати кількісно і відображати в тих чи інших джерелах інформації.
Застосування кореляційного аналізу дає змогу вирішити такі завдання:
1) визначити зміну результативного показника під впливом одного або кількох факторів (в абсолютному вимірі), тобто дізнатися, на скільки одиниць змінюється величина результативного показника при зміні факторного на одну одиницю;
2) встановити відносний ступінь залежності результативного показника від кожного фактора.
Кореляційний аналіз складається з кількох етапів.
На першому етапі визначають фактори, які справляють вплив на результативний показник, і відбирають найсуттєвіші для кореляційного аналізу. Відбір факторів для кореляційного аналізу є дуже важливим для економічного аналізу. Від того, наскільки правильно зроблено відбір факторів, залежить точність висновків за підсумками аналізів. При цьому необхідно дотримувати таких правил:
o фактори мають перебувати в причинно-наслідковому зв'язку з результативним показником;
o необхідно відбирати найбільш значущі фактори, котрі справляють відчутний вплив на результативний показник;
o фактори мають бути вимірними кількісно, тобто мати одиницю виміру, а інформація про них має міститися в обліку або звітності;
o у кореляційну модель лінійного типу не рекомендують включати фактори, зв'язок котрих з результативним показником має криволінійний характер;
o не рекомендують включати в кореляційну модель взаємопов'язані фактори (якщо парний коефіцієнт кореляції двох факторів більший від 0,85, то, за правилами кореляційного аналізу, один із них необхідно виключити, інакше це призведе до викривлення результатів аналізу);
o не бажано включати в кореляційну модель фактори, зв'язок котрих із результативним показником має функціональний характер.
Велику допомогу у відборі факторів для кореляційної моделі надають аналітичні угруповання, спосіб порівняння паралельних і динамічних рядів, лінійні графіки. За їхньою допомогою можна визначити наявність, напрям і форму залежності показників, що вивчаються. Відбір факторів можна також проводити в процесі вирішення завдань кореляційного аналізу на основі значущості їх за критерієм Стьюдента, про який буде сказано далі.
На другому етапі збирають вихідну інформацію про кожний факторний і результативний показник. її можна перевірити на точність, однорідність і відповідність закону нормального розподілу.
Передовсім необхідно переконатися у достовірності інформації, наскільки вона відповідає об'єктивній дійсності. Використання недостовірної, неточної інформації призводить до неправильних результатів аналізу і до неправильних висновків.
Одна з умов кореляційного аналізу - однорідність досліджуваної інформації відносно розподілу її близько до середнього рівня. Якщо в сукупності є групи об'єктів, котрі значно відрізняються від середнього рівня, то це вказує на неоднорідність початкової інформації. Критеріями однорідності інформації слугують середньоквадратичне відхилення і коефіцієнт варіації, які розраховують за кожним факторним і результативним показником.
Середньоквадратичне відхилення показує абсолютне відхилення індивідуальних значень від середньоарифметичного. Його визначають за формулою
Коефіцієнт варіації показує відносний ступінь відхилення окремих значень від середньоарифметичного. Його розраховують за формулою
7=5 100. х
Чим більший коефіцієнт варіації, тим відносно більший розкид і менша вирівнюваність об'єктів, що вивчаються* Змінюваність варіаційного ряду вважають незначною, якщо варіація не перевищує 10 %, середньою - якщо становить 10-12 %, значною - коли вона більша ніж 20 %, але не перевищує 33 %. Якщо варіація вища ніж 33 %, то це вказує на неоднорідність інформації і необхідність виключення нетипових спостережень, котрі звичайно бувають у перших і останніх ранжованих рядах вибірки.
Наступні вимоги до вихідної інформації - підпорядкування її закону нормального розподілу. Для кількісного оцінювання ступеня відхилення інформації від нормального розподілу слугують відношення показника асиметрії до її помилки і відношення показника ексцесу до його помилки.
Показник асиметрії (А) і його помилку (тоа) розраховують за такими формулами:
А К*і-*)8 т . /є"
по3 и
Показник ексцесу (Е) і його помилку (те) розраховують у такий спосіб:
па4 У л
У симетричному розподілі А = 0. Відмінність від нуля вказує на наявність асиметрії в розподілі даних близько середньої величини. Від'ємна асиметрія свідчить про те, що переважають дані з великими значеннями, а з меншими значеннями трапляються значно рідше. Додатна асиметрія показує, що частіше трапляються дані з невеликими значеннями.
У нормальному розподілі показник ексцесу Е = 0. Якщо Е > 0, то дані згруповано густо близько середньої і вони утворюють го-стровершинність. Якщо Е < 0, то крива розподілу буде плосковер-шинною. Однак, коли відношення А/та і Е/те менше від 3, то асиметрія й ексцес не мають суттєвого значення, і досліджувана інформація є відповідною до закону нормального розподілу. Отже, її можна використати для кореляційного аналізу.
На третьому етапі моделюють зв'язок між факторами і результативним показником, тобто вибирають і обґрунтовують математичне рівняння, котре найточніше виражає суть досліджуваної залежності. Для обґрунтування її використовують ті самі прийоми, що й для встановлення наявності зв'язку: аналітичні угруповання, лінійні графіки і т. ін.
Залежність результативного показника від його визначальних факторів можна виразити рівнянням парної і множинної регресії. При прямолінійній формі вони мають такий вигляд:
рівняння парної регресії: Ух = а + Ьх9
рівняння множинної регресії: Ух = а + ЬХХ + Ь2х2 +... + Ьпхп> де а - вільний член рівняння при х = 0;
*і" х2іхп - фактори, які визначають рівень результативного показника, що вивчається;
&і> Ь2, Ьп - коефіцієнти регресії при факторних показниках, які характеризують рівень впливу кожного фактора на результативний показник в абсолютному вираженні.
Якщо зв'язок між результативним і факторними показниками має криволінійний характер, то можна використати ступене-ву, логарифмічну, параболічну, гіперболічну та інші функції.
У тому разі, коли трудно обґрунтувати форму залежності, розв'язати задачу можна за різними моделями і порівняти отримані результати. Адекватність різних моделей фактичним залежностям перевіряють за критерієм Фішера, за показником середньої помилки апроксимації і величиною множинного коефіцієнта детермінації, про які мова буде дещо пізніше.
На четвертому етапі роблять розрахунок основних показників зв'язку кореляційного аналізу: рівняння зв'язку, коефіцієнти кореляції, детермінації, еластичності та ін.
За приклад для ілюстрації кореляційного аналізу прямолінійної залежності візьмемо наведені в табл. 1.2 дані про зміни рівня виробітку робітників (у) залежно від рівня фондоозброєності праці (х).
Розрахунок рівняння зв'язку (У, =а + Ьх) зводиться до визначення параметрів а і Ь. їх знаходять із такої системи рівнянь:
Іпа+Ь^х^у;
де л - число спостережень (у цьому прикладі 10);
х - фондоозброєність праці (вартість основних виробничих фондів на одного працівника підприємства), тис. гри;
у - середньорічний виробіток продукції на одного працівника, тис. гри.
Значення ^Ху^у^х2 ^ху розраховують на основі фактичних вихідних даних (табл. 1.2).
Таблиця 1.2. Розрахунок похідних даних для кореляційного аналізу
п | X | У | ху | X2 | У2 | Ух |
1 | 3,1 | 4,5 | 13,95 | 9,61 | 20,25 | 4,28 |
ю | 3,4 | 4,4 | 14,96 | 11,56 | 19,36 | 4,65 |
со | 3,6 | 4,8 | 17,28 | 12,96 | 23,04 | 4,90 |
4 | 3,8 | 5,0 | 19,00 | 14,44 | 25,00 | 5,15 |
5 | 3,91 | 5,5 | 21,45 | 15,21 | 30,25 | 5,28 |
6 | 4,1 | 5,4 | 22,14 | 16,81 | 29,16 | 5,52 |
7 | 4,2 | 5,8 | 24,36 | 17,64 | 33,-64 | 5,65 |
8 | 4,4 | 6,0 | 26,40 | 19,36 | 36,00 | 5,90 |
9 | 4,6 | 6,1 | 28,06 | 21,16 | 37,21 | 6,15 |
10 | 4,9 | 6,5 | 31,85 | 24,01 | 42,25 | 6,28 |
Усього | 40,0 | 54,0 | 219,45 | 162,76 | 296,16 | 53,75 |
Підставимо одержані значення в систему рівнянь
ГЮа+40г> = 54; [40а+162,76& = 219,45.
Перемноживши всі члени першого рівняння на 4, одержимо
Г40а + 160& = 216; [40а + 162,76Ь = 219,45.
Віднявши від другого рівняння перше, дістанемо 2,76Ь = 3,45. Звідси Ь = 3,45 : 2,76 = 1,25.
54-(40 . 1,25)
Рівняння зв'язку, що описує залежність продуктивності праці від її фондоозброєності, має такий вигляд:
Ух= 0,4+ 1,25*.
Коефіцієнт а - постійна величина результативного показника, не пов'язана зі зміною цього фактора. Параметр Ь показує середню зміну результативного показника зі збільшенням або зменшенням величини факторного показника на одиницю його виміру. У цьому прикладі зі збільшенням фондоозброєності праці на 1 тис. грн виробіток робітників підвищується в середньому на 1,25 тис. грн.
Підставивши в рівняння регресії відповідні значення х, можна визначити вирівняні (теоретичні) значення результативного показника (Уж) для кожного підприємства. Наприклад, щоб розрахувати виробіток робітників на першому підприємстві, де фондоозброєність праці дорівнює 3,1 тис грн, необхідно це значення підставити в рівняння зв'язку:
Ух = 0,4 + 1,25 o 3,1 = 4,28.
Одержана величина показує, яким би був виробіток при фондоозброєності праці 3,1 тис. грн, якби це підприємство використало свої виробничі потужності до такої міри, як у середньому всі підприємства цієї вибірки. Фактичний виробіток на цьому підприємстві вищий від розрахункового значення. Отже, це підприємство використовує свої виробничі потужності дещо краще, ніж у середньому по галузі. Аналогічні розрахунки зроблено для кожного підприємства. Дані наведено в останній графі табл. 1.2. Порівняння фактичного рівня виробітку робітників із розрахунковим дає змогу оцінити результати роботи окремих підприємств.
За таким самим принципом розв'язують рівняння зв'язку при криволінійній залежності між явищами, що вивчаються. Коли зі збільшенням одного показника значення другого зростають до певного рівня, а потім починають знижуватися (наприклад, залежність продуктивності праці робітників від їхнього віку), то для опису такої залежності найбільше підходить парабола другого порядку:
Ух=а + Ьх + сх2.
Відповідно до вимог методу найменших квадратів для визначення параметрів а, Ь і с необхідно розв'язати таку систему рівнянь:
па + &£х + с£*2 =£у; а£.г2 + + с£х4 = ^х2у.
Крім параболи, для опису криволінійної залежності в кореляційному аналізі часто використовують гіперболу
Ух =а + К
X
Для визначення її параметрів необхідно розв'язати таку систему рівнянь:
па
Гіпербола описує таку залежність між двома показниками, коли із збільшенням однієї змінної значення другої збільшується до певного рівня, а потім приріст знижується, наприклад залежність урожайності від кількості внесеного добрива, продуктивності тварин - від рівня годування їх, собівартості одиниці продукції - від обсягу її виробництва і т, д.
При складнішому характері залежності між явищами, що вивчаються, використовують складніші параболи (третього, четвертого порядку І т. д.), а також квадратичні, ступеневі, показові та інші функції.
Отже, застосовуючи той чи інший тип математичного рівняння, можна визначити ступінь залежності між досліджуваними явищами, дізнатися, на скільки одиниць в абсолютному вимірі змінюється величина результативного показника зі зміною факторного на одну одиницю. Однак регресійний аналіз не дає відповіді на запитання: тісний цей зв'язок чи ні; вирішальний чи другорядний вплив справляє цей фактор на величину результативного показника?
Для виміру щільності зв'язку між факторними і результативними показниками обчислюють коефіцієнт кореляції. У разі прямолінійної форми зв'язку між показниками, що вивчаються, його розраховують за такою формулою:
2^ху - --=-
\ ) >
219,45 -
щ -і5-= 0,97.
- Ш™-16 ---8і)
Підставивши із табл. 1.2 значення ^іху>^/х9ч£у,^х2 і
^у2 у формулу, одержимо значення коефіцієнта кореляції, що
дорівнює 0,97. Коефіцієнт кореляції може набирати значень від Одо 1. Чим ближча його величина до 1, тим тісніший зв'язок між показниками, і навпаки. У цьому разі величина коефіцієнта кореляції е суттєвою (г = 0,97). Це дає змогу зробити висновок про те, що фондоозброєність - один з основних факторів, від яких на аналізованих підприємствах залежить рівень продуктивності праці.
Якщо коефіцієнт кореляції піднести у квадрат, одержимо коефіцієнт детермінації (сі=0,94). Він показує, що продуктивність праці на 94 % залежить від фондоозброєності праці, а на частку інших факторів припадає 6 % змін її рівня.
Що стосується виміру щільності зв'язку при криволінійній формі залежності, то тут використовують не лінійний коефіцієнт кореляції, а кореляційне відношення, формула якого має вигляд;
§37 І(у, -у)2 г Е(у,-у")2
Ця формула універсальна. її можна застосовувати для обчислення коефіцієнта кореляції при будь-якій формі залежності. Однак для знаходження його потрібні попереднє розв'язання рівняння регресії і розрахунок за ним теоретичних (вирівняних) значень результативного показника для кожного спостереження досліджуваної вибірки (див. останню графу табл. 1.2).
Розв'язання задач багатофакторного кореляційного аналізу виконують на ПЕОМ за типовими програмами. Спершу формують матрицю початкових даних, у першій графі якої записують порядковий номер спостереження, у другій - величину результативного показника (У), а в наступних - дані факторних показників (х,). Ці відомості вводять в ПЕОМ і обчислюють рівняння множинної регресії, яке у нашій задачі набрало такого виразу:
Ух = 0,49 + 3,65*! + 0,09х2 + 1,02х3 - 0,122х4 + 0,052х5,
дехі - матеріал овіддача, грн; х2 - фондовіддача, коп.;
х3 - продуктивність праці (середньорічний виробіток продукції на одного працівника), тис. гри;
х4 - тривалість обігу оборотних коштів підприємства, дні;
Х5 - частка продукції вищої категорії якості, %.
Коефіцієнти рівняння показують кількісний вплив кожного фактора на результативний показник при незмінності інших. У цьому разі можна так інтерпретувати одержане рівняння: рентабельність підвищується на 3,65 % при збільшенні матеріаловід-дачі на 1 грн; на 0,09 % - зі зростанням фондовіддачі на 1 коп.; на 1,02 % - з підвищенням середньорічного виробітку продукції на одного працівника на 1 тис. грн; на 0,052 % - при збільшенні частки продукції вищої категорії якості на 1 %. Зі збільшенням тривалості обороту коштів на 1 день рентабельність знижується в середньому на 0,122 %.
П'ятий етап - статистична оцінка і практичне використання результатів кореляційного аналізу.
Щоб переконатися в надійності показників зв'язку і правомірності використання їх з практичною метою, необхідно дати їм статистичну оцінку. Для цього використовують критерій Стьюден-та (*), критерій Фішера (^-відношення), середню помилку апроксимації (є), коефіцієнти множинної кореляції (Я) і детермінації (І)).
Надійність коефіцієнтів кореляції, що залежить від обсягу досліджуваної вибірки даних, перевіряють за критерієм Стьюдента:
де аг - середньоквадратична помилка коефіцієнта кореляції, яку визначають за формулою
УІП-1
Якщо розрахункове значення і більше від табличного, то можна зробити висновок про те, що величина коефіцієнта кореляції є значущою. Табличні значення £ знаходять за таблицею значень критеріїв Стьюдента. При цьому враховують число ступенів свободи (У= п - 1) і рівень довірчої вірогідності (в економічних розрахунках звичайно 0,05 або 0,01).
Надійність рівняння зв'язку оцінюють за допомогою критеріїв Фішера, розрахункову величину якого порівнюють з табличним значенням. Якщо і^розр > ^табл" т<> гіпотезу про відсутність зв'язку між досліджуваними показниками відкидають.
Для оцінювання точності рівняння зв'язку розраховують середню помилку апроксимації. Чим менше теоретична лінія регресії (розрахована за рівнянням) відхиляється від фактичної (емпіричної), тим менша її величина. А це свідчить про правильність вибору форми рівняння зв'язку. У нашому прикладі вона становить 0,0364, або 3,64 %. Враховуючи, що в економічних розрахунках допустима похибка перебуває в межах 5-8 %, можна зробити висновок, що досліджуване рівняння зв'язку досить точно описує залежкості, що вивчаються. З такою самою невеликою похибкою буде робитися і прогноз рівня рентабельності за цим рівнянням.
Про повноту рівняння зв'язку можна судити за коефіцієнтом множинної детермінації. Якщо це значення близьке до 1, то, отже, у кореляційну модель вдалося включити найсуттєвіші фактори, на частку яких припадає основна варіація результативного показника. У нашому прикладі коефіцієнт множинної кореляції дорівнює 0,92, коефіцієнт множинної детермінації - 0,85. Це означає, що зміна рівня рентабельності на 85 % залежить від зміни досліджуваних факторів, а на частку неврахованих факторів припадає 15 % варіації результативного показника.
Це рівняння можна використовувати в економічному аналізі господарської діяльності:
а) для розрахунку впливу факторів на зміну результативного показника;
б) для підрахунку резервів підвищення рівня досліджуваного показника;
в) для планування і прогнозування його величини.
Вплив кожного фактора на приріст (відхилення від плану) результативного показника розраховують так:
ДУ*. = &,-Дх4.
Припустимо, що рівень матеріаловіддачі на аналізованому підприємстві за планом на звітний рік - 2,5 грн, фактично ж - 2,4 грн. Через це рівень рентабельності продукції нижчий від планового на 0,365 %:
ДУХ| =3,65 (2,4 - 2,5)=0,365 %.
Аналогічно підраховують резерви зростання результативного показника. Для цього планований приріст факторного показника помножують на відповідний йому коефіцієнт регресії в рівнянні зв'язку:
Припустимо, що в наступному році намічається зростання матеріаловіддачі з 2,4 до 2,7 грн. За рахунок цього рентабельність підвищиться на
РІУ*( =(2,7-2,4) 3,65 = 1,1%.
Подібні розрахунки роблять за кожним фактором з наступним узагальненням результатів аналізу.
Результати багатофакторного регресійного аналізу можна також використати для планування і прогнозування рівня результативного показника. З цією метою необхідно в одержане рівняння зв'язку підставити плановий (прогнозний) рівень факторних показників.
Уш, = 0,49 + 3,65 2,7 + 0,09 o 85 + 1,02 o 8,5 -- 0,122 20 + 0,052 o 33 = 25,95 %.
Отже, багатофакторний кореляційний аналіз має важливе наукове і практичне значення. Це проявляється в тому, що значно поглиблюється факторний аналіз, унаслідок чого встановлюють місце і роль кожного фактора у формуванні рівня досліджуваних показників і, як результат, - точніше обґрунтовують плани та управлінські рішення, об'єктивніше оцінюють підсумки діяльності підприємств і повніше визначають внутрігосподарські резерви.
1.9. Організація та інформаційне забезпечення економічного аналізу господарської діяльності підприємств
Глава 2. АНАЛІЗ МАРКЕТИНГОВОЇ ДІЯЛЬНОСТІ ПІДПРИЄМСТВА
2.1. Значення і завдання аналізу маркетингової діяльності
2.2. Аналіз попиту на продукцію і формування портфеля замовлень
2.3. Оцінювання ризику незатребуваності продукції
2.4. Аналіз ринків збуту продукції
2.5. Аналіз цінової політики підприємства
2.6. Аналіз конкурентоспроможності продукції
Глава 3. АНАЛІЗ ВИРОБНИЦТВА І РЕАЛІЗАЦІЇ ПРОДУКЦІЇ