10.5. Багатофакторний кореляційно-регресійний аналіз


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

В багатьох випадках на результативну ознаку впливає не один, a декілька факторів. Між факторами існують складні взаємозв'язки, тому їх вплив на результативну ознаку комплексний і його не можна розглядати як просту суму ізольованих впливів.

Багатофакторний кореляційно-регресійний аналіз дозволяє оцінити міру впливу на досліджуваний результативний показник кожного із введених в модель факторів при зафіксованому на середньому рівні інших факторів. При цьому важливою умовою тут є відсутність функціонального зв'язку між факторами.

Математично завдання зводиться до знаходження аналітичного виразу, який найкращим чином відображав би зв'язок факторних ознак з результативною, тобто знайти функцію:

? = f(x1,x2,...,xn).

Найбільш складною проблемою є вибір форми зв'язку, яка виражається аналітичним рівнянням, на основі котрого за існуючими факторами визначаються значення результативної ознаки - функції. Ця функція повинна краще за інші відображати реально існуючі зв'язки між досліджуваним показником і факторами. Емпіричне обґрунтування типу функції за допомогою графічного аналізу зв'язків для багатофакторних моделей практично не придатне.

Форму зв'язку можна визначати шляхом перебору функцій різних типів, але це зв'язане з великою кількістю зайвих розрахунків. Але, беручи до уваги, що любу функцію багатьох змінних шляхом

 

логарифмування або заміни змінних можна звести до лінійного виду, рівняння множинної регресії можна будувати в лінійній формі:

Ух =а0 +а1х1 +а2х2 +... + апхп.

Параметри рівняння знаходять за способом найменших квадратів.

Так, для розрахунку параметрів рівняння лінійної двофакторної регресії

9Х =а0 +а1х1 +а2х2!

де У х — розраховані значення результативної ознаки - функції;

Хі і х2 - факторні ознаки; ао, аі і а2 - параметри рівняння, будується система нормальних рівнянь:

^у = па0+а1^х1+а2^х2;

ЕУХІ = aoSxi +аі2хі2 +агХхіх2;

__ XyX2=aoZX2+alZXlX2+a2ZX2'

Кожний коефіцієнт рівняння показує ступінь впливу відповідного фактора на результативний показник при фіксованому положенні решти факторів, тобто, як із зміною окремого фактора на одиницю змінюється результативний показник. Вільний член рівняння множинної регресії економічного змісту не має.

Звернемось до прикладу. Нехай маємо дані по 10 робітниках підприємства про їхній стаж роботи, тарифний розряд і денну заробітну плату. Потрібно встановити залежність заробітної плати (у) від двох факторів: стажу роботи робітників (хі) і тарифного розряду (х2), для чого складемо розрахункову таблицю 10.17.

Підставляємо отримані дані в систему нормальних рівнянь: 106 = 10а0 + 87а1 + 41 а2; 1183 = 87а0 + 1009а1 + 416а2; 502 = 41а0 + 416а1 + 189а2. Для розв'язку системи нормальних рівнянь поділимо всі члени рівнянь на коефіцієнти при ао:

10,6 = а0 + 8,7 а! + 4,1 а2; 13,6 = а0 + 11,6 aj + 4,78 а2; 12,244 = ао + 10,146 а,г + 4,61 а2. Віднімемо від другого рівняння перше, а від третього рівняння друге:

3 = 2,9 аг + 0,68 а2;

-1,356 — -1,454 аі - 0,17 а2.

 

Таблиця 10.17

 

Номер

робітника

п          Стаж

роботи,

років

Хі        Тариф-

ний розряд

х2        Денна

заробітна

плата,

грн.

У         Ухі       ух2      х12      х2        у2        хіХ2     У X

1

2 3 4 5 6 7 8 9 10       1

3 6 5 8

10 9 15 12 18  2 3 3 2 5 4 6 5 5 6      3

5

7 10

9 13 18 15 20  3

30

80

270

360      6

18 15 14 50 36 78 90 75 120 1 9 36

25 64 100 81 225 144 324     4 9 9 4

25 16 36

25 25 36          9 36

49

324

400      2 9 18 10 40 40 54 75 60 108            2,3

5,0

7,4

5,7

10,8

11,6

12,5

16,6

14,1

20,0

Разом  87        41        106      1183    502      1009    189      1418    416      106,0

В серед-ньому           8,7       4,1       10,6     118,3   50,2     100,9   18,9     141,8   41,6     10,6

Поділимо кожний член обох рівнянь на коефіцієнти при aj і віднімемо від першого рівняння друге: 1,034 = aj + 0,234 а2 0,932 = aj + 0,117 а2

0,102 = 0,117 а2

_ .        0,102

Звідси а2 =     = 0,872 .

0,117

Підставляючи значення параметра а2 в рівняння, отримаємо параметри аі і а0:

аг = 1,034 - 0,234 -0,872 = 0,83; а0 = 10,6 - 8,7 • 0,83 - 4,1 • 0,872 = - 0,196. Рівняння зв'язку, яке визначає залежність результативної ознаки від двох факторних матиме вигляд:

У = -0,196 + 0,83 х1 + 0,872 х2. Таким чином, із збільшенням стажу роботи робітника на 1 рік, денна заробітна плата зросте на 0,83 грн., а збільшення тарифного розряду на 1 дає ріст в заробітній платі в розмірі 0,872 грн.

Підставляючи в це рівняння значення хі і х2, отримаємо відповідні значення змінної середньої (остання графа табл. 10.17), які досить близько відтворюють значення фактичних рівнів заробітної

 

плати. Це свідчить про правильний вибір форми математичного вираження кореляційного зв'язку між трьома досліджуваними ознаками.

Однак на основі коефіцієнтів регресії не можна судити, яка із факторних ознак найбільше впливає на результативну ознаку, так як коефіцієнти регресії між собою не порівняльні, оскільки вони володіють різними одиницями виміру. 3 метою виявлення порівняльної сили впливу окремих факторів і резервів, які закладені в них, статистика вираховує часткові коефіцієнти еластичності (Є;), а також бета-коефіцієнти ((3;) за формулами:

Єі = Еі - 'г Рі = Еі         :

У         °у

де а; - коефіцієнт регресії при і-му факторі; X; - середнє значення і-го фактора; у - середнє значення результативної ознаки; Ох. - середнє квадратичне відхилення і-го фактора; Оу - середнє квадратичне відхилення результативної ознаки.

Часткові коефіцієнти еластичності показують, на скільки відсотків в середньому зміниться результативна ознака із зміною на 1 % кожного фактора при фіксованому положенні інших факторів.

Для визначення факторів, в розвитку котрих закладені найбільші резерви покращення досліджуваної ознаки, з врахуванням ступеня варіації факторів рівняння множинної регресії, вираховують часткові /5-коефіцієнти, які показують на яку частину середнього квадратичного відхилення змінюється результативна ознака із зміною відповідної факторної ознаки на величину її середнього квадратичного відхилення.

Розрахуємо коефіцієнти еластичності і Р-коефіцієнти для нашого прикладу:

х,         8,7

гх = aj ^- = 0,83         = 0,681 ;

У         Ю,6

х,         4,1

є2 = а2 =~= 0,872      = 0,337 .

У         Ю,6

Аналіз часткових коефіцієнтів еластичності показує, що за

абсолютним приростом найбільший вплив на заробітну плату

робітників має стаж роботи - фактор хь із збільшенням якого на 1 %

заробіток приросте на 0,68 %, а при збільшенні тарифного розряду на 1

% заробітна плата підвищиться на 0,34 %.

 

Для розрахунку Р-коефіцієнтів потрібно вирахувати відповідні середні квадратичні відхилення:

<з =

хі

•Jхj — (хj J = д/і00,9 — 8,7 = ^/25,21 = 5,02 ;

Ох = д/х2-^х2] =-у/18,9 —4,1 = ^/2,09 = 1,44 ;

\У _\У/ = д/і41,8 —10,6 = ^/29,44 = 5,42 Тоді:

і..2

п          °х,        5,02

Р! = aj —L = 0,83      = 0,769 ;

Оу       5,42

п          °х,        1,44

р2 = а2 —— = 0,872 = 0,232 .

О         5,42

Аналіз Р-коефіцієнтів показує, що на заробітну плату робітників найбільший вплив з двох досліджуваних факторів має фактор Хі - стаж роботи, так як йому відповідає найбільше значення Р-коефіцієнта.

Для характеристики ступеня тісноти зв'язку в множинній прямолінійній кореляції використовують множинний коефіцієнт кореляції, формула якого має вигляд:

.2         _2

R =

ухгх2

^+Гух.-^ух, Тух, Тхл

1-гі\

де г ;г ігхх -парні коефіцієнти лінійної кореляції, які визначаються за формулами:

yXj - у • X]

ух, —  '

0-0

wy WXj

ух, — V-X,

г =—-  — ■

ух?       '

с с

У         х2

XjX2 -Xj • х2

г          zz        

Х1Х2

х1 х2

Множинний коефіцієнт кореляції показує, яку частину загальної кореляції складають коливання, під впливом факторів хь х2, ..., хп закладених в багатофакторну модель для дослідження.

Множинний коефіцієнт кореляції коливається в межах від 0 до ±1. При R — 0 зв'язок між досліджуваними ознаками відсутній, при R=l функціональний.

 

Перш ніж розрахувати множинний коефіцієнт кореляції, потрібно вирахувати парні коефіцієнти кореляції

ухі —у-Хі 118,3-10,6-8,7

rvx = —           =         = 0,995 ;

а -ах    5,42-5,02

ухо-у-х, 50,2-10,6-4,1

г = —  — =     = 0,864 ;

Су -Сх            5,42-1,44

XJXO-XJ-X, 41,6-8,7-4,1

гх,х2 = =          = °,820 ■

ах ах    5,02 • 1,44

Високі значення парних коефіцієнтів кореляції свідчать про сильний вплив (окремо) стажу роботи і тарифного розряду на заробітну плату робітників.

На основі парних коефіцієнтів кореляції можна розрахувати часткові коефіцієнти першого порядку:

гуХ, _гуХ 'гх,х,           0,995-0,864-0,820     0,286 „ „_,

^l-^J.(l-r2xJ V(l-0,8642)-(l-0,8202) °>293

гух, — гух, ' гх,х,        0,864 — 0,995-0,820 0,0481

W*i) = II         , \ I       -, \ = II ,\ I        ,\ = лл  = °'841 ■

/l-ry2J-(l-r2xJ 7(і-0>9952)-(і-0,8202) °>0572

Як бачимо з розрахунків часткових коефіцієнтів кореляції, зв'язок кожного фактора з досліджуваним показником за умови комплексної взаємодії факторів дещо слабший але достатньо тісний.

Для виявлення тісноти зв'язку між результативною ознакою і обома факторними ознаками одночасно вирахуємо сукупний коефіцієнт множинної кореляції:

г + г — 2г • г • г

yxj       ух2      yxj ух2 Х[Х2

R

1-Гхх

ХіХ-

l0,995-+0,864--2-0,995.0,864.0,820V5:^

V         1-0,820 2        У

R№ = ^l-[(l-r^)-(l-rx2iX2)] = ^l-[(l-0,9952)-(l-0,8202

= Jl- (0,009975 -0,3276) = ^0,9967322 = 0,998.

Вирахуваний коефіцієнт множинної кореляції (R = 0,998) показує, що між двома факторними і результативною ознаками існує достатньо тісний зв'язок.

 

Сукупний коефіцієнт множинної детермінації (R — 0,995) свідчить про те, що варіація заробітної плати робітників на 99,5 % обумовлюється двома факторами (стажем роботи і тарифним розрядом) введеними в кореляційну модель. Це означає, що вибрані фактори суттєво впливають на досліджуваний показник.

3 метою більш глибокого економічного аналізу збільшують число суттєвих факторів, які включають в модель досліджуваного показника і будують багатофакторні рівняння регресії. їх розраховують з допомогою персональних комп'ютерів.