6.3. Кореляційний аналіз


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 
135 136 137 138 139 140 141 142 143 144 145 

Загрузка...

Після вибору виду рівняння регресії та знаходження йо-го параметрів розпочинають другий етап КРА - кореляційний аналіз, в рамках якого дають оцінку тісности (щільності) та значимості (істотності) зв’язку.

У поняття “тіснота зв’язку” вкладується оцінка впливу факторної ознаки на результативну та встановлення адекватнос-ті теоретичної залежності між ознаками фактичним даним. Тіс-ноту зв’язку між ознаками оцінюють за допомогою таких харак-теристик: коефіцієнт детермінації; коефіцієнт кореляції (кореля-ційне відношення) та ін.

Коефіцієнт детермінації показує, якою мірою варіація результативної ознаки Y визначається варіацією факторної озна-ки х. Він використовується як при лінійному, так і при неліній-ному зв’язку між ознаками і у випадку парної регресії розрахо-вується за формулою:

2 T(Y-y)2

R=—   .           (6.13)

Коефіцієнт детермінації приймає значення від 0 до 1. Чим ближче R2 до одиниці, тим тісніше зв’язок між ознаками; при R2=0 відсутній лінійний зв’язок між ознаками, при R2=\ не існує кореляційного зв’язку між ознаками.

Коефіцієнт кореляції (кореляційне відношення) показує, наскільки значним є вплив ознаки х на Y. Коефіцієнт кореляції розраховується за формулою:

R = yjR2 .        (6.14)

Він знаходиться в діапазоні 0≤Д≤1; чим ближче R до

одиниці, тим тісніше кореляційний зв’язок між ознаками.

Іноді коефіцієнт кореляції (кореляційне відношення) ро-

зраховують за формулою, яку можна подати у вигляді:

Rj

1-—    .           (6.15)

]

Z(y-y)

 

У випадку лінійного зв’язку між Y та х показник ліній-ного коефіцієнта кореляції визначається за формулою:

Г=                   -                      . (6.16)

І«ТУ2- (ТУ)І^2-&)

Значення г лежить у діапазоні -1≤г≤+1. При г=0 ознаки не можуть мати лінійного кореляційного зв’язку. Ступінь тісно-ти їх лінійної залежності зростає при наближенні до ±1. Коли г>0, то зв’язок між ознаками прямої (при зростанні х зростає Y), при г<0 - обернений (при зростанні х зменшується Y).

Після встановлення тісноти зв’язку дають оцінку значи-мості зв ’язку між ознаками. Під терміном “значимість зв ’язку” розуміють оцінку відхилення вибіркових змінних від своїх зна-чень у генеральній сукупності за допомогою статистичних кри-теріїв. Оцінку значимості зв’язку здійснюють з використанням F-критерія Фішера і t-критерія Ст ’юдента.

Для парної регресії (лінійної та нелінійної) F-критерій Фішера розраховується за формулою:

F = — : —      ,           (6.17)

1          (n-2)

де 1, {n-2) - число ступенів вільності (свободи) чисель-ника і знаменника залежності.

Під терміном “ступінь вільності” розуміють ціле число, яке показує, скільки незалежних елементів інформації у змінних у потрібно для суми квадратів. Це пояснює відповідну диспер-

сію: загальну (σ), міжгрупову (δ2), середню з групових aj (див.

п. 4.4).

Теоретичне значення F порівнюють з табличним (крити-чним) значенням Fтабл. Останнє вибирають із довідкових мате-матичних таблиць і^-критерія Фішера в залежності від ступенів вільності 1, (п-2) і прийнятого рівня значимості α. Якщо F>Fтабл, , то вибіркова сукупність і зв’язок між ознаками є значним.

Для парної лінійної регресії при r=R розрахункові зна-чення t-критерію Ст ’юдента обчислюється за формулою:

 я-2

t = RJ   ,           (6.18)

\1-R2

де (п-2) - число ступенів вільності.

Критерій Ст’ьюдента за даною формулою дає оцінку значимості коефіцієнта кореляції R і істотності зв’язку між ознаками.

Розраховане за формулою (6.18) теоретичне значення t-критерія Ст’юдента порівнюють з табличним tтабл для відпові-дного числа ступенів вільності (n-2) і прийнятого рівня значи-мості α. Табличне значень критерія Ст’юдента вибирається із довідкових математичних таблиць. Якщо t>tтабл, то лінійний ко-ефіцієнт кореляції визначається значимим при характеристиці генеральної сукупності.