10.6. Непараметричні показники тісноти зв’язку


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

Поряд з вивченням кореляційної залежності між кількісними показниками статистика встановлює також зв'язки і між якісними ознаками.

При вивченні залежності між якісними ознаками встановлюють наявність зв'язку і вимірюють його тісноту.

Для вимірювання тісноти зв'язку між двома ознаками, які мають альтернативний вираз застосовується коефіцієнт асоціації. запропонований статистиком Юлом.

3 метою розрахунку коефіцієнта асоціації використовують таблицю, яка складається з чотирьох комірок позначених латинськими літерами a, b, с, d. Кожна з комірок відповідає відомій альтернативі тієї чи іншої ознаки. Така таблиця має вигляд:

Таблиця 10.18

 

Ознака            A         не A    IB

В         a          b          a + b

не В    с          d          c + d

Z A      а + с    b + d    a + b + c + d

Коефіцієнт асоціації визначається за формулою:

ad-be

Q

ad + bc

Розглянемо конкретний приклад. Досліджується вплив мінеральних добрив на урожайність озимої пшениці. 3 цією метою нами побудована таблиця, в якій розставлені розміри посівів в кожній групі (га).

Таблиця 10.19 Залежність урожайності озимої пшениці від внесення мінеральних

добрив в грунт

 

Ділянки за урожайністю      Внесені

добрива          He внесені добрива  Всього

Підвищили урожайність      110      10        120

He підвищили урожайність 10        70        80

Всього            120      80        200

 

Коефіцієнт асоціацій дорівнює:

 ad-be 110-70 —10-10

Q =      =          = 0,974 .

ad + bc 110-70 + 10-10

Отже, спостерігається досить тісний зв'язок між удобренням ділянок і урожайністю озимої пшениці.

Для дослідження кореляції альтернативних ознак Юл запропонував також і другий коефіцієнт - коефіцієнт колігації, який визначається за формулою:

vad-vbc

W =    

Vad + vbc За даними таблиці 10.19 коефіцієнт колігації дорівнює:

vad-vbc v7700-vl00 77,7

W = j= 7= = . .           =          = 0,795 .

Vad+Vbc V7700+V100 97,7

Чотири кліткова таблиця дозволила К.Пірсону винайти ще

інший показник, який називається коефіцієнтом контингенції. Він

розраховується за формулою:

ad-be 7600 7600

1С = .  = .        =          = 0,792 .

J(a + b)(c + d)(a + c)(b + d) V120-80-120-80 9600

Коефіцієнт колігації як i коефіцієнт контингенції оцінюють зв'язок між внесенням мінеральних добрив в Грунт і урожайністю озимої пшениці більш обережно, однак показують достатньо сильний зв'язок між цими ознаками.

Величина цих коефіцієнтів як показників зв'язку тлумачиться так само, як і коефіцієнт кореляції.

Коефіцієнти асоціації, колігації і контингенції є свого роду коефіцієнтами кореляції для якісних ознак. Причому завжди: Q>W>K.

В тому випадку, коли обидві взаємозв'язані ознаки розбиті більш ніж на дві групи, для вимірювання тісноти зв'язку застосовуються показники взаємного спряження, запропоновані К.Пірсоном і А.Чупровим.

Коефіцієнт взаємного спряження К.Пірсона вираховується за формулою:

С]

Ф2

 

Ь2+і

де ф (грецька буква "фі") - сума квадратів частот кожної стрічки, розділеної на суму частот по графах, і в свою чергу, на суму частот по стрічці без одиниці.

 

Розглянемо приклад. Потрібно дослідити вплив термінів посівів ярої пшениці на врожайність. За обома ознаками сукупність із 500 дослідних ділянок розбиваємо на три групи (табл. 10.20).

Таблиця 10.20

 

Врожай          Терміни ПОСІВІВ (fj)           Разом

(Fi)

 

            пізній  середній         ранній

 

Низький Середній Високий            40

55 5     55 215 30        5

30 65   100 300 100

Разом (F;)       100      300      100      500

Визначаємо ф2 за формулою:

 

+

100 100

ф2=У^ Ь

F; • Fj

 

100 100

+

 

300 100

+

^^

100-300

+

 

+

 

300-300

 

100-300

 

100 100

+

 і,с\2

300 100

+

 А^

100 100

-1 =

= 1,3627 -1 = 0,3627.

Отже, коефіцієнт взаємного спряження К.Пірсона буде дорівнювати:

г-,        Ф         10,3627 ;. -,,-

Ц = . —т         = л       = л/"'2662 = 0,516 .

V ф +1 V 1,3627

Даний коефіцієнт свідчить про досить тісний зв'язок між урожайністю ярої пшениці і термінами посіву.

Коефіцієнт взаємного спряження А.Чупрова визначається за формулою:

С2

 

Ф2

V (КІ -і)-(к2 -і)

де Кі - число груп по графах; К2 - число груп по стрічках.

За даними попереднього прикладу цей коефіцієнт становитиме:

0,363

 0,301.

С2

ф2 V (Kj -І)-(К2 — І) V 2-2

 

Результат отриманий за коефіцієнтом взаємного спряження А.Чупрова більш точний, оскільки він враховує число груп по кожній з досліджуваних ознак. Його вигідно використовувати і при більшому розподілі одиниць сукупності на групи по взаємозв'язаних ознаках. Коефіцієнт взаємного спряження К.Пірсона застосовується в основному у випадку квадратної таблиці, тоді як А.Чупрова -придатний для вимірювання зв'язків в прямокутних таблицях.

Вважається, що вже при значенні коефіцієнтів взаємного спряження 0,3 можна говорити про тісний зв'язок між варіацією досліджуваних ознак.

Якщо одна із взаємозв'язаних ознак має кількісний вираз, a друга - альтернативний, то показником тісноти зв'язку виступає бісеріальний коефіцієнт кореляції (бі-серія - дві серії). Цей коефіцієнт визначається за формулою:

у,-у2 pq

г =       ,

°у         z

де У] - середня ознака по першій альтернативній групі;

у2 — середня ознака по другій альтернативній групі;

О - середнє квадратичне відхилення по обох групах;

р - доля першої групи;

q - доля другої групи;

z - ордината нормальної кривої, яка ділить її площу у відношенні

р : q (значення z для різних р наведені в табл. 10.21).

Таблиця 10.21 Значення z для бісеріального коефіцієнта кореляції при різних р. (Для р < 0,50 знаходять z для q — 1 - р)

 

р          0          1          2          3          4          5          6          7          8          9

0,5       0,3889 3988    3984    3978    3969    3958    3944    3928    3909    3888

0,6       3863    3837    3808    3776    3741    3704    3664    3622    3576    3528

0,7       3477    3429    3366    3307    3244    3178    3109    3037    2961    2882

0,8       2800    2714    2624    2531    2433    2332    2226    2116    2000    1880

0,9       1755    1624    1487    1343    1191    1031    0862    0680    0484    0267

Прикладом такого взаємозв'язку може служити наступна дворядна таблиця.

 

Таблиця 10.22 Взаємозв'язок між процентом виконання норм виробіток і кваліфікацією робітників.

 

Кваліфікація робітників        Процент виконання норм (у)          Всього робітників

 

            до 100 100-110          110-120          120-130          понад 130     

 

Закінчили ПТУ (fj)    8          36        34        50        72        200

He закінчили ПТУ (f2)          20        18        30        26        6          100

Разом (f)         28        54        64        76        78        300

Уі

Розрахуємо потрібні дані для нашого прикладу:

Xyfi 24420      _ ХУ^2 11300

 122,1 %; у2

^=                   -=       

100

ІЇ2

113,0 %;

Zyf

Zj(y-y3) f 50439

300 0,33 ; z — 0,3622;

168,13;

119,1 %; σ^

Уз

 

W

35720 300

200

σу = д/168,13 = 12,966 %; р = ^ = 0,67 ; q

300      300

Уі -У? РЯ 122,1-113,0 0,2211

г =

—        --=     = 0,428

σ          z          12,966 0,3622

Бісеріальний коефіцієнт кореляції показує достатньо тісний зв'язок між кваліфікацією робітників і виконанням норм виробіток.

Цей вплив може бути оцінений також через бісеріальний

коефіцієнт, розрахований за іншою формулою:

Уі -Уз  122,0-119,1

г, =

0,316;

12,966^/1,5-1

σ

 

σ

у2 -Уз

 

113,0-119,1

           

12,966 V3 - 1

 -0,333,

де Гі - показує прямий зв'язок виконання норм виробіток робітниками які закінчили ПТУ;

г2 - обернений зв'язок виконання норм виробіток робітниками які не мають профтехосвіти.

 

Оцінка емпіричних мір тісноти зв’язку для всіх непараметричних показників здійснюється через t-критерій Стьюдента.