Warning: session_start() [function.session-start]: Cannot send session cookie - headers already sent by (output started at /var/www/nelvin/data/www/ebooktime.net/index.php:6) in /var/www/nelvin/data/www/ebooktime.net/index.php on line 7

Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent (output started at /var/www/nelvin/data/www/ebooktime.net/index.php:6) in /var/www/nelvin/data/www/ebooktime.net/index.php on line 7

Warning: file_get_contents(files/survey) [function.file-get-contents]: failed to open stream: No such file or directory in /var/www/nelvin/data/www/ebooktime.net/index.php on line 82
6.4. Аналіз зв’язку між атрибутивними ознаками : Статистика : Бібліотека для студентів

6.4. Аналіз зв’язку між атрибутивними ознаками


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 
135 136 137 138 139 140 141 142 143 144 145 

Загрузка...

Використання регресійного та кореляційного аналізу вимагає, щоб всі ознаки були кількісно виміренними. Методи КРА, засновані на використанні кількісних параметрів розподілу

(середні величини, дисперсії), називають параметричними ме-тодами.

Разом з тим в статистиці, особливо при проведенні соці-ологічних досліджень, виникає потреба оцінки тісноти зв’язку між якісними (атрибутивними) ознаками. Проблему оцінки тіс-ноти зв’язку між атрибутивними ознаками вирішують непара-метричні методи. Сфера їх використання значно ширша в зрів-нянні з параметричними методами, тому що не вимагається ви-користання умови нормального розподілу результативної змін-ної, не ставиться задача представлення залежності між атрибу-тивними ознаками відповідним рівнянням. Тут мова йде тільки про встановлення зв’язку та виміру його тісноти.

Взаємозв’язки між атрибутивними ознаками аналізують-ся за допомогою таблиць взаємної спряженності (співзалеж-ності). Вони описують комбінаційні розподіли сукупностей за факторною ознакою х та результативною у. Наприклад, резуль-тати соціологічного опитування населення щодо намірів узяти участь на ринку цінних паперів: розподіл респондентів опиту-вання за віком розглядається як факторна ознака х, а їх розподіл за схильністю до ризику (ризиковий, обережний, неризикова-ний) – як результативна ознака у. При наявності стохастичного зв’язку оцінка його тісноти ґрунтується на відхиленнях фактич-них частот (часток) fij від Fij, пропорційних підсумковим часто-там:

ff

Fij = io oj ,       (6.19)

n де fiо – підсумкові частоти за ознакою х; foj – підсумкові частоти за ознакою у; n – обсяг сукупності. Очевидно, що

mx       my

n = ∑ fio = ∑ f jo ,       (6.20)

i=1       j=1

де mx, my – відповідно кількість груп за ознаками х та у.

Абсолютну величину відхилень фактичних часток fij від пропорційних Fij ( fij - Fij ) характеризують статистичним крите-рієм χ2 („хі”-квадрат):

 rn        2

Z(f>j~F>j)2 ZZ fu

(6.21)

x^YL—=«

l JioJoj

--i r-

1 W     F ij

За відсутністю стохастичного зв’язку χ2=0. Для висновку про тісноту зв’язку теоретичне значення χ за формулою (6.21) порівнюється з табличним χтабл . Останній вибирається із довід-кових математичних таблиць критерія “хі”–квадрат в залежності від прийнятого рівня значення α (0,01 або 0,05) та ступенів віль-ності к=(тх-1)(ту-1). При χ2>χтабл роблять висновки про наяв-ність тісноти зв’язку між ознаками х і у.

Відносною мірою тісноти стохастичного зв’язку між ознаками служать також:

коефіцієнт взаємної спряженності Чупрова

nJ(mx -1)(ту -1)

С

II

х2

; (6.22)

коефіцієнт взаємної спряженності Крамера (при т≠ту)

х2

С

(6.23)

л

^(ттп-1)

де ттіп - мінімальне число груп (тх або ту).

Значення коефіцієнта С коливається від 0 до 1 і тіснота зв’язку тим сильніша, чим ближче С до 1.

Достатньо часто в практиці статистичних досліджень аналізуються зв’язки між альтернативними ознаками, які пред-ставлені групами з протилежними (взаємовиключними) харак-теристиками. Тісноту зв’язку у цьому випадку можна оцінювати за допомогою коефіцієнта асоціації Д. Юла та коефіцієнта ко-нтингенції К. Пірсона.

Для розрахунку вказаних коефіцієнтів вимірювання тіс-ноти зв’язку між альтернативними ознаками використовується таблиця взаємної спряженності у вигляді кореляційної таблиці, яка носить назву “чотирьохклітинкової таблиці”:

 

a          b

1 с \     d

a + c    b + d

Таблиця 6.1

a + b

c + d

a + b + c + d

При застосуванні таблиці 6.1 з частотами a, Ь, с, d коефі-

цієнт асоціації (Ка ) обчислюється за формулою:

ad-be

Ка =    .           (6.24)

ad + bc

При Ка>0,3 між вивчаємими якісними ознаками існує кореляційний зв’язок.

У випадках, коли один з показників чотирьохклітинної

таблиці відсутній, величина коефіцієнта асоціації буде дорівню-

вати одиниці, що дає завищену оцінку тісноти зв’язку між озна-

ками. У цьому випадку необхідно розраховувати коефіцієнт

контингенції (Кк):

ad-be

Кk ===           (6.25)

^(а + b)(b + d)(a + c)(c + d)

Коефіцієнт контингенції знаходиться в межах від -1 до +1. Чим ближче Кк до (+1) або (-1), тим тісніше зв’язок між ви-вчаємими ознаками; Коефіцієнт контингенції завжди менше ко-ефіцієнта асоціації.

Для визначення зв’язку як між кількісними, так і якісни-ми ознаками при умові, що значення цих ознак впорядковані за ступенем зменшення або збільшення (ранжировані), може бути використаний коефіцієнт кореляції рангів Спірмена. Рангами називають числа натурального ряду, які надаються в балах за певними критеріями елементам сукупності. При цьому ранжи-рування проводиться за кожною ознакою окремо: перший ранг надається найменшому значенню ознаки, останній - найбіль-шому. Кількість рангів дорівнює обсягу сукупності. Перевагою цього підходу є те, що при відсутності вимоги нормального роз-поділу рангові оцінки тісноти зв’язку доцільно використовувати для сукупностей невеликого обсягу.

Показник рангової кореляції - коефіцієнт кореляції ран-гів Спірмена - розраховується за формулою:

6^dj

p = l     —        ,           (6.26)

n(n -1)

де dj - різниця між рангами за однією та другою ознакою {dj=Rxj-Ryj); п - кількість одиниць у ряді. Якщо d=0, р=\ - існує тісний прямий зв’язок. Якщо першому рангу за розміром однієї ознаки відповідає останній ранг за розміром другої ознаки, дру-гому рангу - предостанній ранг другої ознаки тощо, то р=-1 і існує тісний обернений зв’язок. Якщо значенняр близько до ну-ля, то зв’язок слабий або його взагалі немає.