5.4. Дисперсійний аналіз. Правило додавання дисперсій.


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 

Загрузка...

Основною метою дисперсійного аналізу є виявлення на основі величини загальної дисперсії впливу окремих чинників на варіацію ознаки. Для оцінки частки варіації, зумовленої тією чи іншою ознакою, сукупність розподіляють на групи за тією ознакою, властивість якої досліджується. Це дозволяє розкласти загальну варіацію на 2 дисперсії, з яких одна частина варіації визначається впливом чинника, покладеного в основу групування, а друга – варіацією усіх чинників, крім того, що вивчається. Отже, згідно з правилом додавання дисперсій в дисперсійному аналізі визначають загальну, міжгрупову, внутрішньогрупову дисперсії.

Загальна дисперсія характеризує варіацію ознаки у статистичній сукупності в результаті впливу всіх чинників.

<T2 = х2 -х     (5.19)

Міжгрупова дисперсія показує рівень відхилення групових середніх від загальної середньої, тобто характеризує вплив чинника, покладеного в основу групування.

Y(x-x)2y:

S2 =    '                       (5.20)

Внутрішньогрупова дисперсія (залишкова) характеризує варіацію ознаки в середині кожної групи статистичного групування.

             Y(jt.-JC.)2/;

О2 =——^—             (5.21)

2_lfl

Отже, загальна дисперсія складається із суми внутрішньогрупової дисперсії і міжгрупової дисперсії.

Сутність зв’язку між ознаками характеризує коефіцієнт детермінації, який розраховується як відношення міжгрупової дисперсії до загальної дисперсії:

 

71 zz    S2 а2   (5.22)

Корінь квадратний з η2 -     це емпіричне кореляційне

співвідношення:       

77=л    S2 о1   (5.23)

Кореляційне співвідношення характеризує ступінь наближення зв’язку до функціонального, тобто тісноту кореляційної залежності і коливається від 0 до 1 .

Якщо η2 = 0, то міжгрупова дисперсія дорівнює 0.

Якщо η2 = 1, то міжгрупова дисперсія дорівнює загальній, а середня з групових дорівнює 0. "η" може бути як додатнім так і від'ємним. Якщо факторна і результативна ознака змінюються в одному напрямку, то кореляційне співвідношення буде з знаком “+”.

Правило додавання дисперсій. Загальна дисперсія дорівнює сумі середньої із групових дисперсій і міжгрупової дисперсії.

а2 = С72+д2   (5-24)

Приклад 1:

Відомі дані про розподіл заробітної плати по трьом групам робітників з різним стажем роботи. Визначити:

1.         Середню заробітну плату для всієї сукупності робітників.

2.         Загальну дисперсію і дисперсію заробітної плати.

Таблиця 5.8.

Дані про розподіл заробітної плати по трьом групам робітників з різним стажем роботи

Стаж роботи  Число

робітників(f),

або(n)  Середня зарплата xi  Середнє квадратичне відхилення, грн (<7)

<3        10        500      12

3 - 10  15        600      10

>10      25        700      20

s          50                   

X

500-10 + 15 - 600 + 25•700

630 (грн)

а2 = а2 + да2

2 122-10 + 102-15 + 202-25

 

258,8 (грн)

 

Д2= (500-б30)2.10 + (б00-630)2.15 + (700-630)2.25

6100 (грн)

о2 =258,8+6100=6358,8 (7 = 76358,8=79,7 (грн)

Приклад 2. Визначити дисперсію, середнє квадратичне відхилення і коефіцієнт варіації:

Таблиця 5.9.

Розрахункова таблиця для визначення дисперсії, середнього квадратичного відхилення і коефіцієнта варіації

Групи

робітників

за розміром

зарплати,

грн.     Варіанта (середина інтервалу)

, x, грн.           Число робіт-ників     x —X  (x-;f     (x-xff    x2        x2f

1300-1400      1350    10        -308    94864  948640            1822500          18225000

1400-1500      1450    50        -208    43264  2163200          2102500          105125000

1500-1600      1550    100      -108    11664  1166400          2402500          240250000

1600-1700      1650    115      -8        64        7360    2722500          313087500

1700-1800      1750    180      92        8464    1523520          3062500          551250000

1800-1900      1850    45        192      36864  1658880          3422500          154012500

Разом  —        500      —        —        7468000          —        1381950000

1)         Середня місячна зарплата

- TV 1350 ■ 10 +1450 ■ 50 +1550 ■ 100 +1650 ■ 115 +1750 ■ 180 + 1850 ■ 45

x = ^Щ— =     = 1658,0 грн.

2_f       500

2)         Середній квадрат відхилень від арифметичної:

а1

= 14936 грн.

Т(х-х)2/ 7468000

 

           

^/         500

3)         Середнє квадратичне відхилення

О = у[а* = л/14936 = 122,2 грн. Вибірка типова.

4)         Коефіцієнт варіації:

 (7 122,2

V = = =           100 = 7,4% <33%, отже, сукупність однорідна.

х 1658

5)         Обчислимо дисперсію спрощеним методом.

—; 1381950000

х =       = 2763900

( х )2 = (1658)2 = 2748964

a = х 2 - ( х )2 = 2763900 - 2748964 = 14936 грн