6.2.4. Дисперсійний аналіз


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 

Загрузка...

Дисперсійний аналіз — це статистичний метод, що дозво-ляє підтвердити або спростувати гіпотезу про те, що дві вибірки даних відносяться до однієї генеральної сукупності. Специфічною особливістю дисперсійного аналізу є особливі методи виміру коливання показників.

Дисперсійний аналіз часто використовується разом з ме-тодами групування. Задача його проведення в цих випадках складається в оцінці суттєвості розходжень між групами.

Після групування сукупності за факторною ознакою й знаходження в кожній групі середньої величини результатив-ної ознаки розраховують відповідні дисперсії; у дисперсійно-му аналізі суму квадратів відхилень від загальної середньої на-зивають дисперсією комплексу (D2), або загальною дис-персією:

D 2 =Е(х-х) 2 = £х2 -^)2

п

Загальна дисперсія розчленовується на дисперсію за фак-торами, факторну DF , аналогічну міжгруповій дисперсії, і за-лишкову D2 , аналогічну внутрішньогруповій дисперсії:

^=Е(хг-х)2иг;

D20=Z(x-x)2D2-D2p,

де: х — загальна середня;

ХІ — групові середні; щ— чисельність груп.

Величина відношення факторної дисперсії до залишкової D2 ~2 показує вплив факторної ознаки. Для обґрунтування

Розділ вірогідності висновків попередньо визначають дисперсії, об-числені на один ступінь свободи (а2).

При однофакторному комплексі: дисперсія по комплексу

Е(х-х)2

_2

Г) =

к

У

факторна дисперсія

2 Е(хг-Х)2

0 —    

к

залишкова дисперсія

2 Е(х-Хг)2

0 —    

kz

де ky, k F, kz — відповідні числа ступенів свободи.

Для відношення дисперсій, обчислених на один ступінь

ó2F свободи, F= 2 P , Фішер знайшов закон розподілу

ó0 ймовірностей і обчислив таблиці, що дозволяють визначити

критичне значення F — випадкове перевищення якого ма-лоймовірно. Якщо F > F , то робиться висновок про вірогідність впливу факторної ознаки, покладеної в основу

групування, на результативний.

Наприклад, провести дисперсійний аналіз однофакторно-го комплексу. Вихідні дані для аналізу наведено в табл. 6.6

Аналіз однофакторного комплексу

Таблиця 6.

Терміни збору врожаю         Число ділянок           Врожай пшениці (ц з 1 га) на окремих ділянках (х)

Своєчасно     8          16,5; 16,2; 18,9; 20,1; 19,3; 10,1; 12,8; 15,0

З деяким запізненням           13        16,7; 16,3; 14,0; 15,0; 16,7; 12,4; 7,9; 9,8; 14,4; 10,8; 11,1; 13,0; 10,7

З сильним запізненням        9          10,7; 9,0; 13,9; 9,4; 11,9; 11,3; 1,5; 9,7; 7,4

Визначаємо:

loc = 16,5+16,2+...+9,7+7,4 = 391,7;

2л^=16,52 + 16,22 + ... + 9,72 + 7,42 = 5456,01;

х= 391,7 = 13,05; 391,72 30

(2>)

2          2

= 5456,01-

= 341,72.

п

D = £(х-х) =£х За групами:

1х3

5>2

;

Х1= £Х1 ; Х2

 

; х3

«1 =16,11        п2= 12,98       щ= 10,44

Е(х, -х)2и, = Е(х1 -х)2^ = Е(х2 -х)2п2 = Е(х3 -х)2«3 =131,67.

Тоді сума квадратів відхилень всередині груп визначиться як різниця

^(x-x)2^(x-x)2-^(xi-x)2n^ 341,72 -131,67 = 210,05. Зведемо всі отримані результати до табл. 6.7.

Розділ 6

Таблиця 6.7

Зведена таблиця результатів дисперсійного аналізу

 

Джерела варіації        Сума квадратів відхилень    Число

ступенів

свободи

k          Дисперсія на од-ну ступінь свободи          Відношення

дисперсій

на одну

ступінь

свободи

σ2F

F= 2

σO       F при ймовір-ності

 

           

           

           

           

            0,95     0,99

Системна       131,67 kx = r -\

=3-1=2            al = 131'67 =65,83

F 2       8,46     3,35     5,49

Залишкова     210,05 kz=n-r= 30-3=27        al = 210'05 =7,78

° 27     1          База по-рівняння

Загальна         341,72 k=n-l= 30-1=29          -          -          -          -

По відповідній математичній таблиці знаходимо дані для граф 6 і 7 наведеної вище таблиці. Величина F > F. Це дає підставу зробити висновок про цілком достовірний вплив строків збирання на розмір урожаю.