14.5 Перевірка статистичних гіпотез відносно законів розподілу


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

Поряд з перевіркою статистичних гіпотез відносно середніх в окремих випадках потрібно обов'язково перевірити гіпотези щодо характеру розподілу. Розподіли в генеральній сукупності підпорядковується певному статистичному закону. Перевірка статистичної гіпотези заключається в тому, щоб на основі порівняння фактичних частот з теоретичними зробити висновок про відповідність фактичного розподілу теоретичному.

Варіацію рядів розподілу можна описати певною функцією теоретичної кривої. Серед найбільш розповсюджених є крива нормального розподілу. Вона використовується як стандарт для порівняння інших розподілів.

Нормальний розподіл близький до інших одноверпшнних розподілів, а тому його часто використовують як перше наближення при статистичному моделюванні. Деякі розподіли приводять до нормального виду через заміну значень „х" їх логарифмами „lgx”. Логарифмічною нормальною кривою можна описати ряд асиметричних розподілів.

Частоти теоретичної кривої нормального розподілу визначають за формулою:

і =L,I— i(t), де i(t) ===е .

S          V27i

Інтегральна функція розподілу має вигляд:

2 хг -^ 1+? —

F(x) = .— J е 2 dt = .— J е 2 dt.

V27i °  V27I -х

 

Функція F(x) табульована, її значення знаходять по спеціальній таблиці.

Аналітично нормальний розподіл описується таким рівнянням:

у —     є 2

де yt - ордината кривої нормального розподілу;

х —X

t - нормоване відхилення, яке дорівнює    ;

S

S - середнє квадратичне відхилення;

71 - величина відношення довжини кола до діаметру, л =3,1415;

е - основа натуральних логарифмів, е =2, 7182.

Для перевірки відповідності фактичного розподілу нормальному, частоти фактичного розподілу порівнюють з теоретичними, які характерні для нормального розподілу. 3 цією метою за фактичними даними вираховують теоретичні частоти кривої нормального розподілу. Тобто, фактичну криву розподілу вирівнюють кривою нормального розподілу.

Після розрахунку теоретичних частот виникає потреба перевірки висунутої нульової гіпотези про відповідність чи невідповідність теоретичного закону розподілу, прийнятого в якості математичної моделі для емпіричного розрахунку. При цьому ВИХОДЯТЬ 3 того, що якщо відхилення між фактичними і теоретичними частотами можна вважати випадковими, тоді нульова гіпотеза про те, що прийнятий теоретичний розподіл відповідає даному емпіричному, не відхиляється.

Математична статистика дає ряд показників, за якими судять наскільки фактичний розподіл узгоджується з нормальним. Такі показники називаються критеріями узгодження, які виступають у вигляді деякої величини, котра оцінює досліджуване явище з певною ймовірністю.

Статистика використовує критерії узгодження К. Пірсона (%2), А.Н. Колмогорова (X), Б.С. Ястремського (L), В.І. Романовського (R), Р. Фішера (z), Вілконсона та ін.

Одними з основних і найбільш розповсюджених в критерії К. Пірсона %2 і А.Н. Колмогорова X.

Критерій Пірсона %2 обчислюють за формулою:

2_ (f-fT

X — 2-І          „/         ;

I

де: f і f' - відповідно фактичні і теоретичні частоти.

 

За спеціальними таблицями визначають ймовірність досліджуваного значення %2 в залежності від числа ступенів вільності. Число ступенів вільності визначають за формулою: k=m-r, де m - число груп; г - число обмежених зв'язків. Якщо фактичне Y2 менше

Г J 7    '           Т          **Ф

табличного Y2 (Y2 < Y2), тоді при прийнятому рівні значущості

розходження між фактичними і теоретичними частотами вважаються випадковими, нульова гіпотеза про закон розподілу приймається.

Розглянемо на прикладах застосування критерію %2 для доведення гіпотези про правильність вибору типу розподілу господарств за врожайністю гречки. (табл. 14.5).

Таблиця 14.5.

            Розрахункова таблиця         

Урожай-         Кіль-                                                                                    

ність

гречки,           кість госпо-    X         |х-х|     х-х

\ ZZ    

S          f(t)       f           f-Ґ        (f-Ґ)2   (f-Ґ)2

 

           

           

           

           

           

           

           

           

            f

ц/га     дарств                       

                                                          

 

(х)        (f)                                                                                          

13-15  4          14        5,76     2,23     0,0332 2          2          4          2,00

15-17  7          16        3,76     1,46     0,1374 11        -4        16        1,45

17-19  27        18        1,76     0,68     0,3166 25        2          4          0,16

19-21  35        20        0,24     0,09     0,3973 31        4          16        0,52

21-23  17        22        2,24     0,87     0,2732 21        -4        16        0,76

23-25  6          24        4,24     1,64     0,1040 8          -2        4          0,50

25-27  4          26        6,24     2,42     0,0213 2          2          4          2,00

Разом: 100      X         X         X         X         100      X         X         7,39

 19,76 ц/га; S

Sxf 1976

If

I(x-x)2f 666,24

If

%/б,6624=2,58ц/га.

 6,6624;

If- = 100—= 77,5; f;=If--f(t) = 77,5-0,0332 = 2;

S          2,58     S

Ґ; = 77,5-0,1374 = 11;ІТ.Д.

2 ^(f-f)2           г

1,=L    ^ = 7,39; k = m-r = 7-3 = 4; YTm„

Лф       f,          ЛК0.95)

14,86.

 

Оскільки фактичний критерій Y2, значно менший табличних при двох ймовірностях (%ф=7,39 < %^(099) =13,28 < %^(095) =14,86), нульова

гіпотеза приймається, а з ймовірністю 0,99 чи 0,95 можна вважати доведеним, що тип розподілу прийнятий правильно, тобто, що розподіл господарств за врожайністю гречки є нормальним.

До такого самого висновку можна дійти за допомогою непараметричних критеріїв згоди, таких як критерій Колмогорова (X), критерій Уайта, критерій Уїпксона та ін.

Критерій згоди А.Н. Колмогорова (I) оцінює близькість фактичного розподілу до теоретичного шляхом знаходження величини (D), тобто максимальної різниці нагромаджених (кумулятивних) часток (частот) фактичного і теоретичного розподілів.

Критерій Колмогорова визначають за формулою:

Л = D л/n , де: D - абсолютна максимальна різниця кумулятивних часток

D = max S, — S, , або частот D= max |S, — SJ емпіричного i

 d         dl '       f           f           r

теоретичного розподілу;

n - число спостережень (чисельність одиниць сукупності). Якщо розподіл задано в частотах, тоді формула матиме вигляд:

д =—.

УІn

Критерій згоди Колмогорова (Л) простий в розрахунках, не передбачає використання стандартних таблиць для того оцінювання, не потребує визначення показника кількості ступенів вільності. Математичною статистикою доведено, що при кількості вибіркової сукупності більшої за 25 одиниць (п > 25) граничні значення критерію (Xj), які відповідають трьом порогам довірчої ймовірності дорівнюють: при р=0,95, Х.т=1,36; при р=0,99, Xj= 1,63; при р= 0,999, Хт= 1,95.

Якщо А.ф > Хт то з відповідною ймовірністю можна стверджувати, що розбіжність між фактичними і теоретичними розподілами істотні ( суттєві), і, навпаки, якщо А.ф < Хт _ розбіжності між фактичними і теоретичними розподілами вважають не суттєвими, а тип розподілу вибраний правильно.

Методику розрахунку цього показника розглянемо на прикладі данихтабл. 14.5.

 

Таблиця 14.6

4 10

Розрахунок критерію Ш

Номер

групи  Нагромаджені частоти         Відхилення

f f

 

            Емпіричні S f Теоретичні S і           

 

1          4          2          2

2          11        13        2

3          38        38        0

4          73        69        4

5          90        90        0

6          96        98        2

7          100      100      0

D

к

0,4.

/100

Отримана величина фактичного критерію Л,

Ф (/>=0,95)=1,36 '

розбіжності між фактичним і нормальним розподілом є невірогідними, тобто розходження між частотами знаходяться в межах випадкових коливань, а тому можна зробити висновок про те, що розподіл господарств за врожайністю гречки являється нормальним.

Для встановлення вірогідності двох фактичних розподілів, отриманих при вибірці з однієї генеральної сукупності, але з різною кількістю одиниць (fj Ф f 2), критерій Колмогорова (X) обчислюють за формулою:

тому

/L

ff

max

f f

f, +f„

 

ДЄ

If'

f

If'

і

_

суми нагромаджених частот no кожному інтервалу

першого ряду розподілу, поділені на обсяг першої вибірки;

суми нагромаджених частот по кожному інтервалу

другого ряду розподілу, поділені на обсяг другої вибірки;

 

ff

max

максимальне абсолютне значення різниці

частот від ділення нагромаджених частот на обсяг вибірок; fj, f2 - обсяги одиниць вибіркової сукупності першого і другого рядів розподілу.

Звернемось до прикладу. Доповнимо попередню задачу ще одним емпіричним рядом розподілу і обчислимо критерій Колмогорова (Л) для оцінки розбіжностей між емпіричними рядами розподілу 3 неоднаковими обсягами вибірки (табл. 14.7).

Таблиця 14.7 Розрахункова таблиця.

Номер

груп    Частоти          Нагромаджені частоти         Розрахункові данні

 

            f

1          2          f'

1          f'

2          f'

f

1          2

f

2          d =       f f f f    

1

2 3 4 5 6 7       4

27 35 17 6 4    8

14 50

72 38 13

7          4 11 38 73 90 96 100 8 22

72 144 182 193 200   0,04 0,11 0,38 0,73 0,90 0,96 1,00    0,04 0,11 0,36 0,72 0,91 0,96 1,00    0,00 0,00

0,02

0,01 0,01 0,00 0,00

Разом: 100      200      X         X         X         X         X

У таблиці 14.7 наведені два емпіричні ряди розподілу господарств за врожайністю гречки, відібраних з однієї генеральної сукупності у різних обсягах.

В останній графі цієї таблиці максимальна різниця нагромаджених частот становить d max =0,02. Тоді, за вище наведеною формулою фактичний критерій X дорівнюватиме:

f f

100-200

20000

Я, = dmax

Ф

0,02

0,02

0,02-8,16 = 0,163.

f,+f2     V Ю0 + 200    V 300

Фактична величина критерію Л, значно менше граничних критичних значень Л для трьох порогів ймовірності (Л, =0,163 <

 

Л005=1,36< >Я001=1,63< А,0 Ш) = 1,95). Отже, розбіжності між

порівнюваними емпіричними рядами розподілу несуттєві, що свідчить про те, що обидві вибірки репрезентують досліджувану генеральну сукупність.

Якщо під знаком радикала маємо громіздкі числа, критерій (Л) можна обчислити за дещо видозміненою формулою:

XI = d 2 max -^^ = 0,02 2 • ^Ш^ = Q 0004 • 66,6667 = 0,0267,

ф          f,+f2     300

звідси Л. =JA? = ^/0,0267 =0,163.

Критерій згоди В.І.Романовского (R) також використовують для оцінки наближення фактичного розподілу до теоретичного. Його обчислюють за формулою:

л/2~к'

Скористаємось розрахунками наведеними в табл. 14.5

обчислимо критерій R:

7 39-4 3 3900

R = ',   =          = 1,1985 ~1,2.

VT4 2,8284

Якщо при дослідженні наближення фактичного розподілу до теоретичного величина критерію згоди Романовського менше трьох (R=l,2< 3), це дозволяє стверджувати про можливість прийняття цього розподілу за законом його розподілу. Тобто, що розподіл господарств за врожайністю гречки є нормальним.

Критерій згоди Б.С. Ястремського (L) використовують для прямої відповіді на питання про міру розбіжності між фактичним і теоретичним розподілами. Критерій визначають за формулою:

%2-п

L

л/211 + 4Q

(f. -f )2 .           .           .

де: Q= —'■     '■— - при кшькосп груп менше 20 (п < 20), доршнює 0,6.

f,(l-P,)

За даними попередніх прикладів наведемо розрахунок критерію

згоди Ястремського L:

7;39-7 0,39

L = ,    =— = 0,097.

72-7 + 4-0,6 4,02

 

Оскільки, критерій згоди Ястремського значно менший трьох (L=0,097<3), то з ймовірністю 0,997 можна стверджувати, що розподіл господарств за врожайністю гречки є нормальним.

Таким чином, для перевірки гіпотези про відповідність чи невідповідність теоретичного закону розподілу емпіричному можна використати любий з наведених критеріїв, які забезпечать дослідження законів розподілу з різною точністю, надійністю і трудомісткістю.