9.3. Криві розподілу та способи перевірки гіпотез


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

Закони розподілу являють собою узагальнюючу характеристику варіації в однорідній сукупності. Фактичні розподіли можуть бути графічно зображені емпіричною кривою розподілу. Поглиблюючи аналіз варіації рядів розподілу можна описати закономірність співвідношення варіантів і частот функцією теоретичної кривої. Серед найбільш розповсюджених є крива нормального розподілу. Вона використовується як стандарт для порівняння інших розподілів, a також застосовується при проведенні вибіркового, кореляційно-регресійного, факторного та інших статистичних методів дослідження.

 

Нормальний розподіл близький до інших одновершинних розподілів, а тому його часто використовують як перше наближення при статистичному моделюванні. Деякі розподіли приводять до нормального виду через заміну значень “х" їх логарифмами “lg х". Логарифмічною нормальною кривою можна описати ряд асиметричних розподілів.

Частоти теоретичної кривої нормального розподілу визначають за формулою:

f'=yf i f ( t )^ef ( t ) = і е-т.

Інтервальна функція розподілу має вигляд:

„ х t2    +х t2

„/         2 г ~іг  1 г -^г

F\x)=j^\e lat = j= е lat.

\2.к n   -J2.K

о          -х

Функція “F(x)” табульована, її значення знаходять по спеціальній таблиці.

Аналітично нормальний розподіл описується таким рівнянням:

a-J2n: де f-t - ордината кривої нормального розподілу;

х —X

t - нормоване відхилення, що дорівнює    ;

о

О - середнє квадратичне відхилення;

71 - величина відношення довжини кола до діаметру, л — 3,1415;

е - основа натуральних логарифмів, е ~ 2,7182.

Для перевірки відповідності фактичного розподілу нормальному, частоти фактичного розподілу порівнюють з теоретичними, які характерні для нормального розподілу. 3 цією метою за фактичними даними вираховують теоретичні частоти кривої нормального розподілу. Тобто, фактичну криву розподілу вирівнюють кривою нормального розподілу.

Після розрахунку теоретичних частот виникає потреба перевірки висунутої гіпотези про відповідність або невідповідність того чи іншого теоретичного закону розподілу, прийнятого в якості математичної моделі для емпіричного розрахунку. При цьому ВИХОДЯТЬ 3 того, що якщо відхилення між емпіричними і теоретичними частотами можна вважати випадковими, тоді гіпотеза про те, що прийнятий теоретичний розподіл відповідає даному емпіричному, не відхиляється.

 

Математична статистика дає декілька показників, за якими судять наскільки фактичний розподіл узгоджується з нормальним. Такі показники називають критеріями узгодження. Критерії узгодження виступають у вигляді деякої величини, яка оцінює досліджуване явище з певною ймовірністю.

Статистика використовує критерії узгодження К.Пірсона (%2), А.Н.Колмогорова (X), Б.С.Ястремського (L), В.І.Романовського (R), Р.Фішера (Z), Вілконсона та ін.

Одним із основних і найбільш розповсюджених показників є критерії Пірсона %2 і Колмогорова X.

Критерій х2 запропонував англійський вчений К.Пірсон, статистичну характеристику якого обчислюють за формулою:

Ґ

f і f' - відповідно фактичні і теоретичні частоти.

За спеціальними таблицями визначають ймовірність досліджуваного значення %2 в залежності від числа ступенів вільності. Число ступенів вільності визначається за формулою: k — m - r, m -число груп; r - число обмежених зв'язків. Якщо фактичне %2 менше табличного (%ф<%табл)> Т°ДІ ПРИ прийнятому рівні значимості розходження між фактичними і теоретичними частотами вважаються випадковими, гіпотеза про закон розподілу приймається.

Розглянемо на прикладі застосування критерію %2 для доведення гіпотези про правильність вибору типу розподілу господарств за врожайність озимої пшениці.

Таблиця 9.6 Урожайність озимої пшениці господарств району

де

Кіль-

кість

госпо-

дарств

f

Урожай-

(f-ff

х-х

(f-ff

f(t)

t

ність

х

f

х —X

I —I

 

о

f

озимої

пшениці,

100

8,02

ц/га

 

40-42  4          41        5,72     2,22     0,0339 2          2          4          2,00

42-44  7          43        3,72     1,44     0,1415 11        -4        16        1,45

44-46  28        45        1,72     0,67     0,3187 25        3          9          0,36

46-48  35        47        0,28     0,11     0,3965 31        4          16        0,52

48-50  16        49        2,28     0,88     0,2709 21        -5        25        1,19

50-52  6          51        4,28     1,66     0,1006 8          -2        4          0,50

52-54  4          53        6,28     2,43     0,0208 2          2          4          2,00

X

X

X

X

X

X

Разом:

 

- Z-ґ^ 4672     ,           ;, ,.. .    ,

x = ^^— =      = 46,72 ц/га; о = ^/6,6414 = 2,58 ц/га;

У f 100

^f — = 100     = 77,5 ; f'= V*f— f(t)= 77,5-0,0339 = 2 ;

(f-П

O         2,58     o

5Сф 2-

I

3,02 ; k = m-r = 7-3 = 4; %Ja6jl (p = 0,99) = 13,28

Висновок: оскільки фактичний критерій %? значно менший

Хтавл (8,02 < 13,28), то із ймовірністю 0,99 можна вважати доведеним, що тип розподілу вибраний правильно, тобто, що розподіл господарств за врожайністю озимої пшениці є нормальним.

Покажемо на графіку вирівнювання фактичного розподілу господарств району за врожайністю озимої пшениці теоретичною кривою нормального розподілу (мал. 9.3).

Е

Фактична крива

36

Крива нормального розподілу

32 28 24 20 16 12

4

41 43 45 47 49 51 53

Мал. 9.3. Крива розподілу господарств регіону за урожайністю озимої пшениці

На графіку, поданому на мал. 9.3, простежується досить велика близькість фактичних частот розподілу до теоретичних, що також свідчить про правильність вибраного типу розподілу.

Такого ж висновку можна дійти за допомогою і інших критеріїв узгодження.

 

Критерій узгодження А.Н.Колмогорова (X) оцінює близькість фактичного розподілу до теоретичного шляхом знаходження величини (D), тобто максимальної різниці нагромаджених (кумулятивних) часток (частот) фактичного і теоретичного розподілів.

Критерій Колмогорова визначається за формулою:

X = D • vn , де D - абсолютна максимальна різниця кумулятивних часток D = max|Sd-Sd'|, або частот D = max|Sf -Sf<| емпіричного і

теоретичного розподілів;

п - число спостереження (чисельність одиниць сукупності).

Якщо розподіл задано в частотах, тоді формула матиме вигляд:

X

D

Методику розрахунку цього показника розглянемо на прикладі даних табл. 9.6.

Таблиця 9.7 Розрахунок критерію "X"

 

Номер

груп    Нагромаджені частоти         Відхилення

|sf-sf-|

 

            емпіричні Sf теоретичні Sr  

 

1          4          2          2

2          11        13        2

3          39        38        1

4          74        69        5

5          90        90        0

6          96        98        2

7          100      100      0

D

X

0,5

л/Ї00 Ю

По спеціальній таблиці ймовірностей для критерію узгодження "X" знаходимо, що значенню X — 0,5 відповідає ймовірність 0,9639, це означає, що з ймовірністю 0,9639 можна стверджувати про нормальний розподіл господарств за врожайністю озимої пшениці.

Критерій узгодження А.Н.Колмогорова застосовують ще й для визначення належності двох вибіркових сукупностей "ni" і "п2” до однієї генеральної сукупності, а також для перевірки незалежності двох і більше ознак сукупності.

Критерій узгодженості В.І.Романовського (R) також використовується для оцінки наближення фактичного розподілу до

 

теоретичного. Він визначається за формулою:

R =      .

V2k

Скориставшись розрахунками прикладу за даними табл. 9.6, визначимо критерій узгодження Романовського. R = X2_k = 8102-4 =Jl0^ = V2k V^4 2,8284

Якщо при дослідженні наближення фактичного розподілу до теоретичного величина цього виразу менша трьох (1,42 < 3), це дає підставу для стверджування про можливість розподілу за законом даного розподілу. Тобто розподіл господарств за врожайністю озимої пшениці є нормальним.

Критерій узгодження Б.С. Ястремського (L) використовується для прямої відповіді на питання про міру розбіжності між фактичним і теоретичним розподілом. Для визначення критерію Ястремського використовується критерій Пірсона. В загальному вигляді критерій Ястремського визначають за наступною формулою:

т %2"П L —

yj2n + 4Q де Q = ^-Ц—-Ч - при кшькосп груп, менше 20 (п < 20), доршнює 0,6.

f; (1 — Р; )

За даними попередніх прикладів покажемо розрахунок цього показника.

L_ Х2-п _ 8,02-7 _ 1,02 _р25 ^2n + 4Q 72-7 + 4-0,6 4,02

Так як величина L < 3 (0,25 < 3), то із ймовірністю 0,997 можна стверджувати, що розподіл господарств за врожайністю озимої пшениці є нормальним.

Всі розглянуті нами критерії узгодження дають загальну оцінку ступеня відхилення емпіричного розподілу від нормального, але не визначають його характеру, а тому при суттєвих їх відхиленнях аналіз розподілу доцільно доповнювати характеристиками асиметрії і ексцесу.

Таким чином, для перевірки висунутої гіпотези про відповідність чи невідповідність теоретичного закону розподілу емпіричному можна використати любий із наведених критеріїв, які забезпечують дослідження законів розподілу з різною точністю, надійністю і трудоємкістю.