14.2. Помилки при перевірці статистичних гіпотез. Статистичні критерії і критична область


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

Статистичні гіпотези перевірять за даними вибіркового спостереження, які у зв'язку з обмеженістю обсягу вибірки зумовлюють можливість прийняття неправильних висновків. Тому існує потреба у статистичній перевірці правильності прийнятого рішення. В результаті перевірки статистичних гіпотез можна виявити два випадки, коли було прийняте неправильне рішення, тобто здійснено два роди помилок.

Помилка першого роду - відхилена нульова гіпотеза, хоча насправді вона є вірною.

Помилка другого роду - прийнята нульова гіпотеза, коли насправді правильної є альтернативна гіпотеза.

 

Ймовірність допустити помилку першого роду a - характеризує ризик 1, який ще називають рівнем значущості, а ймовірність допустити помилку другого роду Р - характеризує ризик 2. Так як a більше нуля, тому завжди існує ризик допустити помилку р.

Статистичним критерієм називається правило, за яким нульова гіпотеза або приймається або відхиляється. Для цього використовують випадкову величину, розподіл якої відомий. Залежно від закону розподілу використовують наступні критерії:

а) z-критерій нормального розподілу; б) t-критерій нормального розподілу і розподілу Стюдента: в) F-критерій за законом розподілу Фішера-Снеденора; г) %2 - за законом (х - квадрат) розподілу Пірсона таін.

Для перевірки статистичних гіпотез використовують два види статистичних критеріїв: а) параметричні; б) непараметричні.

Параметричні критерії (z, t, F, %2 та ін.) застосовуються у випадках, коли розподіл випадкової величини у досліджуваній сукупності підпорядкований повному відомому закону.

Непараметричні критерії (критерії знаків, Вілконсона, Уайта та ін.) застосовуються тоді, коли досліджуваний розподіл значно відрізняється від нормального.

Параметричні критерії ефективніші від непараметричних, ще вони використовуються лише для досліджування сукупності 3 нормальним або близьким до нього розподілом, а непараметричні - для будь-якого розподілу при взаємо незалежних даних спостереження.

Вибірковий простір як множину можливих вибіркових значень статистичний критерій поділяє на дві пересічні області:

а) критичну область; б) область допустимих значень (область прийняття нульової гіпотези)

Точки, які розсікають вибірковий простір на область допустимих значень і критичну область називають критичними точками. Критичні області, в свою чергу, поділяються на односторонню ( право-лівосторонні) і двосторонню.

Одностороння (право чи лівостороння) критична область визначається наступними нерівностями: для правосторонньої критичної області k>kKp (kKp _ додатне число), для лівосторонньої критичної області k<kKp (kKp - від'ємне число).

Двостороння критична область визначається нерівностями: k< kbk> k2;

де к2> к1; або |к| > ккР;ДЄ ккр> 0.

де k - відповідний критерій;

ккр - критична точка;

 

k2j ki -права i ліва сторона двосторонньої критичної області.

Вибір однієї з двох критичних областей залежить від конкретних умов і поставленого завдання перед дослідженням. Якщо гіпотеза альтернативна

На: Xj Ф Х2 - використовують двосторонню критичну область, а при гіпотезах

На: X] > Х2 - односторонню (право-чи лівосторонню) критичну область.

Критичну область будують таким чином, щоб вона чітко відрізняла нульову гіпотезу від альтернативної.

Критерій перевірки гіпотез повинен зводити до мінімуму ризик допущення помилок. Тут також важливим є визначення ймовірності недопущення помилки другого роду. Таку ймовірність називають потужністю критерію.

Потужністю критерію називають ймовірність відхилення нульової гіпотези, коли правильною є альтернативна гіпотеза На (1-а), тобто не допускається помилка другого ряду. 3 цією метою потрібно вибрати найпотужніший критерій.

Потужність критерію можна підвищити за рахунок:

а)         збільшення рівня значущості ( від а= 0,10; 0,05; 0,01; 0,001;

0,0001 таін.);

б)         збільшення чисельності вибірки (п).

За результатами перевірки гіпотези роблять відповідні висновки: якщо фактичне значення критерію потрапляє в критичну область, нульова гіпотеза відхиляється, а якщо це значення потрапляє в область допустимих значень, нульова гіпотеза приймається.

Для кожного критерію складені спеціальні статистичні таблиці, за якими знаходять його табличне значення, яке порівнюють із фактичним значенням досліджуваного явища. Якщо фактичне значення критерію за даними вибіркового спостереження менше або дорівнює табличному нульова гіпотеза приймається, а якщо фактичне значення більше табличного - нульову гіпотезу відхиляють.

Наведемо приклади: а) якщо при перевірці впливу певного чинника на результативну ознаку за допомогою t критерію Стьюдента виявиться, що Ц > tT, нульову гіпотезу відхиляють, а вплив чинника на результативну ознаку вважають вірогідним (істотним); б) якщо перевіряють істотність різниці між середніми двох і більше малих вибірок t^ > tT роблять висновок про те, що відмінності між середніми досить значні, а тому вони не можуть бути результатом випадкових

 

причин, такі відмінності визначаються істотними, вірогідними; в) якщо виявиться, що Ц < tT роблять зворотні висновки: досліджуваний чинник на результативну ознаку не впливає, тобто його вплив неістотний, невірогідний, а різниця між середніми це також неістотна, невірогідна, в такому разі нульова гіпотеза приймається.