14.7 Перевірка гіпотези про належність спостережень, що виділяються, до досліджуваної генеральної сукупності


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

Під час проведення статистичного спостереження у складі зібраних даних можуть зустрічатися поодинокі зареєстровані значення ознак, які помітно відрізняються від загального рівня. Такі відмінності можуть виникати внаслідок: а) помилок у проведенні спостереження; б) випадкового збігу різного роду окремих несуттєвих обставин; в) порушення однорідності досліджуваної сукупності.

Механічно вилучати варіанти значень ознак, які сильно відрізняються від середньої арифметичної не можна. Для вилучення спостережень які виділяються із подальшої обробки потрібне застосування обґрунтованих статистичних критеріїв.

Припустимо, що розподіл результатів у звичайних умовах статистичних спостережень відповідає закону нормального розподілу з

параметричними (х) і (о). В результаті проведення однієї із серій

таких спостережень отримані „п" значень Х!<х2<х3<     <хш серед яких

є максимальне значення „хп" чи мінімальне „Хі", що різко відрізняються за своєю величиною від решти „п-1” спостережень. Потрібно вияснити, чи відносяться ці значення до досліджуваної генеральної сукупності, чи їх поява є наслідком якихось випадкових неординарних обставин?

Нульовою гіпотезою в даному випадку є передбачення того, що ,,хп» і „Хі" належать до тієї ж сукупності, як і всі інші „п-1” спостереження або порушення загальних умов формування рівня ознак в сукупності.

 

Перевірка цієї гіпотези заключається у порівнянні за величиною ,,хп» чи „хі" з певною критичною межею „х". Якщо спостереження, що виділяється є найбільше, тоді „хп" порівнюють з верхньою допустимою межею, вибраною таким чином, щоб ймовірність перевершити її дорівнювала рівню значущості. В даному випадку матимемо критичну область такого вигляду:

р (хп > х +1 • а)= а.

Нульова гіпотеза відхиляється, якщо „хп" перевершує за своєю величиною вказану межу.

Якщо ж спостереження, що виділяється є найменше „Хі", його порівнюють з нижньою допустимою межею, яка буде рівною:

х -1 • о, тобто р( Хі < х -1 • а)= a. Якщо одночасно досліджують максимальне і мінімальне значення ознак, то критична область матиме вигляд:

р(|х-х| > t-o) = a.

Розглянемо приклад. Нехай маємо наступні дані, наведені у таблиці 14.8.

Таблиця 14.8.

            Мінімальні значення Максимальні значення         Різниця

сумірних

значень          Середнє значення     Середнє квадратичне відхилення у

вибірці

 

            Хі        Х2       Хп-1   хп        Х2-Хі  Хп- Х„_і         X         О

100      10        16        140      188      6          48        67,3     45,3

Мінімальне значення „Хі" мало відрізняється від наступного за ним значення „х2” у рангованому ряду, тому використаємо критичну

область p(xn > х +1 • a) і перевіримо належність спостереження, що виділяється хп=188 до результатів досліджуваної сукупності.

При рівні значущості a =0,01 значення другої функції нормованого відхилення Лапласа для критичної області яка розглядається дорівнює:

1          • -1- 1 -f(t)={e 2 dt = — 0,01 = 0,49.

2          о          2

За таблицею другої функції нормованого відхилення знаходимо, що цьому значенню відповідає t= 2,33. Таким чином, верхня допустима межа значень ознаки, яка не може бути перевищена з ймовірністю 0,99

 

становитиме 172,8 (67,3+2,33 • 45,3). Значення яке виділяється хп=188, виходить за розраховану межу, тому з ймовірністю 0,99 можна вважати, що хп=188 не належить до досліджуваної сукупності і повинно бути виключене з подальших розрахунків.

На практиці часто виникають випадки, коли параметри

генеральної сукупності "х" і "о" невідомі, а тому для перевірки гіпотези про спостереження які виділяються використовують відповідні параметри вибіркового спостереження. Однак, особливо при малих вибірках, ці оцінки є не цілком надійні. Тому для вилучення спостережень, що виділяються за результатами малих вибірок використовують критерій Ф. Груббса (К).

Критерій Ф. Груббса (К) базується на відношенні двох сум квадратів відхиленнь [8, 188]:

а) для випробовування найбільшого спостереження, яке виділяється у вибірковій сукупності обсягом «п» з нормальним розподілом, обчислюють відношення:

 2

s» .-=1

5"

І0С.-І)

і=\

 

< к.

-к іх,

де Хі< х2< х3<           <хп ; Хп =      ; х = ——;

п-1      п

б) для випробовування найменшого спостереження, яке

виділяється у вибірковій сукупності „п" з нормальним розподілом,

обчислюють відношення:

S

< к,

KXi-Xj)2

Z(xi-x)2

і=1

Е°ХІ

ДЄ Хі

п-1

Обчислену величину відношення (Кф) порівнюють з табличною величиною (Кт) при певному числі спостережень і заданому рівні значущості.

 

Табличний критерій Груббса (Кф) характеризує ту граничну величину розбіжностей у сумах квадратів відхилень, котра з ймовірністю (1- α) пояснюються випадковими причинами.

Якщо фактичний критерій буде рівним або меншим за табличний (Кф< Кт), тоді найбільше чи найменше спостереження не вилучається, а якщо фактичний критерій буде більший за табличний (Кф> Кт), то ймовірність розбіжностей у сумах квадратів відхилень внаслідок випадкових причин дорівнює рівню значущості „ α ” і в силу малої ймовірності вважається подією практично неможливою. В таких випадках, спостереження які виділяються вилучають і в подальпшх розрахунках використовують спостереження (п-1), що залишились.

Розглянемо застосування критерію Ф. Груббса на прикладі за такими даними: відхилення ваги деталей від нормальної наступні (г): 0,06; 0,09; 0,10; 0,11; 0,13; 0,14; 0,15; 0,16; 0,24. Потрібно встановити, чи не містять результати помилки спостереження, передбачаючи, що розподіл ваги деталей в генеральній сукупності відповідає закону нормального розподілу.

Обчислимо необхідні параметри.

Середні відхилення ваги всіх деталей:

х =       '- =— = 0,1311г.

п          9

Вилучимо максимальне відхилення ваги деталі 0,24

- Ех,-хп 1,18-0,24 0,94

Хп =    ■          =         =          = 0,1175 г.

п-1      9-1      8

Суму квадратів відхилення від „ х ”:

Х( Хі -Хп) = [(0,06-0,1311)2 +(0,09-0,1311)2 +(0,10-0,1311)2+

+(0,11-0,1311)2 —(0,13-0,13 II)2 +(0,14-0,1311)2 +(0,15-0,1311)2 + +(0,16-0,1311)2 + (0,24-0,1311)2=0,021289.

Суму квадратів відхилення (п-1) значень від „ х„ ”:

Х( Xt - Хп) =[( 0,06-0,1175)2 +(0,09-0,1175)2 +(0,10-0,1175)2+

+(0,11-0,1175)2 +(0,13-0,1175)2 +(0,14-0,1175)2 +(0,15-0,1175)2 + +(0,16-0,1175)2 =0,007952. Відхилення двох сум квадратів відхилення:

Х(х,-хп)2 ппп7952

Кф =    =          = 0,3735.

Х(х,-х)2 0,021289

 

Таблиця 14.9

Витяг із таблиці Ф. Груббса.

Кількість

спостережень

(п)       При рівні

значущості

(а)        Кількість

спостережень

(п)       Кількість

спостережень

(п)

 

            0,01     0,05    

            0,01     0,05

3 4 5 6 7 8 9 10          0,0001 0,0100 0,0442 0,0928 0,1447 0,1948 0,2411 0,2931           0,0027 0,0494 0,1270 0,2032 0,2696 0,3261 0,3742 0,4154            15 20

25        0,4401 0,5393 0,6071            0,5559 0,6379 0,6923

При кількості спостережень n=9 і рівні значущості 0,01 табличний критерій Кт=0,2411 менший фактичного (Кф=0,3735 > Кт(о,оі)=0,2411), тому відхилення від номінальної ваги 0,24 г потрібно віднести до помилок спостереження, із досліджуваної сукупності вилучити і подальші розрахунки проводити з кількості спостережень, що залишились (п-1=9-1=8).

Критерій Дж. Ірвіна (X) також використовується як один з варіантів перевірки статистичної гіпотези про належність спостережень, які виділяються, до досліджуваних даних генеральної сукупності.

Цей критерій визначається як відношення різниці між „ х„” і

»Хп-і” Д° середнього квадратичного відхилення в генеральній сукупності.

■s х - X ,

А,= — —, дехі<х2<х3<         <хп_і<хп;

a

0 = '

Х(х, -х)2 п-1

 

Таблиця 14.10

Значення Р (X), де X критерій Дж. Ірвіна (витяг)

Обсяг

вибірки

(п)       Значення ймовірності при X, яке дорівнює

 

            1,0       1,1       1,2       1,3       1,4       1,5       1,6       1,7       1,8       1,9       2,0

10        0,152   0,121   0,096   0,075   0,059   0,045   0,038 0,026 0,020 0,015 0,011

20        0,107   0,082   0,062   0,047   0,035   0,026   0,019 0,014 0,010 0,007 0,005

30        0,089   0,068   0,050   0,037   0,027   0,020   0,014 0,010 0,007 0,005 0,004

...                                                                                                                             

60        0,065   0,048   0,034   0,025   0,017   0,012   0,009 0,006 0,004 0,003 0,002

70        0,061   0,044   0,032   0,022   0,016   0,011   0,008 0,005 0,004 0,002 0,002

80        0,058   0,041   0,030   0,021   0,015   0,010   0,007 0,005 0,003 0,002 0,001

У таблиці Дж. Ірвіна наводиться ймовірність того, що різниця між „ Хп” і „ Хп-і” відрізняється від середнього квадратичного відхилення у власне випадковій вибірці обсягом „п" одиниць більше, ніж у X разів.

Використовуючи дані прикладу, наведеного у табл. 14.8, визначимо критерій Ірвіна X:

Х= —  — = — = 1,06.

a          45,3

За даними табл.14.10, при п> 80 і А=1,06 Р(Х)=0,05 (    ).

У зв'язку з малою ймовірністю появи таких розбіжностей між суміжними значеннями (xn-xn_i) у рангованому ряду отриманих даних можна стверджувати, що значення хп=188, не належить до досліджуваної сукупності, і в подальшій обробці інформації використовувати обсяг сукупності, що залишилась, тобто 99 значень (100-1).