§6. Задачі математичної статистики


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 

Загрузка...

Математична статистика розробляє методи отриман-ня, математичного опису і обробки експериментальних даних, які дають змогу за результатами випробувань робити імовірнісні висновки про закономірності випадкових масових явищ. Задачі математичної статистики в певній мірі є зворотніми до задач теорії ймовірностей. Основні задачі математичної статистики такі:

а)         оцінка невідомої функції розподілу;

б)         оцінка невідомих параметрів розподілу;

в)         статистична перевірка гіпотез;

г)         довірчі інтервали.

Генеральною  сукупністю  називають  всю  сукупність

однорідних об’єктів, яку вивчають відносно деякої кількісної або якісної ознаки, що характеризує ці об’єкти.

Вибірковою сукупністю або вибіркою називають сукуп-ність випадково відібраних об’єктів з генеральної сукупності.

Повторною називають вибірку, при якій відібраний об’єкт (перед вибором наступного) повертається в генеральну сукупність. Безповторною називають вибірку, при якій відібраний об’єкт в генеральну сукупність не повертається. Репрезентативною називають вибірку, яка вірно представ-ляє пропорції генеральної сукупності. Значення ознаки xk у окремих членів сукупності називають варіантами, а числа, які показують, скільки разів повторюється кожна варіантна – частотами nk. Варіаційний ряд – сукупність елементів вибірки, записаних в порядку неспадання, які позначають x1,

ni

x2, …, xn і відповідних їм частот. Частоти ni або відносні

n

частоти варіант називають їх вагами.6.1. Графічне зображення вибірки

Функцію розподілу F(x) генеральної сукупності нази-вають теоретичною функцією розподілу. Вона визначає імовірність події Х < х.

Емпіричною функцією розподілу (функцією розподілу вибірки) називають функцію F*(x), яка визначає для кожного значення х відносну частоту події Х < х:

F*(x) = nx/n (6.1.1),

де пх - число тих хи для яких хі < х; п - об’єм вибірки. При великих п F*(x)& F(x)  або  lim />|F(x) - F * (x) \<s]=l

(6.1.2) (є>0). Властивості емпіричної функції розподілу:

1) значення емпіричної функції належать проміжку [0; 1]; 2) F*(x) - неспадна функція; 3) якщо Xj і хк - відповідно найменша і найбільша варіанти, то F*(x) = 0 при х < Xj і F*(x) = 1 при х<хк. Графік емпіричної функції - східчаста лінія, яка має розриви (скачки) в точках хІ5 х2 і т. д. (рис. 6.1.1).

F(x)0

Х-і       х2

xs-l

xs

X

Рис. 6.1.1. При цьому виконуються такі рівності:

к=\

(6.1.3);  ^Wk = 1.(6.1.4)

к=\Дискретний варіаційний ряд або ряд розподілу частот може бути записаний у вигляді таблиць (табл. 6.1.1).

Таблиця 6.1.1.

Xi        X\        Хг        …        Xk       …        xs

ПІ        П\        Щ        …        Щ        …        ns

X,        X\        Xl        …        Xk       …        xs

n

W1=-L n         W\       w2       …        wk       …        ws

Коли варіанти є неперервною випадковою величиною або при великій кількості різних варіант, коли дискретний розподіл є малозручним, застосовують інтервальне групу-вання, суть якого полягає в наступному. Весь розмах зміни ознаки від найменшої (xmin) до найбільшої (xmax) розбивають на певне число інтервалів ( x1,x2 ), ( x2,x3 ), ... ( xs-1,xs ) або розрядів і підраховують частоти варіант, що відповідно рівні n1 , n2 , … ns .

Інтервальний варіаційний ряд, або інтервальний статис-тичний ряд розподілу записують у вигляді таблиці (табл.. 6.1.2).

Таблиця 6.1.2.

Інтервал         [Xi-X2]           [x2-x3]            …        [xkA-xk]         …        [xsA-xs]          z

ПІ        П\        Щ        …        Пк       …        ns         n

n

W = — n         W\       w2       …        wk       …        ws        1

Інтервальний ряд може бути умовно перебудований в дискретний шляхом заміни кожного інтервалу його середи-ною. На практиці найчастіше розглядають інтервали одна-кової довжини (звичайно к = 6-20). Кількість інтервалів на-ближено можна визначити з співвідношення к < 5\gn (6.1.5), де п - об’єм вибірки або за формулою Стерджеса:

^ = l + 3,3221g^ (6.1.6).Для графічного зображення статистичних розподілів ви-бірки будують полігон і гістограму.

Якщо на площині нанести точки (x1, n1), (x2, n2), … (xs, ns) і з’єднати сусідні точки відрізками прямих ліній, то отримана ламана лінія називається полігоном частот або частотним багатокутником (рис. 6.1.2). Якщо на площині нанести

n2 n

точки

x2,

n

s

n

і з’єднати сусідні точ-

ns-\

ки відрізками прямих ліній, отримаємо полігон відносних частот. Для побудови полігонів частот (відносних частот) на осі абсцис відкладають варіанти, а на осі ординат – відповідні їм частоти чи відносні частоти.

xl       x2

XS-\

Xs Xj

Рис. 6.1.2. Інтервальний статистичний ряд розподілу зображений графічно, називається гістограмою частот, яка будується наступним чином. Для кожного частотного інтервалу довжиною h знаходять суму частот варіант ni, що попадають в і-тий інтервал. По осі абсцис відкладають інтервали [xi, xi+1] і на кожному з них будується прямокутник площею ni, тобто

висотою l

 

h

(рис. 6.1.3). Площа гістограми частот рівна

сумі всіх частот, тобто об’єму вибірки n.

Для побудови гістограми відносних частот на осі абсцис відкладають часткові інтервали [xi, xi+1] і на кожному з них

ni         Wi

будується   прямокутник   висотою   li

=      .   Площа nh     hгістограми відносних частот рівна сумі всіх відносних частот, тобто одиниці.

 

h                                                                                                       

1          -                                             

6                                                        

5                                                                    

4                                                                    

3                                                                               

2                                                                                           

1                                                                                                       

0          5          10    15    20    25    30    35    40       X

                                               Рис.     6.1       3.