3.8. Складні групування


Повернутися на початок книги
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 
105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 
120 121 122 

Загрузка...

Зв'язки між явищами суспільного життя складні і різноманітні, вони залежать від багатьох причин, в яких переплетені різні, часто суперечливі, тенденції. Для повнішого і глибшого дослідження процесів розвитку цих явищ, потрібно групувати дані за двома і більше ознаками. Такі групування в статистиці називаються складними.

 

Найбільш розповсюдженим видом складних групувань є комбіновані групування, при яких розчленовані на групи сукупності піддаються подальшому дрібненню на підгрупи за іншими додатковими ознаками.

Отже, комбінованими в статистиці називаються групування, коли утворені групи за однією ознакою, діляться потім на підгрупи за однією і більше ознаками, взятими в комбінації.

Одночасне використання декількох групувальних ознак дозволяє виявити і порівняти такі відомості і зв'язки між досліджуваними ознаками, які не можна знайти через ізольовані групування за рядом групувальних ознак. Прикладом комбінованого групування може служити таблиця 3.12.

Таблиця 3.12 Групування 40-а підприємств машинобудування за вартістю промислово-виробничих фондів і чисельністю промислово-виробничого персоналу

 

Групи

підприємств за

вартістю

промислово-

виробничих

фондів,

млн. грн.        Підгрупи за чисельністю промислово-виробничого персоналу, чол.   Число

підпри-

ємств  Середньо-

річна

вартість

промислово-

виробничих

фондів,

млн. грн.        Середньо-

спискова

чисельність

промислово-

виробничого

персоналу,

чол.     Товарна

продукція в

середньому

на одне

підпри-

ємство,

млн. грн.

I 10 - 160        I до 15000      18        80,7     6540    103,5

 

            II 15000 і більше        7          102,7   16258  166,4

Всього по групі         25        86,9     9262    121,2

II 160 - 310     I до 15000      3          184,7   12633  142,7

 

            II 15000 і більше        5          230,0   20764  223,4

Всього по групі         8          213,0   17715  193,1

III 310 - 460   I до 15000      3          328,0   12850  359,3

 

            II 15000 і більше        4          380,5   22077  513,7

Всього по групі         7          358,0   18123  447,6

Разом: 40        159,5   12503  192,7

В таблиці чітко простежується залежність результативного показника (товарної продукції) від вартості промислово-виробничих фондів. Підсумкові дані по групах показують, що із збільшенням

 

вартості промислово-виробничих фондів зростає середня величина товарної продукції (121,2; 193,1; 447,6).

За даними таблиці також спостерігається залежність обсягу товарної продукції від чисельності промислово-виробничого персоналу. Для цього потрібно розглядати зміну результативного показника по підгрупах. В підгрупах всіх груп товарна продукція в середньому на одне підприємство зростає.

Таким чином, комбіноване групування за двома ознаками дозволяє розглянути вплив обох групувальних ознак на результативний показник.

В даний час комбіноване групування відіграє важливу роль в комплексному статистичному дослідженні соціально-економічних явищ.

Разом з тим, комбінація групувальних ознак веде до різкого збільшення числа груп, що може привести до недостатньої чисельності одиниць в кожній групі, а це, в свою чергу - до випадкових і необґрунтованих висновків. Також, при вивченні впливу великої кількості ознак, застосування комбінованого групування стає неможливим через надмірне подрібнення інформації при побудові комбінованих таблиць, що затушовує прояв закономірностей і не дозволяє простежити одночасний вплив всього комплексу факторних ознак на досліджуваний результативний показник.

До комбінованих групувань вдаються при достатньо чисельному первинному матеріалі і якщо завдання заключається в дослідженні залежності результативних ознак від декількох факторних ознак. На практиці, при проведенні комбінованого групування, обмежуються трьома-чотирма ознаками. Все це вимагає пошуків нових принципів групування, які б зняли вказані вище обмеження.

Для розв'язання цього завдання математичною статистикою розроблений метод багатовимірних групувань - метод розпізнавання образів. В цьому випадку явища класифікуються за принципом подібності (близькості), які потім відносять до вже сформованих груп (образів) нових одиниць. На відміну від комбінованого групування, де віднесення до певних груп відбувається за окремою ознакою, при класифікації на основі розпізнавання образів віднесення до окремих груп проводять за комплексом ознак, які утворюють “ознаковий простір", де кожна ознака розглядається як координата.

Якщо в наборі сукупності є ряд одиниць з фіксованими ознаками, то кожна з цих одиниць розглядається як точка в багатовимірному просторі. Всі точки, розташовані в багатовимірному просторі, утворюють скупчення, які складають групи (таксони,

 

кластери). Завданням виділення цих скупчень точок в просторі і займається теорія розпізнавання образів.

Геометрична близькість декількох точок в багатовимірному просторі означає подібність становища відповідних об'єктів, тобто їх кількісна однорідність за досліджуваними ознаками.

Одним з розповсюджених критеріїв міри близькості між об'єктами є евклідова віддаль:

d^JZ^ki-Xkj ) 2 ,

V і=1

де хи - значення k-ої ознаки в і-му об'єкті; хк - значення к-ої ознаки в j-му об'єкті.

При зменшенні цієї віддалі близькість зростає, а при її збільшенні - зменшується.

В різних алгоритмах розпізнавання образів проводиться неоднаково, але загальним для всіх є те, що групи формуються на основі подібності об'єктів за великим числом ознак. Знаходження цих груп здійснюється одним із методів статистичної теорії розпізнавання образів - методом кластерного аналізу з допомогою сучасних ПЕОМ.

Багатовимірні групування дозволяють розв'язати цілий ряд важливих завдань економіко-статистичного дослідження, таких як побудова статистичних моделей економічних показників роботи підприємства і його частин, формування однорідних сукупностей, відбір суттєвих факторних ознак, виділення типових груп об'єктів та багато інших.