Метод кластерного аналізу

При аналізуванні соціально-економічних явищ і складанні прогнозів, ми часто стикаємося з багатомірністю описів. Як правило, це проявляється при вирішенні основних питань, пов’язаних з сегментування ринку і побудовою типології країн за наявності величезного числа показників, а також при прогнозуванні кон’юнктури ринку, економічної депресії та інших проблем. Методи багатовимірного аналізу виступають в якості кількісного інструменту для проведення досліджень більшості соціально-економічних процесів, які можна описати тільки при наявності величезної кількості характеристик. У них можна віднести: метод кластерного аналізу, розпізнавання образів, таксономії і факторний аналіз.

Кластерний аналіз дозволяє найбільш чітко відображати властивості і храрктерістікі багатовимірного ааналіза. Своє перше застосування він знайшов в соціології, а в 1939 році дослідник Тріон визначив його предмет і опис. Метод кластерного аналізу може бути використаний в різних сферах і випадках, де все зводиться до угрупованню по кількісному параметру, оскільки його основним призначенням є розбиття досліджуваних об’єктів на групи (кластери), схожі за однією або кількома ознаками. До того ж він не накладає обмежень на досліджувані об’єкти, що дозволяє вивчати безліч даних, що мають довільну природу. В результаті застосовуваний метод сприяє обробці, скорочення і стиснення інформації соціально-економічної значущості для додання їй більшої наочності і компактності.

Як і все в світі, метод кластерного аналізу, поряд зі своїми перевагами, має недоліки і деякі обмеження. В якості одного з них може виступати кількість і склад кластерів в залежності від певних критеріїв розбиття. Надання вихідного матеріалу більш компактний стислий вигляд сприяє втраті індивідуальних рис і характеристик, прояву спотворень, оскільки відбувається заміна на більш узагальнені значення наявних параметрів кластера. В результаті, кластерний аналіз враховує, що масштаб підібраний абсолютно правильно і всі вибрані характеристики і параметри допускаються до розбиття на конкретні кластери.

Основні методи кластерного аналізу, що застосовуються в наші дні.

У сучасному світі існує величезна безліч методів, що застосовуються для проведення кластерного аналізу. Розглянемо найбільш відомі та широко застосовуються:
метод повних зв’язків – полягає в тому, що два об’єкти одного кластера мають певний коефіцієнт подібності, який значно менше порогового значення;
метод максимального локального відстані – в даному випадку кожен досліджуваний об’єкт виступає в якості одноточечного кластера. Відповідно до даного методу, всі об’єкти групуються згідно з правилом: кластери можуть об’єднатися тільки в тому випадку, якщо відстань між точками одного кластера максимально, а другого – мінімально. Процедура проводиться в один етап, а як результат виступають розбиття, що мають схожості з розбивками, отриманими в ході попереднього методами (для всіх порогових значень);
метод Ворда – даний метод спрямований на угруповання найближче розташованих груп кластерів. У цьому випадку застосовується сума квадратів відхилень усередині групи (т. Е. Сума квадратів відстаней між всіма точками, які належать даному об’єкту), а також середня по кластеру, до якого входить даний об’єкт. Кожен наступний етап об’єднує кластери, що призводять до незначного (нульового) збільшення цільової функції;
центроїдного метод – враховує відстань між кластерами, як відстань між їх центрами (середніми значеннями). Досить часто даний метод називають методом зважених груп.


1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5.00 out of 5)

Метод кластерного аналізу