Інформаційні технології та моделювання бізнес-процесів - Томашевський О.М. -
Мапи, що самоорганізуються

Self Organizing Maps - SOM, або мапи Кохонена, що самоорганізуються, є різновидом нейронної мережі і використовуються для вирішення задач кластеризації і сегментації. Алгоритм функціонування мап, що самоорганізуються, є одним з варіантів кластеризації багатовимірних даних. В алгоритмі SOM всі нейрони (вузли, центри класів) впорядковані в деяку структуру, як правило - двовимірну сітку. В ході навчання модифікується не лише нейрон-переможець (нейрон мапи, який найбільшою мірою відповідає вектору входів і визначає, до якого класу відноситься навчальний приклад), але і його сусіди, хоча і у меншій мірі. За рахунок цього SOM можна вважати одним з методів проекції багатовимірного простору в простір з більш низькою розмірністю. При використанні цього алгоритму, вектори, що були близько розташовані на отриманій мапі, виявляються близькими і в початковому просторі.

Окремий клас нейронних мереж, такі як мережа Хеммінга або мережа Хопфільда, використовують принципи асоціативних правил (association rules), що дозволяють знаходити закономірності між зв'язаними подіями. Відповідно, вони є придатними для вирішення задач виявлення асоціацій.

Прикладом асоціативного правила, служить твердження, що покупець, що придбав хліб, купить і молоко з вірогідністю 75%. Вперше ця задача була запропонована для пошуку асоціативних правил для знаходження типових шаблонів покупок (market basket analysis). Асоціативні правила ефективно використовуються в сегментації покупців за поведінкою при здійсненні покупок, аналізі переваг клієнтів, плануванні розташування товарів в супермаркетах, адресній розсилці. Проте сфера застосування цих алгоритмів не обмежується лише однією торгівлею. Їх також успішно застосовують і в інших областях: медицині, для аналізу відвідування вебсторінок (Web Mining), для аналізу тексту (Text Mining), для обробки даних по перепису населення, в прогнозуванні збоїв телекомунікаційного устаткування, тощо.

Задачею пошуку асоціативних правил не є виявлення всіх правил, оскільки частина з них відомі аналітикам, інші можуть і не представляти статистичної цінності. Тому при пошуку вводяться пороги підтримки і достовірності асоціативних правил. Класичним алгоритмом знаходження асоціативних правил вважається алгоритм APriori.

Розглянемо приклад сегментації покупців за допомогою мапи Кохонена. Вимоги до даних, що необхідні для проведення сегментації, розділяють на дві групи: дані трансакцій і дані по товарах. Дані трансакцій повинні містити наступний мінімум інформації: код трансакції, дата і час трансакції, код товару та кількість, сума покупки. Нехай база даних містить статистику товарів, придбаних покупцями; всі товари розділені на п'ять груп і 40 підгруп, що представлено у вигляді ієрархії товарів:

Ієрархія товарів

Рис.4.1. Ієрархія товарів

Наприклад, група "Сімейні товари" включає такі підгрупи, як одяг, побутова техніка, спортивний інвентар і т.д.

Після побудови мапи утворюється п'ять типів покупців (рис.4.2). В даному випадку кількість сегментів визначалась кількістю груп товарів.

Сегментація покупців

Рис.4.2. Сегментація покупців

Проведемо інтерпретацію кожного сегменту і дамо кожному типу покупців назву (рис.4.2).

o Основні покупці (сегмент 3) - купують переважно продукти харчування і сімейні товари з відносно низькими витратами на решту товарів. До цієї групи входять 40% від всіх покупців;

o Змішані покупці (сегмент 4). Немає чітких переваг при купівлі певного виду товарів. До групи входять 25% від всіх покупців.

o Сімейні покупці (сегмент 1). - відвідують магазин для купівлі товарів сімейного користування. Складають 15% від всіх покупців;

o Покупці напоїв і розважальної продукції (сегмент 2) - їх відрізняють підвищені витрати на дані групи товарів, частка таких покупців 10%;

o Молоді батьки (сегмент 0) - основною метою їх покупок є придбання дитячих товарів. Складають 10% від всіх покупців.

4.3. Технологія виявлення знань в базах даних (Knowledge Discovery in Databases)
4.4. Нові концепції у теорії штучного інтелекту
5. Створення сховищ даних. Технології OLAP та Data Mining
5.1. Структура сховища даних та оптимізація його обсягів
5.2. Технологія аналітичної обробки даних в реальному часі OLAP
5.3. Технологія аналізу сховищ даних (Data Mining)
6. Автоматизовані інформаційні системи для підприємств та організацій
6.1. Інформаційні системи і технології в сучасному суспільстві
6.2. Основні етапи розвитку інформаційних систем
6.3. Класифікація інформаційних систем