Архітектура СППР подається різними авторами по-різному. Наприклад, Г. Мара кас у 1999 р. запропонував узагальнену архітектуру, що складається з таких частин: система управління даними (the Data Management System); система управління моделями(the Model Managementsystem); машина знань (the Knowledge Engine); інтерфейс користувача (the User Interface); користувачі.
Основна задача СППР - надати аналітикам інструмент для виконання аналізу даних. За ступенем обробки даних при аналізі даних вирізняють такі задачі:
o інформаційно-пошукові - СППР здійснює пошук необхідних даних. Характерною рисою такого аналізу є виконання наперед заданих запитів;
o оперативно-аналітичні - СППР здійснює групування та узагальнення даних у вигляді, необхідному аналітику;
o інтелектуальні - СППР здійснює пошук функціональних і логічних закономірностей у накопичених даних, побудову моделей і правил, що пояснюють знайдені закономірності і з певною ймовірністю прогнозують розвиток процесів.
Отже, загальну архітектуру СППР можна подати схематично (рис. 7.5).
З функціонального погляду СППР включає такі компоненти: сервер сховища даних, інструментарій OLAP, інструментарій Data Mining.
У підсистемі введення даних OLTP (Online Transaction Processing) реалізується операційна (транзакційна) обробка даних. Для їх реалізації використовують звичайні системи управління базами даних (СУБД).
У підсистемі зберігання інформації використовують сучасні СУБД і концепцію сховищ даних. Концепція сховища даних передбачає розділ структур зберігання даних для оперативної обробки даних і виконання аналітичних запитів.
Підсистема аналізу може включати:
1) підсистему інформаційно-пошукового аналізу на базі ре-ляційних СУБД і статичних запитів з використанням мови SQL (Structured Query Language);
2) підсистему оперативного аналізу. Для реалізації таких підсистем застосовується технологія оперативної аналітичної обробки даних OLAP (Online Analytical Processing), що спирається на концепцію багатовимірного подання даних;
3) підсистему інтелектуального аналізу. Ця підсистема реалізує методи і алгоритми здобуття даних Data Mining.
Ці компоненти СППР розглядають такі основні питання: накопичення даних та їх моделювання на концептуальному рівні, ефективного завантаження даних із кількох незалежних джерел та аналізу даних. Можна стверджувати, що використання оперативної аналітичної обробки (систем OLAP) сьо-
годні обмежується забезпеченням доступу до багатовимірних даних.
Технологія Data Mining у СППР також задіяна, тому що за її допомогою можна провести більш глибокий і всебічний аналіз даних, прийняти найбільш обґрунтовані рішення.
OLAP і Data Mining можна розглядати як складові процесу підтримки прийняття рішень. Проте ці технології немовби рухаються у різних напрямах: OLAP зосереджує увагу винятково на забезпеченні доступу до багатовимірних даних, а методи Data Mining у більшості випадків працюють з плоскими одно-вимірними таблицями і реляційними даними.
Інтеграція технологій OLAP і Data Mining розширює їх функціональність. Ці два види аналізу мають бути тісно поєднані, щоб інтегрована технологія могла забезпечувати одночасно багатовимірний доступ і пошук закономірностей.
Засіб багатовимірного інтелектуального аналізу даних має знаходити закономірності як у деталізованих, так і в агрегова-них з різним ступенем узагальнення даних.
Отже, для реалізації підсистем, що виконують оперативно-аналітичний аналіз, використовується концепція багатовимірного представлення даних, а підсистема інтелектуального аналізу даних реалізує методи і алгоритми Data Mining.
Основний недолік реляційних БД полягає в неможливості обробки інформації, яку не можна представити в табличному вигляді. У зв'язку з цим пропонується використовувати пост-реляційні моделі, наприклад, об'єктно орієнтовані.
Для спрощення розробки прикладних програм, що використовують БД, створюються системи управління базами даних, тобто програмне забезпечення для управління даними, їх зберігання і безпеки даних.
У СУБД розвинений механізм управління транзакціями, що зробило їх основним засобом створення систем оперативної обробки транзакцій. До таких систем належать перші СППР та виконавчі управлінські системи. OLTP-системи не можуть ефективно використовуватися для вирішення задач оперативно-аналітичного та інтелектуального аналізу інформації. Нині для об'єднання у межах однієї системи OLTP-підсистем і підсистем аналізу використовується концепція сховищ даних. За
бізнес-процесів. Атомарні дані залишаються доступними через нормалізоване сховище даних. Як відмітні характеристики підходу Б. Інмона до архітектури сховищ даних можна назвати використання реляційної моделі організації атомарних даних і просторової - для організації сумарних даних; використання ітеративного підходу при створенні великих сховищ даних, що дає змогу у разі необхідності вносити зміни у невеликі блоки даних або програмних кодів і позбавляє від необхідності перепрограмовувати значні обсяги даних у сховищі; використання третьої нормальної форми для організації атомарних даних, що забезпечує високий ступінь детальності інтегрованих даних і, відповідно, надає корпораціям широкі можливості для маніпулювання ними і зміни формату та способу представлення даних в міру необхідності.
Типові риси підходу Ральфа Кимболла такі: використання просторової моделі організації даних з архітектурою "зірка"; використання дворівневої архітектури, яка включає стадію підготовки даних, не доступну для кінцевих користувачів, і сховище даних з архітектурою шини. До його складу входять кілька вітрин атомарних даних, агрегованих даних і персональна вітрина даних, але вона не містить одного фізично цілісного або централізованого сховища даних. Сховище даних з архітектурою шини має такі характеристики: просторове; включає як дані про транзакції, так і сумарні дані; включає вітрини даних, присвячені тільки одній ПрО і має тільки одну таблицю фактів; може містити безліч вітрин даних у межах однієї бази даних. Сховище даних не є єдиним фізичним репози-торієм, тому це віртуальне сховище.
При реалізації в СППР концепції СД дані з різних ОДД переносяться в єдине сховище. Зібрані дані приводяться до єдиного формату, узгоджуються й узагальнюються. Аналітичні запити адресуються до СД (рис. 7.7). Така модель призводить до дублювання інформації в ОДД і в СД. Проте стверджується, що надмірність даних, які зберігаються в СППР, не перевищує
1 %. Це пояснюється так:
1) при завантаженні інформації з ОДД в СД дані фільтруються;
2) інформація в ОДД є оперативною, тому дані, втративши актуальність, видаляються. У СД, навпаки, зберігається істо
рична інформація. Виходячи з цього, дублювання вмісту СД даними ОДД виявляється незначним;
3) у СД зберігається узагальнена інформація, яка в ОДД відсутня;
4) під час завантаження в СД дані очищаються і приводяться до єдиного формату. Після такої обробки дані займають набагато менший обсяг.
Надмірність інформації можна звести до нуля, використовуючи віртуальне СД. У такому випадку на відміну від фізичного СД дані з ОДД не копіюються в єдине сховище. Вони здобуваються, перетворюються та інтегруються безпосередньо при виконанні аналітичних запитів в оперативній пам'яті комп'ютера.
Сховище даних має переваги порівняно з використанням оперативних систем або баз даних. На відміну від оперативних систем, сховище даних містить інформацію за весь необхідний часовий інтервал в єдиному інформаційному просторі, що робить такі сховища ідеальною основою для виявлення трендів, сезонних залежностей та інших важливих аналітичних показників.
Як правило, інформаційні системи підприємства зберігають і представляють дані по-різному. Наприклад, одні й ті самі показники можуть зберігатися в різних одиницях вимірювання. Одна і та сама продукція або одні й ті самі клієнти можуть іменуватися по-різному. У системах сховищ невідповідності в даних усуваються на етапі збору інформації і завантаження її в єдину базу даних. Організовуються єдині довідники, всі показники в яких приводяться до однакових одиниць вимірювання.
Сховище даних надає унікальну можливість одержувати будь-які звіти про діяльність підприємства на основі одного джерела інформації. Це дає змогу інтегрувати дані, що вводяться і накопичувані в різних оперативних системах, без проблем порівнювати їх. У процесі створення звітів користувач не зв'язаний відмінностями в доступі до даних оперативних систем.
Сховище даних допомагає вирішити ці проблеми. По-перше, робота сервера сховища не заважає роботі операторів. По-
друге, у сховищі крім детальної інформації містяться і наперед розраховані агреговані значення. По-третє, у сховищі архівна інформація завжди доступна для включення у звіти. Все це дає можливість значно скоротити час створення звітів та уникнути проблем в оперативній роботі.
Інформацію у сховищі даних недостатньо тільки централізувати і структурувати. Аналітикові потрібні засоби візуаліза-ції цієї інформації, інструмент, за допомогою якого легко одержувати дані, необхідні для ухвалення своєчасних рішень. У випадку використання сховища даних вирішення проблеми надає технологія OLAP. Ця технологія забезпечує доступ до даних у термінах, звичних для аналітика.
Висновки
Розділ 8. Інтелектуальні інформаційні системи на підприємствах
8.1. Поняття та загальна характеристика інтелектуальних систем
Квазіалгоритми
8.2. Організаційні основи експертних систем
Класифікація експертних систем
Інструментарій створення ЕС
8.3. Інтелектуальні системи аналізу і звітності на підприємствах. Приклади використання інтелектуальних ВІ-платформ
Структура Cognos & ВІ