Інформаційні технології та моделювання бізнес-процесів - Томашевський О.М. -
5.2. Технологія аналітичної обробки даних в реальному часі OLAP

OLAP (On-Line Analytical Processing) є ключовим компонентом організації сховищ даних. Ця технологія заснована на побудові і візуалізації багатовимірних кубів даних з можливістю довільного маніпулювання даними, що містяться в кубі (рис.5.3). Це дозволяє представити дані для аналізу в будь-якому розрізі.

Повернемося, наприклад, до аналізу продажів. Припустімо, що керівнику необхідно знати обсяги продажів за деякий період, (наприклад, за місяць), що нещодавно завершився. При цьому, компанія продає не один, а множину товарів і має велику кількість торгівельних точок (ТТ) -магазинів.

Схема організації розміщення даних для технології OLAP

Рис.5.3. Схема організації розміщення даних для технології OLAP

Перші два найпростіші питання, на які потрібно мати відповіді, - це обсяги продажів товарів в кожній торгівельній точці та за кожний місяць.

Відповідь на ці питання оформляється у вигляді двовимірної таблиці. В першому випадку рядками і стовпцями цієї таблиці відповідно будуть назви товарів, місяці і суми, а в другому - назви ТТ і суми:

Таблиця 5.1. Приклад багатовимірного звіту

Приклад багатовимірного звіту

Проте, аналіз даних в такому представленні є ускладненим. Виникає потреба об'єднання даних декількох таблиць. В результаті у звіті фігуруватиме три аналітичні виміри (місто, товар і торгівельна точка), і замість двовимірних таблиць буде використовуватись тривимірна модель представлення даних.

Технологія комплексного багатовимірного аналізу даних OLAP представляє собою головний компонент організації сховищ даних, а саме: збору, очищення й попередньої обробки інформації. Часто OLAP характеризують як швидкий аналіз багатовимірної розподіленої інформації.

Автор реляційної моделі даних Е.Ф. Кодд сформулював 18 правил OLAP, які розділив на 4 групи:

o Основні властивості:

1. багатовимірне представлення даних;

2. інтуїтивне оперування даними (без застосування меню);

3. доступність;

4. пакетне вилучення замість інтерпретації;

5. моделі аналізу OLAP (за категоріями, тлумачний, абстрактний і стереотипний);

6. архітектура "клієнт-сервер";

7. прозорість;

8. можливість одночасного обслуговування багатьох користувачів.

o Спеціальні властивості:

9. обробка ненормалізованих даних;

10. збереження результатів OLAP;

11. вилучення значень, яких немає (відрізняються від нульових значень);

12. обробка значень, яких немає (ігноруються OLAP-аналізатором без врахування їх джерел).

o Особливості представлення звітів:

13. гнучкість формування звітів;

14. стандартна продуктивність звітів (не знижується із зростанням кількості вимірів і об'єму бази даних;

15. автоматичне налаштування фізичного рівня.

o Управління вимірами:

16. універсальність вимірів;

17. необмежена кількість вимірів і рівнів агрегації;

18. необмежені операції над розмінностями.

Зазначимо, що на практиці не всі вказані особливості враховуються. Можливості компанії Oracle в галузі сховищ даних базуються на таких складових як:

o наявність реляційних СУБД Oracle (7,8 і вище);

o існування набору готових додатків, що забезпечують можливості розробки і адміністрування сховищ даних;

o високий технологічний потенціал в галузі OLAP-технологій;

o доступність ряду програмних розробок інших компаній.

До складових OLAP-технологій відносять:

o Oracle Express (OE) Server - об'єктний сервер, який забезпечує обчислювальні можливості всіх програмних продуктів технології Express;

o Oracle Express Analyzer - об'єктно-орієнтована система аналізу бази даних;

o Oracle Financial Analyzer - система, що підтримує розподілене оперування бюджетом, фінансовий аналіз і економічне моделювання;

o Oracle Sales Analyzer - система для маркетингового аналізу, а також для загального аналізу великих обсягів даних;

o Oracle Express Relational Access Manager - система створення динамічного зв'язку між пакетом OE і сховищем OE.

o Oracle Pack - засіб оптимізації системи.

o Oracle Diagnostics Pack - засіб контролю, діагностики й підтримки бази даних, операційної системи та додатків.

o Oracle Change Management Pack - засіб ліквідації помилок і втрат під час модернізації баз даних.

У першої системи управління базами даних (функції сервера) і взаємодія з користувачем були поєднані в одній програмі. Бази даних і прикладні програми, які працювали з ними, функціонували на одному (центральному) комп'ютері. Там же виконувались усі процедури звертання до даних і їх обробка.

Комп'ютер, що керує певним ресурсом, називають сервером цього ресурсу, комп'ютер, який ним користується - клієнтом (файл-сервер, сервер баз даних). Той самий комп'ютер може виконувати як роль сервера, так і клієнта.

Цей принцип поширюється і на взаємодію програм. Якщо одна з них виконує деякі функції, надаючи іншим відповідний набір послуг, то вона називається сервером. Програми, що користуються цими послугами, називаються клієнтами (SQL-сервер і SQL-клієнт).

Підтримка інтелектуального аналізу є одним із базових компонентів сучасних корпоративних інформаційних систем. В межах OLAP-технологій вона отримала самостійний розвиток в сучасних технологіях.

Корпоративне сховище даних може функціонувати в трьох архітектурах - реляційній (ROLAP), багатовимірній (MOLAP), і гібридній або змішаній (HOLAP).

У ROLAP (Relation OLAP) - архітектурі дані зберігаються в реляційній базі даних, а агретовані - у спеціальних службових таблицях. Реляційні таблиці і зв'язки між ними генеруються автоматично. Головні функції системи розподіляються між трьома логічними рівнями:

o масштабована паралельна реляційна база даних забезпечує зберігання і швидкий доступ;

o середній рівень аналізу підтримує багатовимірне представлення даних і розширені функціональні можливості, які є недоступними на базовому реляційному сервері;

o рівень представлення відповідає за донесення результатів до користувачів.

Реляційна архітектура забезпечує високу швидкість роботи зі сховищем при невеликих обсягах даних.

HOLAP (Hybrid OLAP) - передбачає збереження основних даних в реляційному сховищі, а агрегованих - в багатовимірній базі MOLAP (Multidimensional OLAP) у зручному для користувача вигляді.

5.3. Технологія аналізу сховищ даних (Data Mining)
6. Автоматизовані інформаційні системи для підприємств та організацій
6.1. Інформаційні системи і технології в сучасному суспільстві
6.2. Основні етапи розвитку інформаційних систем
6.3. Класифікація інформаційних систем
6.4. Експертні системи
6.5. Автоматизовані інформаційні системи для підприємств та організацій
6.6. Технології створення машинної та позамашинної інформаційної бази
7. Інформаційні технології в управлінні
7.1. Роль інформаційних технологій в системі організаційного управління