Інформаційні технології та моделювання бізнес-процесів - Томашевський О.М. -
3.5. Інформаційна технологія автоматизації процесу аналізу інформації з використанням програмного забезпечення

Практика використання інформаційних технологій для моделювання та автоматизації підтримки прийняття рішень в управлінні соціально-економічними процесами тісно пов'язана із постійним розв'язанням задач аналізу значних обсягів інформації. Особливої актуальності аналіз інформації набуває при потребі прийняття рішень для управління різними процесами. Прикладом може служити аналіз значних обсягів економічної інформації.

Для його проведення можуть використовуватись методи, що ґрунтуються на основі інструментальних засобів та успішно застосовуються для складного аналізу статистичних даних шляхом прямого програмування інструментальними мовами. При цьому спочатку будуються економіко-математичні моделі, а потім - здійснюється їх комп'ютерна реалізація з використанням інструментальних засобів - мов програмування, серед яких необхідно відзначити мову R.

Інша група методів аналізу значних обсягів економічних даних ґрунтується на використанні пакетів прикладного програмного забезпечення. Так, наприклад, для систематизованої обробки значних обсягів табличних даних на ПК під управлінням операційних систем сімейства Microsoft Windows використовуються процесори електронних таблиць (ЕТ) Microsoft Excel, спеціалізовані програмні пакети StatSoft Statistica, StatGraphics Plus, SPSS SigmaPlot та інші. Зазначені програмні засоби мають потужні можливості обробки та аналізу даних, проте їх спільними недоліками є орієнтованість виключно на роботу під управлінням операційних систем сімейства MS Windows та порівняно висока вартість ліцензій на офіційне використання.

Для систематизованої обробки значних обсягів табличних даних на персональних комп' ютерах під управлінням операційних систем сімейства Linux використовуються наступні процесори електронних таблиць (ЕТ): OpenOffice.org Calc, ABS, Gnumeric, KSpread та ряд інших. Перевагами цих програмних засобів є відкрита ліцензія на використання і, відповідно, відсутність витрат на програмне забезпечення та широкі можливості.

Особливістю процесора ЕТ OpenOffice.org Calc є використання значної кількості вбудованих функцій, команд запису, створення і редагування макрозасобів; засобів для побудови і редагування графічних залежностей. Разом з цим, процесор ЕТ OpenOffice.org Calc підтримує імпорт, обробку і збереження даних у форматах файлів процесора ЕТ Microsoft Excel - файлах формату *.xls.

OpenOffice.org Calc обробляє дані з використанням вбудованих функцій різних категорій, включаючи статистичні та фінансові, які можна використовувати у формулах для складного аналізу даних. Засоби макропрограмування значно розширюють можливості обробки даних, автоматизують окремі процедури і полегшують роботу користувача. При цьому у програмі процесора ЕТ OpenOffice.org Calc підтримується версія мови програмування Basic, є вбудована можливість, окрім створення і застосування макросів, ще й написання власних підпрограм і модулів.

Програмний засіб Gnumeric має вбудовану значну кількість (понад 520) функцій, згрупованих у категорії: фінансові, дата/час, математичні, статистичні, інформаційні, бази даних, рядок, логічні, випадкові числа, теорія чисел, пошук, комплексні, операції з бітами, інженерні, Ерланг, Gnumeric. Всі вони можуть успішно використовуватися на практиці для автоматизації обчислень у електронних таблицях, в тому числі для аналізу інформації.

При розв'язанні низки прикладних задач засобами Gnumeric можуть використовуватись вбудовані команди з меню Сервіс:

o інструмент Пошук цілі (Goal Seek) - пошук величини однієї модельної змінної, яка забезпечуватиме певне значення для іншої модельної змінної;

o інструмент Пошук рішення (Solver) - розв'язання задач лінійного програмування;

o інструмент Моделювання (Modelling) - розв'язання задач моделювання ризиків з використанням чисельного методу Монте-Карло;

o інструмент Статистичний аналіз (Statistical Analysis) - здійснення статистичного аналізу табличних даних, а саме:

дисперсійний аналіз (одно- та двофакторний); кореляція Пірсона; коваріацію; знаходження описових статистик; прогнозування (за методами експоненціального згладжування та рухомого середнього значення); виконання аналізу Фур'є; побудова частотних таблиць і гістограм; обчислення рангів, розміщень і персентилів; здійснення регресійного аналізу; групування вибірок за періодичним або випадковим законами розподілів; порівняння середніх значень двох рівних вибірок (t-тест), двох нерівних вибірок з рівними дисперсіями (t-тест), двох нерівних вибірок з нерівними дисперсіями (t-тест), двох вибірок з відомими дисперсіями (z-тест); порівняння дисперсії двох вибірок (f-тест). Іншими, практично цінними інструментами для обробки даних є Сортування (Sort); Фільтр (Filter) - Автофільтр (AutoFilter), Стандартний фільтр (Standard Filter) та Розширений фільтр (Advanced Filter); Консолідація даних (Consolidate); Обчислення підсумків (Subtotals); Групування даних (Group).

Для кращого представлення даних у ЕТ можуть використовуватись різні формати представлення даних: числовий, відсотковий, дата, час, грошовий, бухгалтерський, науковий, дробовий, логічний, текстовий, користувацький. Для захисту інформації у комірках ЕТ призначений засіб Захист (Protection), з допомогою якого можна закрити зміст комірок (Lock), приховати зміст комірок (Hide), або захистити робочий лист (Protect worksheet).

Практика використання розглянутих програмних засобів на ПК під управлінням операційних систем сімейства Linux показала їх високу ефективність, надійність і безпечність. Особливо потужними можливостями для аналізу даних шляхом використання вбудованих функцій та спеціальних інструментів аналізу даних володіє програмний засіб Gnumeric, який також є кросплатформеним і може працювати як під управлінням операційних систем MS Windows, так і Linux.

Таким чином, інформаційна технологія на практиці може бути успішно реалізована на основі наведених програмних засобів для автоматизації процесів аналізу інформації.

Резюме

Інформаційна технологія - сукупність процесів, що використовує засоби та методи накопичення, обробки і передачі первинної інформації для отримання інформаційного продукту (інформації нової якості про стан об'єкту, процесу або явища).

Інформаційна технологія повинна давати можливість оцінити вплив рішень, які приймаються, на підвищення ефективності процесів, які вона обслуговує. Основною метою інформаційної технології вважається повне і своєчасне задоволення інформаційних потреб користувачів.

Практика використання інформаційних технологій для моделювання та автоматизації підтримки прийняття рішень в управлінні соціально-економічними процесами тісно пов'язана із постійним розв'язанням задач аналізу значних обсягів інформації.

Ключові слова

Інформаційна технологія, комп'ютерна інформаційна технологія, дерево цілей, декомпозиція, дерево рішень, засоби обробки інформації, інформаційно-технологічна система, інформаційно-технологічний процес, технологія автоматизації аналізу інформації.

Запитання і завдання для обговорення та самоперевірки:

► Що таке інформаційна технологія?

► Етапи розвитку комп'ютерних інформаційних технологій.

► Що таке гіпертекстові технології?

► Що таке мультимедійні технології?

► Як використовуються цифрові технології у видавничій справі?

► Назвіть основні характеристики інформаційної технології.

► Опишіть, які відомі вам новітні технології впроваджуються в повсякденне життя.

► Які вимоги висуваються до сучасних інформаційних технологій?

► В чому полягає принцип декомпозиції цілей?

► Поміркуйте і назвіть цілі виробництва комп'ютерної техніки широкого вжитку.

► Намалюйте дерево прийняття рішення щодо доцільності купівлі автомобіля в кредит.

► Охарактеризуйте підсистеми інформаційно-технологічної системи.

► Опишіть інформаційно-технологічний процес та його властивості.

► На використанні яких засобів основані методи для аналізу значних обсягів економічної інформації?

4. Інтелектуальні технології обробки економічних даних
4.1. Принципи функціонування автоматичних засобів видобування знань
4.2. Нейромережеві технології штучного інтелекту
Мапи, що самоорганізуються
4.3. Технологія виявлення знань в базах даних (Knowledge Discovery in Databases)
4.4. Нові концепції у теорії штучного інтелекту
5. Створення сховищ даних. Технології OLAP та Data Mining
5.1. Структура сховища даних та оптимізація його обсягів
5.2. Технологія аналітичної обробки даних в реальному часі OLAP
5.3. Технологія аналізу сховищ даних (Data Mining)