Успішне створення єдиної інформаційної бази істотно залежить від процесів уніфікації та стандартизації її складових. Схему перетворення інформації в дані можна представити через процедури класифікації, кодування та моделювання елементів даних.
Класифікації та кодуванню техніко-економічної інформації відводиться особлива роль, оскільки вони забезпечують взаємний обмін інформацією між людиною й ЕОМ. Кодування техніко-економічної інформації на основі системи класифікації дозволяє безпосередньо за кодом об'єкта стверджувати про його характеристики (конструкційні, технологічні, експлуатаційні).
Класифікація і кодування - це дві взаємодоповнювані частини одного процесу - перетворення різноманітної економічної інформації з природної на формалізовану мову ЕОМ. У процесі цього перетворення вони виконують різні функції. Для їх поглибленого вивчення слід розкрити основні терміни й поняття, що використовуються в цій сфері.
Класифікація - поділ множини об'єктів на під множини за їх подібністю або відмінністю згідно з прийнятими методами і підходами.
У процесі класифікації використовуються такі поняття:
o система класифікації - сукупність методів і правил класифікації та їхній результат;
o об'єкт класифікації - елемент множини класифікації;
o ознака класифікації - властивість або характеристика об'єкта, за якою здійснюється класифікація;
o значення ознаки - якісне або кількісне вираження ознаки класифікації;
o класифікаційне угруповання - частина об'єктів, виділена під час класифікації.
Найпоширенішими є такі назви класифікаційних угруповань: клас, підклас, група, підгрупа, вид, підвид, тип.
Ступінь класифікації - етап класифікації при ієрархічному методі, у результаті якого формується сукупність класифікаційних угруповань (або результат чергового поділу об'єктів одного класифікаційного угруповання). Глибина класифікації
- кількість ступенів класифікації. Класифікація використовується для упорядкування змісту і взаємозв'язку економічних показників.
Засобом вираження результатів класифікації є кодування. Кодування - процес присвоєння об'єкту певного коду. Код
- знак або сукупність знаків, узятих для позначення класифікаційного угруповання і об'єкта класифікації.
Алфавіт коду - система знаків, узятих для створення коду. Основа коду - кількість знаків у алфавіті коду. Цифро вий алфавіт коду - алфавіт коду, знаками якого є цифри. Вуквений алфавіт коду - алфавіт коду знаками якого є літери природних мов. Буквено-цифровий алфавіт коду - алфавіт, знаками якого є літери природних мов та цифри. Розряд коду
- позиція знака в коді. Довжина коду - кількість символів алфавіту, що використовуються для кодування об'єкта.
Структура коду визначає його склад і послідовність розміщення знаків у ньому. Кожний код має: алфавіт, основу, довжину, структуру. Алфавіт і основа коду, якщо задано структуру, визначають місткість коду, тобто кількість об'єктів, які можуть бути закодовані цим кодом без порушення його структури.
Місткість коду Е, якщо задано його довжину / та основу а, можна визначити за формулою Е = а1.
Можна виділити дві групи методів, що використовуються у системі кодування:
1) класифікаційну систему кодування, орієнтовану на проведення попередньої класифікації об'єктів на основі ієрархічної або фасетної систем;
2) реєстраційну систему кодування, що не потребує попередньої класифікації об'єктів.
Контрольне число - розрахункове число, яке використовується для перевірки істинності запису коду. Перекодування - присвоєння закодованому об'єкту нового коду.
Для впровадження системи класифікації і кодування використовують класифікатор. Класифікатор - це документ, що становить систематизований перелік назв і кодів класифікаційних угруповань або об'єктів класифікації. Позиція класифікатора - назва і код класифікаційного угруповання або об'єкта класифікації. Місткість класифікатора - найбільша кількість позицій, яку може містити класифікатор.
Впровадження класифікатора - проведення комплексу заходів, що забезпечують застосування класифікатора у певній ПрО.
Ведення класифікатора - підтримка класифікатора в актуальному стані. Буває автоматизованою, ручною. Система ведення класифікатора - сукупність служб, методів і засобів, що забезпечують ведення класифікатора та інформаційне обслуговування.
Еталон класифікатора - оригінал класифікатора, який ведеться відповідальною за його ведення установою.
Категорія класифікатора - ознака, що вказує на належність класифікатора до відповідної групи і залежність від рівня його затвердження та сфери застосування (загальнодержавний, галузевий). Реєстрація класифікатора - присвоєння затвердженому класифікатору реєстраційного номера і запис необхідних відомостей про нього до реєстру (державного, галузевого).
Класифікатори техніко-економічної інформації можуть створюватися системним або локальним способом. За системним способом інформація класифікується з урахуванням вимог різних рівнів управління (підприємство, міністерство, відомство тощо), за локальним - у межах одного підприємства, організації або установи.
Класифікатори, розроблені за локальним способом, містять інформацію, достатню для діяльності лише одного об'єкта управління (підприємства, установи). Такі класифікатори характеризуються й відносно легкою розробкою, й простотою внесення змін та доповнень. До їх недоліків належить необхідність перекодування інформації при передаванні на вищі рівні управління.
Класифікатори, розроблені за системним способом, містять повну інформацію, що використовується на різних рівнях управління, проте структура класифікатора громіздка, а код багатозначний. Ці класифікатори забезпечують інформаційний обмін між ІС різних рівнів.
Нині поширені основні національні статистичні класифікації України: класифікатор видів економічної діяльності (КВЕД), класифікатор професій (КП), класифікатор продукції (КПр), класифікатор держав світу (КДС), класифікатор валют (КВ), класифікатор послуг зовнішньоекономічної діяльності (КПЗЕД), класифікатор товарів зовнішньоекономічної діяльності (КТЗЕД), класифікатор об'єктів адміністративно-територіального устрою України (КОАТУУ), класифікатор основних фондів (КОФ), класифікатор органів управління, класифікатор організаційно-правових форм господарювання (КОПФГ), класифікатор форм власності (КФВ).
При виборі способу класифікації слід ураховувати економічні фактори, пов'язані з кодуванням, зберіганням, передачею та обробкою інформації, і порівнювати витрати на обробку інформації при використанні цих класифікаторів.
Метою класифікації і кодування є впорядкування і взаємоузгодження різних предметів, понять, властивостей елементів інформації. Використанням кодів можна значно скоротити обсяги інформації та трудомісткість її обробки на всіх етапах технологічного процесу автоматизованої обробки даних.
Питанням розробки класифікаторів під час проектування ІС приділяється велика увага. Розробка класифікаторів базується на врахуванні низки принципів. Найважливішими з них є такі:
o забезпечення в класифікаторі виділення галузевого, відомчого і регіонального аспектів управління;
o зміст назв одиниць інформації, яка вноситься до класифікаторів, має відповідати вимогам національних чи міжнародних стандартів або керівних технічних документів;
o класифікатор має забезпечити розв'язування всіх задач у ІС при мінімальній значності кодів;
o класифікація номенклатур має бути єдиною, тобто номенклатуру можна розмістити або в порядку зростання класифікаційних ознак, або за технологічним принципом.
Побудова системи класифікації і кодування потребує додержання принципу взаємно однозначної відповідності класифікованій номенклатурі, тобто для кожної позиції номенклатури призначається лише одне певне місце у класифікаторі. Кожний код має позначати лише один об'єкт класифікації.
Потрібно, щоб система класифікації забезпечила всі види групувань кодованих елементів, необхідних для відповідних розрахунків. Розроблені коди мають бути єдиними для завдань планування, обліку, економічного аналізу, регулювання, а також переважно цифровими.
Система класифікації і кодування має забезпечити необхідний резерв з метою внесення номенклатур, які щойно виникли, без зміни структури класифікатора. При цьому коди номенклатур повинні мати однакову значність і легко запам'ятовуватися.
Важливою вимогою є стабільність кодів. Система кодування має забезпечити змогу виявляти помилки, що виникають при вводі або запису кодів, програмним способом. Цього можна досягти шляхом внесення до коду контрольного розряду.
З метою забезпечення сумісності ІС різних рівнів управління коди за рядом номенклатур (галузі, установи) мають бути єдиними для всіх об'єктів управління. Уніфікація кодів для різних рівнів управління забезпечується впровадженням Єдиної системи класифікації та кодування техніко-економічної інформації.
Вимоги до побудови класифікаторів настільки різноманітні, що дуже складно їх усі врахувати. З огляду на це при розробці класифікаторів у кожному конкретному випадку необхідно вибирати оптимальний варіант, який дозволяє за допомогою сучасної техніки переробляти економічну інформацію з мінімальними витратами.
Система класифікації визначається і характеризується використаним методом класифікації, ознаками класифікації, їх послідовністю і кількістю рівнів класифікації, а також кількістю угруповань. Загалом ознака класифікації - це властивість об'єкта класифікованої множини. Ознаки класифікації можуть мати кількісне або якісне значення. Кількість значень ознаки класифікації визначає кількість класифікаційних угруповань, які можуть бути створені при поділі множини об'єктів за цією ознакою.
Метод класифікації - це сукупність правил створення системи класифікаційних угруповань і їх взаємозв'язків. Найбільше поширені такі методи класифікації об'єктів: ієрархічний, фасетний, дескрипторний. Вони відрізняються стратегією застосування класифікаційних ознак.
Ієрархічний метод класифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на класи першого рівня поділу, потім - на угруповання наступного рівня та ін. Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого графа, вузлами якого є угруповання. Найбільш суттєвими і складними питаннями, що постають при використанні ієрархічного методу класифікації, є вибір системи ознак, що стануть основою поділу, а також їх послідовність.
Ієрархічна система класифікації будується в такий спосіб (рис. 2.4): початкова множина елементів (0-й рівень) поділяється залежно від обраної класифікаційної ознаки на класи, що утворюють 1-й рівень; кожен клас 1-го рівня відповідно до власної класифікаційної ознаки поділяється на підкласи, що утворюють 2-й рівень, і т. д.
Класифікаційні ознаки визначають відповідно до мсти здійснення класифікації - властивостей об'єктів, що об'єднуються у класи.
В ієрархічній системі класифікації кожен об'єкт на будь-якому рівні належить до одного класу залежно від обраної класифікаційної ознаки. Кількість рівнів характеризує глибину класифікації.
Переваги ієрархічної системи класифікації:
o простота побудови;
o використання незалежних класифікаційних ознак у різних гілках ієрархічної структури.
Недоліки:
o жорстка структура, що спричинює складнощі при внесенні змін;
Рис. 2.4. Ієрархічна система класифікації
o неможливість групувати об'єкти за непередбаченим заздалегідь поєднанням ознак.
Фасетний метод класифікації на відміну від ієрархічного дозволяє вибирати ознаки класифікації, не враховуючи семантику об'єкта класифікації. Кожна ознака фасетної класифікації відповідає фасеті, тобто списку значень найменованої ознаки класифікації. Ознаки класифікації називаються фасетами (facet). Для кожного об'єкта задається множина фасет - під-множина класифікаційних ознак, значення яких для нього визначені.
Множинне описання об'єктів техніко-економічної інформації здійснюється в конкретній задачі на основі задання фасетної формули, що утворюється з послідовності ознак класифікації, які використовуються у задачі. Кількість фасетних формул визначається можливим поєднанням ознак.
Для кожної фасетної формули може бути утворена ієрархічна класифікація, в якій на кожному рівні поділу використовується одна ознака, що відповідає окремій фасеті, а послідовність ознак визначається фасетною формулою.
Процедура класифікації полягає у присвоєнні кожному об'єкту відповідної множини фасетів:
УвІ,( = М,3^,?<с{Ф1,...,Фп}. VФ^,/ = й^
де <?,- інформаційні об'єкти, Ф^,у = 1,л - фасети, п - кількість фасетів, к - кількість інформаційних об'єктів, {, - припустиме значення у-ї класифікаційної ознаки.
Кожна фасета містить сукупність припустимих значень відповідної класифікаційної ознаки (рис. 2.5).
Рис. 2.5. Приклад фасетної системи класифікації
При побудові фасетної системи класифікації необхідно, щоб значення, що використовуються в різних фасетах, не повторювалися. Фасетну систему легко можна модифікувати, вносячи зміни в конкретні значення будь-яких фасет.
При застосуванні фасетного методу класифікації слід додержуватися таких основних правил: 1) ознаки, які використовуються в різних фасетах, не повинні повторюватися; 2) із усіх ознак, що характеризують множину об'єктів класифікації, відбираються і фіксуються лише суттєві, які забезпечують розв'язування економічних задач.
Переваги фасетної системи класифікації:
o можливість використання великої кількості ознак класифікації;
o можливість простої модифікації всієї системи класифікації без зміни структури наявних угруповань.
Недоліком фасетної системи класифікації є складність її будови.
Дескрипторна (описова) система класифікації використовує мову опису інформаційних об'єктів (наприклад тезаурусів), яка схожа на природну мову. Особливо широко вона використовується в бібліотечній системі пошуку. Суть цієї системи класифікації полягає в тому, що:
o відбирається сукупність ключових слів або словосполучень, що описують конкретну ПрО або сукупність інформаційних об'єктів. Серед ключових слів можуть бути синоніми. Вибрані ключові слова і словосполучення підлягають нормалізації, тобто із сукупності синонімів вибирається найбільш вживаний;
o створюється словник дескрипторів - ключових слів і словосполучень, відібраних у результаті процедури нормалізації. Між дескрипторами встановлюються зв'язки, які дають змогу розширяти межі пошуку інформації.
Зв'язки можуть бути трьох типів:
1) синонімічні - визначають сукупності близьких за значеннями ключових слів;
2) родові - відображають включення певного класу об'єктів до іншого як підмножини;
3) асоціативні - мають спільні властивості. Приклад
Синонімічний зв'язок: студент <-> учень <-> школяр. Родовий зв'язок: університет <-> факультет <-> кафедра. Асоціативний зв'язок: студент <-> іспит <-> професор "-" <-" аудиторія.
Штрихове кодування економічної інформації
2.6. Єдина система класифікації та кодування техніко-економічної інформації
Висновки
Розділ 3. Cучасні підходи до розроблення -і впровадження інформаційних систем
Життєвий цикл програмного забезпечення
Моделі життєвого циклу ПЗ
3.1. Інженерія вимог
3.2. Автоматизація проектування ІС
Структурний підхід до розроблення ПЗ