Інформаційні технології та моделювання бізнес-процесів - Томашевський О.М. -
4.4. Нові концепції у теорії штучного інтелекту

На сьогоднішній день штучний інтелект (Artifical Intelligence, AI) залишається одним із найбільш перспективних і нерозкритих напрямків розвитку інформаційних управляючих систем та технологій. До складу понять штучного інтелекту сьогодні відносять нейронні мережі, нечітку логіку, експертні системи, ЕОМ п'ятого покоління, системи моделювання мислення.

Провідним лідером у розробці інтелектуального програмного забезпечення, що ґрунтується на засадах штучного інтелекту, є компанія Numenta, серед останніх розробок якої є програмне забезпечення, що здійснює моделювання суджень і працює за принципами людського мозку.

Програмне забезпечення Numenta працює за принципами самонавчальної штучної нейронної мережі. Топологія мережі відображує ієрархічну природу існуючої реальності подібно до того, як це здійснює наша свідомість, постійно деталізуючи оточуючу дійсність на сукупність складових.

У теоретичних напрямах розвитку систем штучного інтелекту розрізняють дві провідні гілки, які відповідають висхідним та низхідним методам моделювання.

Згідно висхідного методу моделювання теоретичні положення ґрунтуються на основі дослідних даних нейрофізіології.

У відповідності з низхідним методом моделювання теоретичні положення ґрунтуються на відтворенні зовнішніх проявів інтелектуальної поведінки індивідуума. Цей метод моделювання, який також називається функціоналістським, є орієнтованим на широке практичне застосування, тому отримав значну фінансову і академічну підтримку та здобув значне поширення.

За міркуваннями функціоналістів (на чолі з М.Мінскі) спроби використання теорії штучних нейронних мереж до моделювання мозку є недоцільними, оскільки вважається, що мозокперевантажений еволюційним навантаженням підсвідомих нераціональних конструкторських рішень. Як показує практика досліджень, системи, розроблені без урахування еволюційної передісторії, часом можуть перевершувати свої біологічні аналоги. Прикладами можуть служити твердження, що автомобіль обганяє найшвидшу тварину світу - гепарда, а літак - обганяє найшвидшого птаха - стрижа. Крім цього, функціоналісти виправдовують своє прохолодне ставлення до нейрофізіологічних концепцій, виходячи з того, що вона знаходиться лише на початкових етапах розуміння будови мозку.

В опозиційній науковій течії - нейрофізіологічній - існують інші думки. Вчені даного напрямку стверджують, що в області штучного інтелекту поки що невідомо нічого, що може бути порівняне з літаком чи автомобілем. Серед найновіших досліджень цього напрямку слід також зазначити проект Blue Brain , у межах якого виконується комп'ютерне моделювання неокортекса миші з точністю до одного нейрона. Різні думки вчених існують також стосовно одного з ключових понять кібернетики - самосвідомості. Дехто з вчених стверджує, що воно може виникнути само собою. Однак є також противники такого твердження (Дж. Серл).

Прикладом програмного забезпечення з інтелектуальними здібностями може служити програма "Бармаглот" Ролло Карпентера, яка побудована як самонавчальна система, яка формує репліки з бази даних, яка наповнюється під час розмов з людьми.

Згідно з поглядами іншого вченого - Роджера Пенроуза - людський мозок представляє собою квантовий комп'ютер, який перевершує за обчислювальною потужністю сучасні супер комп'ютери у декілька порядків.

Ситуацію, що склалася у наукових поглядах з даного напрямку можна охарактеризувати як революційну, і таку, яка передбачає найближчим часом розробки ефективного методу її розв'язання.

Серед провідних вчених, розробників цього напряму, слід зазначити Джеффа Хоукінза (Jeff Hawkins), який приймав активну участь у розробці концепції КПК. Так, за його прямої участі були створені компанії Palm Computing та Handspring, які виготовили КПК PalmPilot та смартфон Treo. У своїй праці [Hawkins J., Blakeslee S. On intelligence] він пропонує новаторську концепцію моделювання інтелекту, основану на понятті "передбачувальної пам'яті" (memoryprediction framework). Свідомість, наділена функцією передбачувального моделювання, є найціннішим природнім здобутком.

Людський мозок зберігає спогади, щоб постійно робити передбачення про оточуючу дійсність (про те, що людина бачить, відчуває, чує). Така система передбачень працює згідно зі схемою: питання - перевірка -відповідь. Перевірка здійснюється шляхом порівняння з наявною базою даних паттернів. Коли після перевірки питання формується певний паттерн, який відсутній у наявному контексті, то передбачення не справджується, формується негативна відповідь і похибка привертає особливу увагу особи. При цьому суттєве значення має швидкість проходження відповідних процесів згідно із вказаною схемою. Згідно з прикладом, наведеним у праці Д. Хоукінза, поняття передбачення отримує розширене трактування, згідно з яким його перевірка може виконуватися практично миттєво. Подібне трактування процесів обробки інформації можна пов'язати з функціонуванням мозку. Так, про особу, мозок якої зупинив виконувати передбачення про оточуючу його дійсність, кажуть: "втратила свідомість".

З точки зору нейрофізіології, резервуаром свідомості є кора головного мозку, а точніше - зовнішня його частина, яка називається неокортексом, і яка складається з множини ієрархічно пов'язаних шарів. Нейрони першого шару візуальної області неокортекса можна умовно порівняти з комірками CCD-матриці цифрової камери; нейрони вищого рангу збуджуються при виявленні таких структурних графічних елементів, як границі контурів, або рух текстури у певному напрямку. Нейрони найвищих шарів ієрархії виконують аналіз найбільш абстрактних характеристик зображення: наприклад, спеціалістами доведено існування нейронів, які активізуються при наявності у довільній області поля зору певного людського обличчя. Згідно з теоретичними гіпотезами, інформація у такій структурі повинна поширюватися тільки знизу вверх - від рецепторів до нейронів, які відповідають за пам'ять і представлення картини бачення світу. Саме таким чином і передається інформація у створених на сьогодні системах машинного зору. Однак, у неокортексі живої істоти процеси виконуються дещо по-іншому: низхідний потік виявляється більш інтенсивним, ніж вихідний. В результаті такої системи обробки інформації найнижчий шар візуальної області неокортекса може отримувати стільки ж сигналів від вищих шарів, скільки отримує від фоторецепторів сітчатки. Проблема полягає у дослідженні типу інформації, яку переносять ці сигнали. За гіпотезою Д. Хоукінза ці сигнали містять передбачення.

На сьогодні у світі успішно працюють такі провідні наукові центри з проблем дослідження штучного інтелекту як Массачусетський технологічний інститут, Каліфорнійський університет в Берклі, Нейронауковий інститут у Редвуді. З 2005 р. розробки останнього закладу були доведені до рівня комерціалізації, що призвело до створення компанії Numenta, а інститут одержав статус філії Каліфорнійського університету.

На сьогодні компанія Numenta приступила до розповсюдження дослідної версії обчислювальної платформи NuPIC (Numenta Platform for Intelligent Computing), з допомогою якої користувач може самостійно будувати системи, які реалізують принцип передбачувальної пам' яті, і використовувати їх для розв'язання задач, пов'язаних з аналізом та екстраполяцією різноманітних даних. Інсталяційний пакет пакет програми NuPIC поширюється у двох версіях: для операційних систем Linux та Mac OS. Для користувачів ОС Microsoft Windows пропонується запускати на виконання Linux-версію NuPIC з допомогою спеціальної програми фільтра-емулятора. Рекомендований об'єм оперативної пам' яті для ефективної роботи програми повинен складати від 1 до 2 Гбайт. Програмний пакет містить інструменти для створення і виконання додатків, модельованих кортексоподібними структурами, згідно з термінологією Numenta - HTM-системами, а також вихідні коди на C++ та Python, документацію та приклади.

Основним будівельним елементом HTM-системи є вузол (node), пов'язаний з нижче- та вищерозміщеними вузлами двонапрямленими зв'язками, подібно до нейронів у моделі неокортекса. Нижній шар вузлів отримує вихідну інформацію від рецепторів, роль яких може виконувати функція читання файлу з даними, і виводити як передбачення інформацію, очищену від завад; створення вузлів верхнього шару трактується як найбільш узагальнений результат аналізу вихідної інформації. Під час функціонування HTM-системи кожний вузол здатний складати і оптимізувати набір з n векторів, які відповідають характерним поєднанням з поступаючих у нього сигналів. Створення вузла описується вектором з n скалярних величин, які у сумі дорівнюють одиниці, що відповідає достовірності кожної з гіпотез.

Пам'ять про властивості об'єктів компактно реалізується у сукупності таблиць станів вузлів відповідної HTM-системи. Врахування часової компоненти у самонавчанні HTM (Hierarchical Temporal Memory) системи потрібно для того, щоб зображення різних об'єктів не асоціювалися у верхніх шарах вузлів з різними гіпотезами. Неперервне спостереження за рухом об'єктів допомагає HTM-системі пов'язати разом їх різноманітні ракурси.

Одним із прикладів практичного застосування HTM-систем може служити демонстраційний додаток Pictures, що призначений для розпізнавання образів. Програмний додаток Pictures навчений розпізнавати у монохромних піктограмах, розмірами 32х32 піксела один із 48 стандартних символів. Така нетривіальна задача розпізнавання розв'язується методом на основі платформи NuPIC, побудованої у вигляді 4шарової HTM-системи. Вузли її нижнього шару, згруповані у матрицю 8х8, сприймають по 16 сигналів, що поступають з фрагментів розмірами 4х4 піксела, а вершиною піраміди є вузол з 48 гіпотезами, найбільш імовірні з яких відображаються справа у діалоговому вікні у вигляді стовпчикової діаграми.

Особливістю HTM-систем є відносна вимогливість до обчислювальних ресурсів. Однак, цей недолік компенсується можливостями розпаралелювання обчислень. У найближчій перспективі очікується поява спеціальних нейрочипів, які реалізують функціональність HTM-систем на апаратному рівні.

Серед замовників, які успішно використовують програмну систему Numenta - компанія EDSA Micro, яка спеціалізується на моніторингу промислових мереж електроживлення і зацікавлена у методах оперативної інтерпретації даних, які поступають від декількох тисяч джерел; автомобілебудівна фірма, яка використовує HTM-системи для виявлення аварійнонебезпечних ситуацій на основі показів з інфрачервоних, ультразвукових та інших бортових сенсорів; нафтогазорозвідувальна компанія (не розголошує своєї назви), що розробляє методи трансформації даних, які отримуються з сейсмологічних джерел та супутників для виявлення перспективних місць буріння свердловин нафто- та газовидобування; адміністрація торгівельного Web-порталу, яка з допомогою інтелектуального програмного забезпечення Numenta планує відслідковувати споживчі нахили користувачів з метою покращення якості їх обслуговування. Також передбачається успішне використання програми для аналізу та інтерпретації результатів спостережень за космологічними та квантовомеханічними явищами, які за складністю перевищують можливості звичайної комп'ютерної обробки.

На сьогоднішній день пріоритетом компанії Numenta - організація масштабного вивчення сфер практичного застосування HTM-систем, тому дослідна версія програмної платформи на сьогодні поширюється з відкритою ліцензією на використання.

Однак, розроблена програмна система має певні недоліки.

Насамперед, навчання НТМ- системи є доволі складним процесом. Іншим критичним фактором стосовно відповідності програмних процесів, які моделюються системою Numenta до реальних процесів мислення живих істот є результати ветеринарних фізіологічних досліджень, які показують, що, наприклад, мозок ворони та й деяких інших достатньо розумних птахів майже зовсім немає кори (кортекса), однак це зовсім не зменшує їх розум. Більше того, саме ця категорія птахів досить добре піддається тренуванню.

Розроблені на сьогодні НТМ- системи здатні запам'ятовувати і передбачати. Але вони не здатні формувати емоції, які характерні для людини, та й для деяких тварин з родини ссавців. Існує гіпотеза, що відповідні зони зосереджені не лише в кортексі, а й у інших частинах головного мозку. Однак, без програмного відтворення їх роботи неможливе коректне відтворення процесу мислення. Тому така програма, що відтворює роботу частини "беземоційного" мозку не зможе розв'язати навіть елементарні тести на мислення, наприклад, тест Тьюринга.

Тому на сьогоднішній день, за думкою багатьох вчених даного наукового напрямку існує думка, що розроблена програмна система Numenta, яка ґрунтується на теоретичних концепціях моделі штучного інтелекту Д. Хоукінза, є лише початковим етапом у довжелезному ланцюзі наукових досліджень, які повинно буде здійснити людство в процесі свого наукового розвитку.

Резюме

Для аналізу і розв'язання економічних задач, сучасні інформаційні технології пропонують широкий спектр засобів прийняття рішень із використанням даних, знань, об'єктивних чи суб'єктивних моделей, технологій видобування знань. Методи видобування знань можна умовно розбити на п'ять груп: класифікація; кластеризація (сегментація); регресія; асоціація.

Завданням напряму штучного інтелекту є розробка апаратно-програмних засобів, що дозволяють користувачу формулювати і розв'язувати інтелектуальні задачі. До складу понять штучного інтелекту сьогодні відносять нейронні мережі, нечітку логіку, експертні системи, комп'ютери п'ятого покоління, системи моделювання мислення, тощо. Нейронні мережі можуть ефективно використовуватись для розв'язання задач прогнозування на основі аналізу часових рядів; ідентифікації об'єктів і класифікації; оптимізації.

Ключові слова

Штучний інтелект, експертні системи, виявлення (видобування) знань, сегментація (кластеризація) даних, шаблон, асоціація, штучний нейрон, нейронна мережа, мапа Кохонена, системи підтримки прийняття рішень, НТМ- система.

Запитання і завдання для обговорення та самоперевірки:

► Назвіть види задач, що розв'язуються засобами штучного інтелекту.

► Охарактеризуйте документальний та експертний способи отримання знань.

► Які існують методи видобування знань з даних?

► Поясність, чому для визначення груп покупців неможливо застосувати метод класифікації.

► Який метод виявлення знань використовується при визначенні вірогідності повернення кредиту?

► Наведіть приклади асоціацій - серед продовольчих або продуктових товарів.

► Охарактеризуйте призначення штучного інтелекту.

► Назвіть переваги і недоліки застосування штучного інтелекту.

► Опишіть структуру нейронної мережі.

► Для яких задач можуть ефективно використовуватись мапи, що саморганізуються?

► Охарактеризуйте етапи технології КDD.

► Охарактеризуйте дві провідні гілки у теоретичних напрямках розвитку систем штучного інтелекту, які відповідають висхідним та низхідним методам моделювання.

5. Створення сховищ даних. Технології OLAP та Data Mining
5.1. Структура сховища даних та оптимізація його обсягів
5.2. Технологія аналітичної обробки даних в реальному часі OLAP
5.3. Технологія аналізу сховищ даних (Data Mining)
6. Автоматизовані інформаційні системи для підприємств та організацій
6.1. Інформаційні системи і технології в сучасному суспільстві
6.2. Основні етапи розвитку інформаційних систем
6.3. Класифікація інформаційних систем
6.4. Експертні системи
6.5. Автоматизовані інформаційні системи для підприємств та організацій