Машина Больцмана
Маши́на Бо́льцмана (англ. Boltzmann machine) — вид стохастичної рекурентної нейронної мережі, винайденої Джеффрі Хінтоном і Террі Сейновскі 1985 року.[1] Машина Больцмана може розглядатися як стохастичний породжувальний варіант мережі Гопфілда.
Фахівці зі статистики називають такі мережі випадковими марковськими полями. Мережу названо машиною Больцмана на честь австрійського фізика Людвіга Больцмана, одного з творців статистичної фізики.
Ця мережа використовує для навчання алгоритм імітації відпалу і виявилася першою нейронною мережею, здатною навчатися внутрішнім поданням, розв'язувати складні комбінаторні завдання. Незважаючи на це, через низку проблем, машини Больцмана з необмеженою зв'язністю не можуть застосовуватися для розв'язання практичних задач. Якщо ж зв'язність обмежено, то навчання може бути достатньо дієвим для застосування на практиці. Зокрема, з каскаду обмежених машин Больцмана будується так звана глибинна мережа переконань.
Модель
Як і мережа Гопфілда, машина Больцмана є мережею вузлів (нейронів) з визначеним для неї поняттям «енергії». Розрахунок глобальної енергії виконується ідентичним за формою з мережею Гопфілда чином:
Де:
- сила зв'язку між вузлами і .
- стан , , вузла .
- поріг для вузла .
Зв'язки мають такі обмеження:
- . (нейрон не може мати зв'язок з самим собою);
- (всі зв'язки є симетричними).
Термічна рівновага
Одним з основних недоліків мережі Гопфілда є схильність до «стабілізації» стану мережі в локальному, а не в глобальному мінімумі. Практично бажано, щоб мережа переходила в глибокі мінімуми енергії частіше, ніж неглибокі, і щоб відносна ймовірність переходу мережі в один з двох мінімумів з різною енергією залежала тільки від співвідношення їх глибин. Це дозволило б керувати можливостями отримання конкретних вихідних векторів стану шляхом зміни профілю енергетичної поверхні системи за рахунок модифікації ваг зв'язків. На основі цих міркувань і побудовано машину Больцмана.
Ідея застосування «теплового шуму» для виходу з локальних мінімумів і підвищення ймовірності попадання в більш глибокі мінімуми належить С. Кірпатріку. На основі цієї ідеї розроблено алгоритм імітації відпалу. Введімо деякий параметр — аналог рівня теплового шуму. Тоді ймовірність активності деякого вузла визначається на основі ймовірнісної функції Больцмана:
де — рівень теплового шуму в мережі; — сума ваг зв'язків k-го вузла зі всіма активними на даний момент вузлами.
Див. також
Примітки
- Ackley, David H.; Hinton, Geoffrey E.; Sejnowski, Terrence J. A Learning Algorithm for Boltzmann Machines. — Cognitive Science 9 (1), 1985. — С. 147–169. (англ.)
Посилання
- Talk at Google by Geoffrey Hinton на YouTube (англ.)