Машина Больцмана

Маши́на Бо́льцмана (англ. Boltzmann machine) — вид стохастичної рекурентної нейронної мережі, винайденої Джеффрі Хінтоном і Террі Сейновскі 1985 року.[1] Машина Больцмана може розглядатися як стохастичний породжувальний варіант мережі Гопфілда.

Приклад графічного подання машини Больцмана. В даному прикладі 3 прихованих і 4 видимих нейрона

Фахівці зі статистики називають такі мережі випадковими марковськими полями. Мережу названо машиною Больцмана на честь австрійського фізика Людвіга Больцмана, одного з творців статистичної фізики.

Ця мережа використовує для навчання алгоритм імітації відпалу і виявилася першою нейронною мережею, здатною навчатися внутрішнім поданням, розв'язувати складні комбінаторні завдання. Незважаючи на це, через низку проблем, машини Больцмана з необмеженою зв'язністю не можуть застосовуватися для розв'язання практичних задач. Якщо ж зв'язність обмежено, то навчання може бути достатньо дієвим для застосування на практиці. Зокрема, з каскаду обмежених машин Больцмана будується так звана глибинна мережа переконань.

Модель

Як і мережа Гопфілда, машина Больцмана є мережею вузлів (нейронів) з визначеним для неї поняттям «енергії». Розрахунок глобальної енергії виконується ідентичним за формою з мережею Гопфілда чином:

Де:

  • сила зв'язку між вузлами і .
  • стан , , вузла .
  • поріг для вузла .

Зв'язки мають такі обмеження:

  • . (нейрон не може мати зв'язок з самим собою);
  • (всі зв'язки є симетричними).

Термічна рівновага

Одним з основних недоліків мережі Гопфілда є схильність до «стабілізації» стану мережі в локальному, а не в глобальному мінімумі. Практично бажано, щоб мережа переходила в глибокі мінімуми енергії частіше, ніж неглибокі, і щоб відносна ймовірність переходу мережі в один з двох мінімумів з різною енергією залежала тільки від співвідношення їх глибин. Це дозволило б керувати можливостями отримання конкретних вихідних векторів стану шляхом зміни профілю енергетичної поверхні системи за рахунок модифікації ваг зв'язків. На основі цих міркувань і побудовано машину Больцмана.

Ідея застосування «теплового шуму» для виходу з локальних мінімумів і підвищення ймовірності попадання в більш глибокі мінімуми належить С. Кірпатріку. На основі цієї ідеї розроблено алгоритм імітації відпалу. Введімо деякий параметр  — аналог рівня теплового шуму. Тоді ймовірність активності деякого вузла визначається на основі ймовірнісної функції Больцмана:

де  — рівень теплового шуму в мережі;  — сума ваг зв'язків k-го вузла зі всіма активними на даний момент вузлами.

Див. також

Примітки

  1. Ackley, David H.; Hinton, Geoffrey E.; Sejnowski, Terrence J. A Learning Algorithm for Boltzmann Machines. — Cognitive Science 9 (1), 1985. — С. 147–169. (англ.)

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.