Проблемне середовище

Пробле́мне середо́вище являє собою «проблему», для якої раціональний агент є «розв'язком».

Визначення

Проблемне середовище, в штучному інтелекті для раціонального агента, є об'єднанням факторів:

  • Показники продуктивності (Performance measure), які визначають критерії успіху
  • Середовище (Environment) — знання агента про середовище, які були отримані раніше
  • Виконавчі механізми (Actuators), які можуть бути виконані агентом
  • Сенсори (Sensors) — послідовність актів сприйняття, які відбулись дотепер

За своїми факторами проблемне середовище може позначатись скорочено PEAS.

Класифікація проблемних середовищ

Спостерігаються повністю або частково

  • Якщо сенсори агента надають йому доступ до повної інформації середовища в кожний момент часу → повністю спостерігається. Агент не потребує збереження інформації про навколишній світ;
  • Середовище може спостерігатись частково через сенсорний шум або відсутність певних її характеристик в інформації, яка отримується від сенсорів.

Детерміновані або стохастичні

  • Якщо наступний стан середовища повністю визначається поточним станом та дією, яку виконує агент, → детерміноване середовище; в іншому випадку → стохастичне;
  • Якщо середовище є детермінованим в усіх відношеннях, окрім дій інших агентів, то таке середовище називається стратегічним.

Епізодичне або послідовне

  • В епізодичному середовищі досвід агента складається з нерозривних епізодів, де кожний епізод включає в себе сприйняття середовища агентом, а потім виконання певної дії. Кожний епізод не залежить від дій на попередніх;
  • У послідовних середовищах кожна дія може вплинути на майбутні дії.

Статичне або динамічне

  • Якщо середовище може змінюватись під час того, як агент обирає наступну дію, то це динамічне для даного агента середовище; інакше середовище є статичним;
  • Якщо з плином часу саме середовище не змінюється, а змінюються показники продуктивності агента, то це напівдинамічне середовище.

Дискретне або неперервне

  • Різниця між дискретним та неперервним варіантами середовища може відноситись до станів середовища, способу ліку часу, а також сприйняття та діям агента.

Одноагентне або мультиагентне

  • Для мультиагентних: конкурентне або кооперативне.

Приклад середовища

Автономне управління. Світ автоматичного водія таксі

Система комп'ютерного зору Alvinn була навчена водінню автомобіля, дотримуючись певної смуги руху. В університеті CMU ця система була розміщена в мікроавтобусі, керованому комп'ютером NavLab, та використовувалася для проїзду по Сполученим Штатам; протягом 4586,6 км система забезпечувала рульове управління автомобілем протягом 98 % часу. Людина брала на себе управління лише протягом останніх 2 %, головним чином на виїзних пандусах. Комп'ютер NavLab був обладнаний відеокамерами, які передавали зображення дороги в систему Alvinn, а потім ця система обчислювала найкращий напрямок руху, ґрунтуючись на досвіді, отриманому в попередніх навчальних пробігах.

Елементи середовища

  • Показники продуктивності
Безпечна, швидка, комфортна їзда в рамках правил дорожнього руху, максимізація прибутку
  • Середовище
Дороги, інші транспортні засоби, пішоходи, клієнти
  • Виконавчі механізми
Рульове управління, акселератор, гальмо, світлові сигнали, клаксон, дисплей
  • Сенсори
Відеокамери, ультразвукової далекомір, спідометр, глобальна система навігації і визначення положення, одометр, акселерометр, датчики, двигуна, клавіатура

Основні елементи PEAS для ряду інших типів агентів

Тип агентаПоказники продуктивностіСередовищеВиконавчі механізмиДатчики
Медична діагностична системаВдале завершення лікування пацієнта, мінімізація витрат, відсутність приводів для суддівських процесівПацієнт, лікарня, персоналВивід питань, тестів, діагнозів, рекомендацій, направленьВведення з клавіатури симптомів, результатів лабораторних експериментів, відповідей пацієнта
Система аналізу зображень, отриманих із супутникаПравильна класифікація зображенняКанал передачі даних від приладу орбітального супутникаВивід на дисплей результатів класифікації окремого фрагменту зображенняМасиви пікселів із інформацією про колір
Робот-сортувальник деталейВідсоткові показники безпомилкового сортування по лоткамСтрічковий конвеєр, з деталями, що рухаються на ньому; лоткиШарнірний маніпулятор та захопленняВідеокамера, датчики кутів повороту шарнірів
Контролер очищувальної системиМаксимізація ступеню очистки, продуктивності, безпекиОчищувальний прилад, операториКлапани, насоси, нагрівачі, дисплеїТемпература, тиск, датчики хімічного складу
Інтерактивна програма навчання англійській мовіМаксимізація оцінок студентів на екзаменахМножина студентів, екзаменаційне агентствоВивід на дисплей вправ, рекомендацій, виправленьВведення з клавіатури

Тип середовища для системи водія Alvinn

  • Спостерігаються повністю або частково
Автоматизований водій не має відомостей про те, які маневри мають намір виконати інші водії. Тому середовище є таким, що частково спостерігається.
  • Детерміновані або стохастичні
Середовище керування автомобілем є стохастичним, оскільки ніхто не може точно передбачити поведінку всіх інших транспортних засобів, більше того, в будь-якому автомобілі абсолютно несподівано може статися прокол шини або зупинка двигуна.
  • Епізодичне або послідовне
Дане середовище є послідовним, короткочасні дії можуть мати довготривалі наслідки.
  • Статичне або динамічне
Середовище керування автомобілем є динамічним, оскільки інші автомобілі продовжують рух і в ході того, як алгоритм водіння визначає, що робити далі.
  • Дискретне або неперервне
Керування автомобілем — це проблема з безперервно мінливим станом і безперервно поточним часом, оскільки швидкість та місцезнаходження самого таксі та інших транспортних засобів змінюються в певному діапазоні безперервних значень, до речі ці зміни відбуваються в часі плавно. Дії з керування автомобілем також є безперервними (постійне регулювання кута повороту керма тощо). Вхідні дані від цифрових камер надходять дискретно, але зазвичай розглядаються так що представляють безперервно мінливі швидкості та місцезнаходження.
  • Одноагентне або мультиагентне
Дане середовище є мультиагентне.

Властивості інших варіантів середовища та їх характеристики

Проблемне середовищеЧастково чи повністю спостерігаєтьсяДетермінована, стратегічна, стохастичнаЕпізодична, послідовнаСтатистична, динамічна, полудинамічнаДискретна чи неперервнаОдноагентна чи мультиагентна
Вирішення кросвордів
Повністю
Детермінована
Послідовна
Статична
Дискретна
Одноагентна
Гра в шахи з контролем часу
Повністю
Стохастична
Послідовна
Полудинамічна
Дискретна
Мультиагентна
Гра в покер
Частково
Стохастична
Послідовна
Статична
Дискретна
Мультиагентна
Гра в нарди
Повністю
Стохастична
Послідовна
Статична
Дискретна
Мультиагентна
Медична діагностика
Частково
Стохастична
Послідовна
Динамічна
Неперервна
Одноагентна
Аналіз зображення
Повністю
Детермінована
Епізодична
Полудинамічна
Неперервна
Одноагентна
Робот-сортувальник деталей
Частково
Стохастична
Епізодична
Динамічна
Неперервна
Одноагентна
Контролер очисної станції
Частково
Стохастична
Послідовна
Динамічна
Неперервна
Одноагентна
Інтерактивна програма для навчання англійської мови
Частково
Стохастична
Послідовна
Динамічна
Дискретна
Мультиагентна

Див. також

Джерела

  • Stuart J. Russel and Peter Norvig, Artifical Intelligence: A Modern Approach, 2 edition, 2006.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.