Дерева рішень у машинному навчанні
Дерева рішень у машинному навчанні використовуються як передбачувальні моделі, що відображають знання про об'єкт (представлені гілками) у множину рішень. Це один з підходів до передбачувального моделювання у статистиці, добуванні даних та машинному навчанні.
Огляд
Навчання на дереві рішень - це метод, який зазвичай використовується в аналізі даних.[1] Мета - створити модель, яка передбачає значення цільової змінної на основі кількох вхідних змінних.
Дерево рішень - це просте представлення для класифікації прикладів. Для цього розділу припустимо, що всі вхідні дані Особливість мають скінченні дискретні області визначення, і існує одна цільова ознака, яка називається "класифікація". Кожен елемент домену класифікації називається `` класом .
Дерево рішень або дерево класифікації - це дерево, в якому кожен внутрішній (нелистовий) вузол позначений вхідною ознакою. Дуги, що надходять від вузла, позначеного вхідною ознакою, позначаються кожним із можливих значень цільової ознаки, або дуга веде до підлеглого вузла прийняття рішень на іншій вхідній ознаці. Кожен лист дерева позначається класом або розподілом ймовірностей по класах, що означає, що набір даних класифікований деревом або до певного класу, або до певного розподілу ймовірностей (яке, якщо дерево рішень коректно побудоване, зміщений до певних підмножин класів).
Примітки
- Rokach, Lior; Maimon, O. (2008). Data mining with decision trees: theory and applications. World Scientific Pub Co Inc. ISBN 978-9812771711.