Дерева рішень та задачі класифікації

Автор работы: Пользователь скрыл имя, 09 Мая 2013 в 11:59, курсовая работа

Краткое описание

У роботі розглядатимуться положення, пов’язані з деревами рішень та задачами класифікації.
Метод дерева рішень - це один з методів автоматичного аналізу величезних масивів даних. Перші ідеї створення "дерев рішень" починаються з робіт П.Ховленда і Е.Ханта кінця 50-х років XX століття. Проте основоположною роботою, що дала імпульс для розвитку цього напряму, стала книга Е.Ханта, Дж.Мерина і П.Стоуна "Experiments in Induction", яку було опубліковано в 1966 р.

Содержание

Вступ……………………………….……………………………………….…….3

2. Основні означення та властивості….…………………………………………..4

3. Рекурсія. Обхід дерев. Префіксна та постфіксна форми запису виразів….….8

4. Бінарне дерево пошуку………………………………………….……….…….15

5. Дерево рішень……………………………………………….….……………….20

6. Бектрекінг (пошук із поверненням)…………………………...……………….29

7. Висновок………………………………………………………………………….37

8. Список викоританої літератури……………………………………………….38

Скачать полностью (1.01 Мб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

Курсова робота.docx

— 1.44 Мб (Скачать документ)

Зазначимо, що у кожній вершині дерева на рис. 1.30 відповідає послідовність довжиною від 0 до 4. У неї k-й член дорівнює номеру клітинки з ферзем у k-му стовпці. Наприклад, вершинам шляху на рис. 1.30, який веде до успішного результату, відповідають такі послідовності: λ, (2), (2,4), (2,4,1), (2,4,1,3).

Приклад 1.20. Суми елементів підмножин [52]. Задано множину натуральних чисел {x₁, x₂, …, x_n}. Потрібно знайти її підмножину, сума елементів якої дорівнює заданому числу М.

Починаємо з порожньої множини. Нагромаджуємо суму, послідовно добираючи доданки. Число з послідовності x₁, x₂,…,x_n долучають до суми, якщо сума після додавання цього числа не перевищує M. Якщо сума настільки велика, що додавання будь-якого нового числа перевищує М, то повертаємось і змінюємо останній доданок у сумі. На рис. 1.33 проілюстровано алгоритм бектрекінг для задачі відшукання підмножин множини {31, 27, 11, 7, 5} із сумою 39.

Приклад 1.21. Побудова всіх максимальних незалежних множин вершин у простому графі G=(V,Г) [20,35]. Тут граф подано як пару, утворену множиною вершин V та відповідністю Г, котра показує, як зв’язані між собою вершини (див. підрозділ 1.3). Почнемо з порожньої множини й будемо додавати до них вершини зі збереженням незалежності. Нехай S_k – уже отримана множина з k вершин, Q_k – множина вершин, котрі можна додати до S_k, тобто Серед вершин Q_k розрізняють ті, котрі вже було використано для розширення S_k (їх позначають Q_k^-), і ті, котрі ще не використано (їх позначають Q⁺_k). Загальна схема алгоритму бектрекінг для задачі побудови максимальних незалежних множин вершин у простому графі має такий вигляд.

Прямий крок від k до k+1 полягає у виборі вершини :

_{Крок
повернення від} _k+_{1 до}_k_:

Якщо множина вершини S_k максимальна, то . Якщо , то множину S_k було розширено раніше, і вона не максимальна. Отже, перевірку максимальності задають такою умовою: .

Тут, як і завжди, доцільно намагатися почати кроки повернення якомога раніше, бо це обмежить розміри «непотрібної» частини дерева пошуку. У зв'язку з цим зауважимо таке. Нехай v є та . Цю вершину ніколи не вилучити з , оскільки з вилучають тільки вершини, суміжні з вершинами множини . Отже існування такої вершини v, що v є Q_k і - достатня умова для повернення. Окрім того, k ≤ n-1.

Алгоритм побудови всіх максимальних незалежних множин вершин у простому графі G = (V,Г)

Крок 1. Ініціалізація. Виконати S₀:=, ,, k=0.

Крок 2. Прямий крок. Вибрати вершину x є і сформувати, як описано вище, множини , при цьому залишити та без змін. Виконати k:= k+1.

Крок 3. Перевірка. Якщо існує така вершина v, що v є і , то перейти до кроку 5, інакше перейти до кроку 4.

Крок 4. Якщо , то надрукувати максимальну незалежну множину S_k та перейти до кроку 5. Якщо , а то перейти до кроку 5, інакше перейти до кроку 2.

Крок 5. Крок повернення. Виконати k:=k-1. Вилучити вершину x із S_k+1, щоб одержати S_k. Виправити та , для чого вилучити вершину x із множини і долучити її до . Якщо k=0 та , то зупинитися (на цей момент уже буде надруковано всі максимальні незалежні множини). Інакше перейти до кроку 3.

Унаслідок зв'язку між кліками й незалежними множинами цей алгоритм можна використовувати також і для побудови максимальних клік.

Висновок

Отже, у цій роботі описані основні означення дерев рішень, алгоритми обходу дерев рішень, префіксні та постфіксні форми запису виразів, бінарне дерево пошуку, розглянувся алгоритм побудови дерева рішень ID3, який був реалізований на прикладі, для кращого його розуміння. Також було звернуто увагу на бектрекінг(пошук із поверненням), та декілька видів задач, які мають відношення до дерев рішень.

Можна сказати, що дерево рішень — це кореневе дерево, у якому кожну внутрішню вершину позначено запитанням. Ребра, які виходять з кожної такої вершини, подають можливі відповіді на запитання, асоційоване з цією вершиною. Кожний листок являє собою прогноз розв’язку розглядуваної проблеми. Дерево рішень часто використовують для класифікації об’єктів. У такому разі кожна внутрішня вершина дерева рішень асоційована з якоюсь властивістю, що характеризує об’єкти, а кожному можливому значенню цієї властивості відповідає піддерево. Листки відображають результати класифікації. Алгоритм побудови дерева рішень – один із найважливіших засобів індуктивного відновлення правил за даними, який забезпечує автоматичну побудову баз знань діагностичних експертних систем.

За допомогою дерев рішень можна визначати, наприклад, оцінку ризику підприємницької фірми, або спрогнозувати результат будь – яких спортивних матчів. Метод дерева рішень застосовують на практиці також у ситуаціях, коли результати одного рішення впливають на подальші рішення, тобто, як говорять, для прийняття послідовних рішень.

Тобто, роблячи підсумок, можна із впевненістю сказати, що дерева рішень та задачі класифікації займають досить важливе місце у науці, та у різних галузях комп’ютерних технологій.

Список використаної літератури
Дискретна математика: Підручник. – Львів: «Магнолія - 2006», 2010. – 432 с.
Методы и модели анализа даних: OLAP и Data Mining. – СПб.:БХВ-Петербург, 2004. – 336с.: ил.
Мошков М. Ю. Деревья решений. Теория и приложения. – Нижний Новгород: Нижегород. ун-т, 1994. – 175 с.

Информация о работе Дерева рішень та задачі класифікації