Построение и анализ древовидных объектов в Matlab

Автор работы: Пользователь скрыл имя, 11 Января 2013 в 18:24, лабораторная работа

Краткое описание

Деревья классификации - это метод, позволяющий предсказывать принадлежность наблюдений или объектов к тому или иному классу категориальной зависимой переменной в зависимости от соответствующих значений одной или нескольких предикторных переменных. Построение деревьев классификации - один из наиболее важных методов, используемых при проведении "добычи данных”.

Прикрепленные файлы: 1 файл

postroenie_i_analiz_drevovidnyh_obektov_v_matlab.doc

— 68.00 Кб (Скачать документ)

Федеральное агентство  образования и науки РФ

Югорский Государственный  Университет

 

 

 

 

 

 

 

 

 

Отчет по лабораторной работе №11 на тему

«Построение и анализ древовидных объектов в Matlab»

(Вариант №18)

 

 

 

Дисциплина Теория принятия решений

Специальность 230102 – Автоматизированные системы обработки информации и управления

Курс 4

Семестр осенний учебного года 2010

 

 

                                 Выполнил:

                                                    Студент группы 1170

                                                                          Малышев Иван Иванович

                                                                          Проверил преподаватель:

                                                                          Славский Виктор Владимирович

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ханты-Мансийск 2010г.

Задание:

 

Примечание.

Деревья классификации - это метод, позволяющий предсказывать  принадлежность наблюдений или объектов к тому или иному классу категориальной зависимой переменной в зависимости  от соответствующих значений одной или нескольких предикторных переменных. Построение деревьев классификации - один из наиболее важных методов, используемых при проведении "добычи данных”.

 

Загрузил в MATLAB данные своего варианта: файл A18.mat.

Матрица hh4 (7x7):

hh4 =

     0    49    44    48    25    47    44

    49     0    47    45    32    39    41

    44    47     0    46    27    45    42

    48    45    46     0    31    43    30

    25    32    27    31     0    30    27

    47    39    45    43    30     0   39

    44    41    42    30    27    39     0

 

Где три элемента {i, j, k} принадлежат X.

Т.е  a(i,k)+ a(j,k)- a(i,j) → MAX

 

Создал одну Function M-File с именем mass (mass.m):

function [z,qq]=mass(a)

[n,m]=size(a);

n=length(a)

Результат выполнения m-функции:

mass(hh4)

n = 7

Далее в MATLAB написал следующее (прописал b1, b2, b3 чтобы в дальнейшем найти i,j,k):

 

b1=repman(a,[1 1 n]);       % b1(i, j, k)=a(i,j)

b2=permute(b1,[1 3 2]); % b2(i, j, k)=b1(i,j,k)=a(i,k)

b3=permute(b2,[3 2 1]); % b2(i, j, k)=b1(k,j,i)=a(j,k)

 

Написал следущее:

q=b2+ b3- b1=a(i,k)+ a(j,k)- a(i,j)

Далее:

[r,r3]=max (max (max (q)))

[r,r2]=max (max (q(:, :, r3)))

[r,r1]=max (q(:, r2, r3))

 

[r1, r2, r3]=[i,j,k]

 

Построения  дерева классификации используя  данные лабораторной работы а именно:

Расстояния до вершин дерева:

A=

7   4   

5   2   

5   4  

1   3   

 

B=

13   17    18.500   20.500  2.500 2.500   5   21   4  

 

Далее построим дерево классификации используя эти данные:

TREE = phytree(a,b);

view(THREE)

 

Результат:

 

Затем, чтобы получить информацию о филогенетическом древовидном объекте нужно прописать:

GET(THREE)

NumLeaves: 6  

NumBranches: 5

NumNodes: 11 

Pointers: [4x2 double]  

Distances: [9x1 double]    

LeafNames: {6x1 cell}    

BranchNames: {5x1 cell}   

NodeNames: {9x1 cell}  

 

Где:  NumLeaves - число листьев;  NumBranches -  число переходов; NumNodes - число узлов; Pointers - список связи переходов листа/перехода; Distances - длина края для каждого листа/перехода; LeafNames - названия листьев; BranchNames - названия переходов;  NodeNames - названия всех узлов;

 

Примечание.

Что же такое деревья  классификации? К примеру, нам нужно  придумать устройство, которое отсортирует  коллекцию монет по их достоинству (например, 1, 2, 3 и 5 копеек). Предположим, что какое-то из измерений монет, например - диаметр, известен и, поэтому, может быть использован для построения иерархического устройства сортировки монет. Заставим монеты катиться по узкому желобу, в котором прорезана щель размером с однокопеечную монету. Если монета провалилась в щель, то это 1 копейка; в противном случае она продолжает катиться дальше по желобу и натыкается на щель для двухкопеечной монеты; если она туда провалится, то это 2 копейки, если нет (значит это 3 или 5 копеек) - покатится дальше, и так далее. Таким образом, мы построили дерево классификации. Решающее правило, реализованное в этом дереве классификации , позволяет эффективно рассортировать горсть монет, а в общем случае применимо к широкому спектру задач классификации.

 

Вывод:

В ходе выполнения лабораторной работы №11 «Построение и анализ древовидных объектов в Matlab» получил теоретические и практические знания по данной теме лабораторной работы, приобрел навыки работы с построением дерева классификации, с получением информации о филогенетическом древовидном объекте.


Информация о работе Построение и анализ древовидных объектов в Matlab