Нейросетевое моделирование

Автор работы: Пользователь скрыл имя, 16 Декабря 2011 в 00:37, курсовая работа

Краткое описание

Нейронные сети – это обобщенное название нескольких групп алгоритмов, обладающих одним ценным свойством — они умеют обучаться на примерах, извлекая скрытые закономерности из потока данных. При этом данные могут быть неполны, противоречивы и даже заведомо искажены. Если между входными и выходными данными существует какая-то связь, пусть даже не обнаруживаемая традиционными корреляционными методами, нейронная сеть способна автоматически настроиться на нее с заданной степенью точности. Кроме того, современные нейронные сети обладают рядом дополнительных возможностей — они позволяют оценивать сравнительную важность различных видов входной информации, уменьшать ее объем без потери существенных данных, распознавать симптомы приближения критических ситуаций и т.д.

Прикрепленные файлы: 1 файл

А.doc

— 97.00 Кб (Скачать документ)

А.С.Тоноян   

Прогнозирование на основе  
нейронных сетей 
 

Введение

Нейронные сети – это обобщенное название нескольких групп алгоритмов, обладающих одним  ценным свойством — они умеют  обучаться на примерах, извлекая скрытые  закономерности из потока данных. При этом данные могут быть неполны, противоречивы и даже заведомо искажены. Если между входными и выходными данными существует какая-то связь, пусть даже не обнаруживаемая традиционными корреляционными методами, нейронная сеть способна автоматически настроиться на нее с заданной степенью точности. Кроме того, современные нейронные сети обладают рядом дополнительных возможностей — они позволяют оценивать сравнительную важность различных видов входной информации, уменьшать ее объем без потери существенных данных, распознавать симптомы приближения критических ситуаций и т.д.

Применение нейронных  сетей в финансах базируется на одном  фундаментальном допущении —  замене прогнозирования распознаванием. Нейронная сеть не предсказывает  будущее, она старается “узнать” в текущем состоянии рынка ранее встречавшуюся ситуацию и максимально точно воспроизвести реакцию рынка.   

1. Нейронные  сети – основные понятия и  определения

 В основу  искусственных нейронных сетей  (Барцев 1987, Куссуль 1990) (НС) положены следующие черты живых нейронных сетей, позволяющие им хорошо справляться с нерегулярными задачами:

 – простой  обрабатывающий элемент – нейрон;

 – очень  большое число нейронов участвует  в обработке информации;

 – один  нейрон связан с большим числом  других нейронов (глобальные связи);

 – изменяющиеся  по весу связи между нейронами;

 – массированная  параллельность обработки информации.

Прототипом для  создания нейрона послужил биологический  нейрон головного мозга. Биологический  нейрон имеет тело, совокупность отростков  – дендридов, по которым в нейрон поступают входные сигналы, и  отросток – аксон, передающий выходной сигнал нейрона другим клеткам. Точка соединения дендрида и аксона называется синапсом. (Розенблат 1965)

 Упрощенно  функционирование нейрона можно  представить следующим образом:

1) нейрон получает  от дендридов набор (вектор) входных сигналов;

2) в теле нейрона  оценивается суммарное значение  входных сигналов. Однако входы  нейрона неравнозначны. Каждый  вход характеризуется некоторым  весовым коэффициентом, определяющим  важность поступающей по нему  информации. Таким образом, нейрон не просто суммирует значения входных сигналов, а вычисляет скалярное произведение вектора входных сигналов и вектора весовых коэффициентов;

3) нейрон формирует  выходной сигнал, интенсивность  которого зависит от значения  вычисленного скалярного произведения. Если оно не превышает некоторого заданного порога, то выходной сигнал не формируется вовсе – нейрон "не срабатывает";

4) выходной сигнал  поступает на аксон и передается  дендридам других нейронов.

 Поведение  искусственной нейронной сети зависит как от значения весовых параметров, так и от функции возбуждения нейронов. Известны три основных вида (Тэнк 1982) функции возбуждения: пороговая, линейная и сигмоидальная. Для пороговых элементов выход устанавливается на одном из двух уровней в зависимости от того, больше или меньше суммарный сигнал на входе нейрона некоторого порогового значения. Для линейных элементов выходная активность пропорциональна суммарному взвешенному входу нейрона. Для сигмоидальных элементов в зависимости от входного сигнала, выход варьируется непрерывно, но не линейно, по мере изменения входа. Сигмоидальные элементы имеют больше сходства с реальными нейронами, чем линейные или пороговые, но любой из этих типов можно рассматривать лишь как приближение.

 Нейронная  сеть представляет собой совокупность  большого числа сравнительно  простых элементов – нейронов, топология соединений которых  зависит от типа сети. Чтобы  создать нейронную сеть для решения какой-либо конкретной задачи, мы должны выбрать, каким образом следует соединять нейроны друг с другом, и соответствующим образом подобрать значения весовых параметров на этих связях. Может ли влиять один элемент на другой, зависит от установленных соединений. Вес соединения определяет силу влияния.

НС принадлежат  классу коннекционистских моделей  обработки информации. Основная их черта – использовать взвешенные связи между обрабатывающими  элементами как принципиальное средство запоминания информации. Обработка в таких сетях ведется одновременно большим числом элементов, благодаря чему они терпимы к неисправностям и способны к быстрым вычислениям.

 Задать НС, способную решить конкретную  задачу, – это значит определить  модель нейрона, топологию связей, веса связей. Нейронные сети различаются между собой меньше всего моделями нейрона, а в основном топологией связей и правилами определения весов или правилами обучения, программирования.

 По структуре  связей сети делятся на два  больших класса: однослойные и многослойные.

 Подходы к  обучению однослойных и многослойных  сетей различны. Обучение многослойных  сетей состоит в том, что  на основе набора примеров {входное  состояние -> выходное состояние}  постепенно подбираются веса  всех связей так, чтобы каждое входное состояние вызывало соответствующее выходное. Обучающие алгоритмы представляют собою итерационные процедуры с медленным приближением к окончательным значениям весов связей. Этот способ впервые был реализован в персептроне Розенблата и локальных правилах обучения на основе модели Хебба. В последующие годы этот подход получил дальнейшее развитие в алгоритмах типа обратного распространения.

 В однослойных  сетях часто удается выразить  веса связей через параметры.  Подход состоит в вычислении  значений синаптический весов на основе заданного описания функционирования нейронной сети как "черного ящика". Если сеть должна реализовать заданную функцию, ее рассматривают как набор элементов пороговой логики и задача сводится к кусочно-линейной аппроксимации этой зависимости и синтезу соответствующего автомата.

 Для общего  случая, когда описание поведения  сети задано в виде набора  векторов возможных состояний,  поиск синаптических весов сводится  к решению соответствующей системы  нелинейных уравнений. Исследования проекционного алгоритма показывают, что при очевидных достоинствах ему свойственен ряд недостатков, в частности склонность сети к ложным реакциям и низкая эффективность при доучивании, когда необходимо ввести новые данные, не разрушая информации, запомненной ранее. Кроме того, до настоящего времени принято считать, что данный алгоритм пригоден лишь для полносвязных нейронных сетей и неприменим в сетях другой архитектуры. Указанные недостатки и малая изученность таких вопросов, как структура и частота появления ложных реакций, реализация итеративных процедур доучивания и применение в неполносвязных сетях, затрудняет использование проекционного алгоритма в исследованиях по нейробионике и при проектировании нейропроцессоров. Недостатком проекционного алгоритма с точки зрения решения задачи прогнозирования является то, что при обучении необходимо с начала сформировать эталоны распознаваемых образов. В задаче прогнозирования это либо вовсе невозможно, либо чрезвычайно затруднено. Эталоны должны формироваться в самой сети на основе анализа исторических данных.

 Исходя из  вышеизложенного, можно заключить,  что для решения задач прогнозирования  наиболее подходит сеть с обратным  распространением.

Она позволяет  формальным образом обучить сеть прогнозировать изменение требования на основе исторических данных о требовании.   

2. Общий подход  к прогнозированию с помощью  
нейронных сетей

 На НС задача  прогнозирования формализуется  через задачу распознавания образов.  Данных о прогнозируемой переменной  за некоторый промежуток времени образуют образ, класс которого определяется значением прогнозируемой переменной в некоторый момент времени за пределами данного промежутка т.е. значением переменной через

интервал прогнозирования. Метод окон предполагает использование  двух окон Wi и Wo с фиксированными размерами n и m соответственно. Эти окна, способны перемещаться с некоторым шагом по временной последовательности исторических данных, начиная с первого элемента, и предназначены для доступа к данным временного ряда,

причем первое окно Wi, получив такие данные, передает их на вход нейронной сети, а второе – Wo – на выход. Получающаяся на каждом шаге пара

Wi à Wo        (2.1)

используется  как элемент обучающей выборки (распознаваемый образ, или наблюдение).

 Каждый следующий  вектор получается в результате сдвига окон Wi и Wo вправо на один элемент (s = 1). Предполагается наличие скрытых зависимостей во временной последовательности как множестве наблюдений. Нейронная сеть, обучаясь на этих наблюдениях и соответственно настраивая свои коэффициенты, пытается извлечь эти закономерности и сформировать в результате требуемую функцию прогноза P.

 Прогнозирование  осуществляется по тому же  принципу, что и формирование  обучающей выборки. При этом  выделяются две возможности: одношаговое  и многошаговое прогнозирование.

 МНОГОШАГОВОЕ  ПРОГНОЗИРОВАНИЕ. Используется для  осуществления долгосрочного прогноза  и предназначено для определения  основного тренда и главных  точек изменения тренда для  некоторого промежутка времени  в будущем. При этом прогнозирующая система использует полученные (выходные) данные для моментов времени k+1, k+2 и т.д. в качестве входных данных для прогнозирования на моменты времени k+2, k+3 и т.д.

 ОДНОШАГОВОЕ  ПРОГНОЗИРОВАНИЕ. Используется для  краткосрочных прогнозов, обычно  – абсолютных значений последовательности. Осуществляется прогноз только на один шаг вперед, но используется реальное, а не прогнозируемое значение для осуществления прогноза на следующем шаге.

 Как было  сказано выше, результатом прогноза  на НС является класс к которому принадлежит переменная, а не ее конкретное значение. Формирование классов должно проводиться в зависимости от того каковы цели прогнозирования. Общий подход состоит в том, что область определения прогнозируемой переменной разбивается на классы в соответствии с необходимой точностью прогнозирования. Классы могут представлять качественный или численный взгляд на изменение переменной.

 Характерный  пример успешного применения  нейронных вычислений в финансовой  сфере – управление кредитными  рисками. Как известно, до выдачи кредита банки проводят сложные статистические расчеты по финансовой надежности заемщика, чтобы оценить вероятность собственных убытков от несвоевременного возврата финансовых средств. Такие расчеты обычно базируются на оценке кредитной истории, динамике развития компании, стабильности ее основных финансовых показателей и многих других факторов. Другая очень важная область применения нейронных вычислений в финансовой сфере – предсказание ситуации на фондовом рынке.

Стандартный подход к этой задаче базируется на жестко фиксированном наборе "правил игры", которые со временем теряют свою эффективность из-за изменения условий торгов на фондовой бирже. Кроме того, системы, построенные на основе такого подхода, оказываются слишком медленными для ситуаций, требующих мгновенного принятия решений. Именно поэтому основные японские компании, оперирующие на рынке ценных бумаг, решили применить метод нейронных вычислений. В типичную систему на базе нейронной сети ввели информацию общим объемом в 33 года деловой активности нескольких организаций, включая оборот, предыдущую стоимость акций, уровни дохода и т.д. Самообучаясь на реальных примерах, система нейронной сети показала большую точность предсказания и лучшее быстродействие: по сравнению со статистическим подходом дала улучшение результативности в целом на 19%.

Прогнозирование на НС обладает и рядом недостатков. Нам необходимо как минимум 50 и  лучше 100 наблюдений для создания приемлемой модели. Это достаточно большое число  данных и существует много случаев, когда такое количество исторических данных недоступно. Например, при производстве сезонного товара, истории предыдущих сезонов недостаточно для прогноза на текущий сезон, из-за изменения стиля продукта, политики продаж и т.д. Даже при прогнозировании требования на достаточно стабильный продукт на основе информации о ежемесячных продажах, возможно мы не сможем накопить историю за период от 50 до 100 месяцев. Для сезонных процессов проблема еще более сложна. Каждый сезон истории фактически представляет собой одно наблюдение. То есть, в ежемесячных наблюдениях за пять лет будет только пять наблюдений за январь, пять наблюдений за февраль и т.д. Может потребоваться информация за большее число сезонов для того, чтобы построить сезонную модель. Однако, необходимо отметить, что мы можем построить удовлетворительную модель на НС даже в условиях нехватки данных. Модель может уточняться по мере того, как свежие данные становится доступными. Другим недостатком нейронных моделей – значительные затраты по времени и другим ресурсам для построения удовлетворительной модели. Эта проблема не очень важна, если исследуется небольшое число временных последовательностей. Тем не менее, обычно прогнозирующая система в области управления производством может включать от нескольких сотен до нескольких тысяч временных последовательностей.

Информация о работе Нейросетевое моделирование