Цепи Маркова

Автор работы: Пользователь скрыл имя, 24 Января 2014 в 08:28, реферат

Краткое описание

Цепью Маркова называют такую последовательность случайных событий, в которой вероятность каждого события зависит только от состояния, в котором процесс находится в текущий момент и не зависит от более ранних состояний.
В некоторых случаях вероятностная модель используется в прогнозе номеров в различных лотереях. По-видимому, использовать цепи Маркова для моделирования последовательности различных тиражей нет смысла. То, что происходило с шариками в тираже, никак не повлияет на результаты следующего тиража, поскольку после тиража шары собирают, а в следующем тираже их укладывают в лоток лототрона в фиксированном порядке.

Прикрепленные файлы: 1 файл

цепи маркова 3.doc

— 111.50 Кб (Скачать документ)

Министерство образования  и науки Российской Федерации

ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ

 ВЫСШЕГО  ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ПОВОЛЖСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ СЕРВИСА»

в  г. Сызрани

 

 

Кафедра «Сервисные технологии »

 

 

 

РЕФЕРАТ

 

 

 

по дисциплине:

 

«________________________________________________________»

 

 

тема:  

 

«_______________________________________________________________»

 

 

 

Выполнил: студент  группы ___________________

 

                       ________________________________

                                                (Ф.И.О.)

Принял: ученая степень, должность_____________

                               

                     ________________________________

                                                (Ф.И.О.)




 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сызрань,2014

Введение в  теорию марковских цепей

Цепью Маркова называют такую последовательность случайных  событий, в которой вероятность  каждого события зависит только от состояния, в котором процесс  находится в текущий момент и не зависит от более ранних состояний. Конечная дискретная цепь определяется:

  1. множеством состояний S = {s1, …, sn}, событием является переход из одного состояния в другое в результате случайного испытания
  2. вектором начальных вероятностей (начальным распределением) p(0) = {p(0)(1),…, p(0)(n)}, определяющим вероятности p(0)(i) того, что в начальный момент времени t = 0 процесс находился в состоянии si
  3. матрицей переходных вероятностей P = {pij}, характеризующей вероятность перехода процесса с текущим состоянием sв следующее состояние sj, при этом сумма вероятностей переходов из одного состояния равна 1:

j=1…n  pij = 1

 

Пример матрицы переходных вероятностей с множеством состояний S = {S1, …, S5}, вектором начальных вероятностей p(0) = {1, 0, 0, 0, 0}:

С помощью вектора  начальных вероятностей и матрицы  переходов можно вычислить стохастический вектор p(n— вектор, составленный из вероятностей p(n)(i) того, что процесс окажется в состоянии i в момент времени n. Получить p(nможно с помощью формулы:

p(n= p(0)×P n

Векторы p(nпри росте n в некоторых случаях стабилизируются — сходятся к некоторому вероятностному вектору ρ, который можно назвать стационарным распределением цепи. Стационарность проявляется в том, что взяв p(0) = ρ, мы получим p(n= ρ для любого n. 
Простейший критерий, который гарантирует сходимость к стационарному распределению, выглядит следующим образом: если все элементы матрицы переходных вероятностей P положительны, то при n, стремящемуся к бесконечности, вектор p(n)стремится к вектору ρ, являющемуся единственным решением системы вида 

p × P = p.

Также можно показать, что если при каком-нибудь положительном значении n все элементы матрицы P положительны, тогда вектор p(nвсе-равно будет стабилизироваться. Доказательство этих утверждений есть в [1] в подробном виде.

Марковская цепь изображается в виде графа переходов, вершины которого соответствуют состояниям цепи, а дуги — переходам между ними. Вес дуги (i, j), связывающей вершины sи sбудет равен вероятности pi(j) перехода из первого состояния во второе. Граф, соответствующий матрице, изображенной выше:

 

 

Классификация состояний марковских цепей

При рассмотрении цепей  Маркова нас может интересовать поведение системы на коротком отрезке времени. В таком случае абсолютные вероятности вычисляются с помощью формул из предыдущего раздела. Однако более важно изучить поведение системы на большом интервале времени, когда число переходов стремится к бесконечности. Далее вводятся определения состояний марковских цепей, которые необходимы для изучения поведения системы в долгосрочной перспективе. 
Марковские цепи классифицируются в зависимости от возможности перехода из одних состояний в другие.  
Группы состояний марковской цепи (подмножества вершин графа переходов), которым соответствуют тупиковые вершины диаграммы порядка графа переходов, называются эргодическими классами цепи. Если рассмотреть граф, изображенный выше, то видно, что в нем 1 эргодический класс M= {S5}, достижимый из компоненты сильной связности, соответствующей подмножеству вершин M= {S1, S2, S3, S4}. Состояния, которые находятся в эргодических классах, называются существенными, а остальные — несущественными (хотя такие названия плохо согласуются со здравым смыслом). Поглощающее состояние sявляется частным случаем эргодического класса. Тогда попав в такое состояние, процесс прекратится. Для Sбудет верно pii = 1, т.е. в графе переходов из него будет исходить только одно ребро — петля.

Поглощающие марковские цепи используются в качестве временных моделей программ и вычислительных процессов. При моделировании программы состояния цепи отождествляются с блоками программы, а матрица переходных вероятностей определяет порядок переходов между блоками, зависящий от структуры программы и распределения исходных данных, значения которых влияют на развитие вычислительного процесса. В результате представления программы поглощающей цепью удается вычислить число обращений к блокам программы и время выполнения программы, оцениваемое средними значениями, дисперсиями и при необходимости — распределениями. Используя в дальнейшем эту статистику, можно оптимизировать код программы — применять низкоуровневые методы для ускорения критических частей программы. Подобный метод называется профилированием кода.

Например, в алгоритме  Дейкстры присутствуют следующие состояния  цепи:

  • vertex (v), извлечение новой вершины из очереди с приоритетами, переход только в состояние b;
  • begin (b), начало цикла перебора исходящих дуг для процедуры ослабления;
  • analysis (a), анализ следующей дуги, возможен переход к a, d, или e;
  • decrease (d), уменьшение оценки для некоторой вершины графа, переход к a;
  • end (e), завершение работы цикла, переход к следующей вершине.

Остается задать вероятности переходом между вершинами, и можно изучать продолжительности переходов между вершинами, вероятности попадания в различные состояния и другие средние характеристики процесса.

Аналогично, вычислительный процесс, который сводится к обращениям за ресурсами системы в порядке, определяемом программой, можно представить поглощающей марковской цепью, состояния которой соответствуют использованию ресурсов системы – процессора, памяти и периферийных устройств, переходные вероятности отображают порядок обращения к различным ресурсам. Благодаря этому вычислительный процесс представляется в форме, удобной для анализа его характеристик.

Цепь Маркова называется неприводимой, если любое состояние Sможет быть достигнуто из любого другого состояния Sза конечное число переходов. В этом случае все состояния цепи называются сообщающимися, а граф переходов является компонентой сильной связности. Процесс, порождаемый эргодической цепью, начавшись в некотором состоянии, никогда не завершается, а последовательно переходит из одного состояния в другое, попадая в различные состояния с разной частотой, зависящей от переходных вероятностей. Поэтому основная характеристика эргодической цепи –  вероятности пребывания процесса в состояниях Sj, j = 1,…, n, доля времени, которую процесс проводит в каждом из состояний. Неприводимые цепи используются в качестве моделей надежности систем. Действительно, при отказе ресурса, который процесс использует очень часто, работоспособность всей системы окажется под угрозой. В таком случае дублирование такого критического ресурса может помочь избежать отказов. При этом состояния системы, различающиеся составом исправного и отказавшего оборудования, трактуются как состояния цепи, переходы между которыми связаны с отказами и восстановлением устройств и изменением связей между ними, проводимой для сохранения работоспособности системы. Оценки характеристик неприводимой цепи дают представление о надежности поведения системы в целом. Также такие цепи могут быть моделями взаимодействия устройств с задачами, поступающими на обработку.

Примеры использования

Система обслуживания с  отказами

Сервер, состоит из нескольких блоков, например модемов или сетевых  карт, к которым поступают запросы  от пользователей на обслуживание. Если все блоки заняты, то запрос теряется. Если один из блоков принимает запрос, то он становится занятым до конца его обработки. В качестве состояний возьмем количество незанятых блоков. Время будет дискретно. Обозначим за α вероятность поступления запроса. Также мы считаем, что время обслуживания также является случайным и состоящим из независимых продолжений, т.е. запрос с вероятностью β обслуживается за один шаг, а с вероятностью (1 - β) обслуживается после этого шага как новый запрос. Это дает вероятность (1 - β) β для обслуживания за два шага, (1 - β)β для обслуживания за три шага и т.д. Рассмотрим пример с 4 устройствами, работающими параллельно. Составим матрицу переходных вероятностей для выбранных состояний:

1 - α

α

0

0

0

β

1 - α - β

α

0

0

0

1 - α - 2β

α

0

0

0

1 - α - 3β

α

0

0

0

1 - 4β


Можно заметить, что она  имеет единственный эргодический класс, и, следовательно, система p × P = p в классе вероятностных векторов имеет единственное решение. Выпишем уравнения системы, позволяющей находить это решение:

 

p(1 - α) + pβ = p0,  
pα + p(1 - α - β) + p2β = p1,  
pα + p(1 - α - 2β) + p3β = p2,  
pα + p(1 - α - 3β) + p4β = p3,  
pα + p(1 - 4β) = p4.

 

 

Отсюда получаем (при γ = α / β):

p= γ p0,  
p= γp0/2,  
p= γp0/3,  
p= γp0/4,

 

из условия нормировки следует:

 

p= С = (1 + γ + γ2/2 + γ3/3 + γ4/4)-1.

 

Теперь известен набор  вероятностей πтого, что в стационарном режиме в системе будет занято i блоков. Тогда долю времени p= С γ4/4 в системе заняты все блоки, система не отвечает на запросы. Полученные результаты распространяются на любое число блоков. Теперь можно воспользоваться ими: можно сопоставить затраты на дополнительные устройства и уменьшение времени полной занятости системы. 
Подробнее можно ознакомиться с этим примером в [1].

Процессы принятия решений  с конечным и бесконечным числом этапов

Рассмотрим процесс, в  котором есть несколько матриц переходных вероятностей. Для каждого момента времени выбор той или иной матрицы зависит от принятого нами решения. Понять вышесказанное можно на следующем примере. Садовник в результате анализа почвы оценивает ее состояние одним из трех чисел: (1) — хорошее, (2) — удовлетворительное или (3) — плохое. При этом садовник заметил, что продуктивность почвы в текущем году зависит только от ее состояния в предыдущем году. Поэтому вероятности перехода почвы без внешних воздействий из одного состояния в другое можно представить следующей цепью Маркова с матрицей P1:

P1

0.25

0.50

0.25

0.00

0.45

0.55

0.00

0.00

1.00


 

Логично, что продуктивность почвы со временем ухудшается. Например, если в прошлом году состояние  почвы было удовлетворительное, то в этом году оно может только остаться таким же или стать плохим, а  хорошим никак не станет. Однако садовник может повлиять на состояние почвы и изменить переходные вероятности в матрице P1 на соответствующие им из матрицы P2:

 

P2

0.40

0.50

0.10

0.15

0.60

0.25

0.05

0.45

0.50


 

Теперь можно сопоставить  каждому переходу из одного состояния в другое некоторую функцию дохода, которая определяется как прибыль или убыток за одногодичный период. Садовник может выбирать использовать или не использовать удобрения, именно от этого будет зависеть его конечный доход или убыток. Введем матрицы R1 и R2, определяющие функции дохода в зависимости от затрат на удобрения и качества почвы:

Информация о работе Цепи Маркова