Матричная игра

Автор работы: Пользователь скрыл имя, 03 Мая 2014 в 10:35, доклад

Краткое описание

Матричная игра – это парная игра, которая задается набором чистых стратегий (1, …, n) и (1, …, m) первого и второго игроков, а также платежной матрицей (aij)m n определяющей выигрыш первого игрока при выборе игроками стратегий i и j соответственно. Целью первого игрока является максимизация своего выигрыша, а целью второго – минимизация выигрыша противника.

Прикрепленные файлы: 1 файл

Матрица платежная.docx

— 40.82 Кб (Скачать документ)

 Матричная игра – это парная игра, которая задается набором чистых стратегий (1, …, n) и (1, …, m)  первого и второго игроков, а также платежной матрицей (aij)m   n определяющей выигрыш первого игрока при выборе игроками стратегий i и j соответственно. Целью первого игрока является максимизация своего выигрыша, а целью второго – минимизация выигрыша противника.

Чистая стратегия:

Нижняя цена игры в чистых стратегиях определяется по формуле:

 

Величина            называется нижней ценой игры в чистых стратегиях.

Верхняя цена игры в чистых стратегиях определяется по формуле:

 

Величина            называется верхней ценой игры в чистых стратегиях.

Седловой точкой  называют элемент матрицы  , удовлетворяющий условиям  , то есть элемент матрицы, который одновременно является минимальным элементом в соответствующей строке матрицы и максимальным элементом в соответствующем столбце матрицы.

Седловая точка в матричной игре определяет некоторое положение равновесия, когда ни одному из игроков не выгодно отклоняться от опти-мальной стратегии, если противник придерживается своей оптимальной стратегии. В случае существования седловой точки верхняя и нижняя цены игры совпадают и называются ценой игры. Решением игры в чистых стра-тегиях называется нахождение оптимальных стратегий для каждого из иг-роков и вычисление цены игры. Заметим, что решение в чистых стратегиях существует только в том случае, когда в платежной матрице существует седловая точка.

Например: Определить нижнюю и верхнюю цену игры, заданной платежной матрицей:

Решение. Все расчеты удобно проводить в таблице, к которой, кроме матрицы Р, введены столбец αi , и строка β j (таблица 3.3). минимальное число в каждой строке обозначим α i, а β j – максимальное число в каждом столбце. Анализируя строки матрицы (стратегии игрока А), заполняем столбец αi : α1 = 0,5, α2 = 0,7, α3= 0,6 — минимальные числа в строках 1, 2, 3. Аналогично βi : β1 = 0,9, β2 = 0,7, β3= 0,8 — максимальные числа в столбцах 1, 2, 3 соответственно.

Нижняя цена игры (наибольшее число в столбце) и верхняя цена игры (наименьшее число в строке βi ).

Эти значения равны, т.е. α = β, и достигаются на одной и той же паре стратегий (A2, B2). Следовательно, игра имеет седловую точку (A2 , B2 ) и цена игры v = 0,7.

№2. Определить нижнюю и верхнюю цену игры, заданной платежной матрицей:

 

Стратегии "B"

 

Стратегии "A"

B1

B2

B3

B4

Минимумы строк

A1

1.45

2.12

0.75

4.01

0.75

A2

3.52

1.87

0.18

12.7

0.18

A3

6.08

4.43*+

11.0

6.01

4.43*

Максимумы столбцов

6.08

4.43+

11.0

12.7 

 

 

значение (в нашем случае 4.43) совпадает с чистой ценой игры или просто ценой игры - v. Пара оптимальных стратегий, в играх имеющих седловую точку, всегда проходит через последнюю. Нижняя цена игры, верхняя цена игры и чистая цена игры:  α = β = v = 4.43; 
Пара оптимальных стратегий:  A3B2 .

№3. Верхняя цена матричной игры, заданной платежной матрицей  , равна … (4).

Смешанные стратегии

Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий,  то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.

Для матричной игры, платёжная матрица которой показана на рис. 1.1, 

 

B1

B2

Bn

A1

A11

A12

...

A1n

A2

A21

A22

...

A2n

...

...

...

...

Am

am1

am2

...

amn


 

Vн ¹ Vв , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2 ,…, pm) и для игрока 2 (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.

Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:

Для первого игрока:                          Для второго игрока:

 

Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.

Для игрока 1 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно,  значение 1/V должно стремиться к минимуму.

Целевая функция задачи будет иметь следующий вид:

min Z = min 1/V = min (x1 + x2 + … + xm)

Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно,  значение 1/V должно стремиться к максимуму.

Целевая функция задачи будет иметь следующий вид:

max Z = max 1/V = max (y1 + y2 + … + yn)

Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi  и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда  в ходе решения задачи будет определена не цена игры, а величина V* = V + K.

Для решения задач линейного программирования используется симплекс-метод.  [1, 5].

В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj . Величина V* определяется по формуле: V* = 1/z

Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xi×V*:  для игрока 2: qi = yi×V*.

Для определения цены игры  V из величины V* необходимо вычесть число K.

 

Пример:

 

B1

B2

B3

minj

A1

0,17

0,62

0,24

0.17

A2

3

-1,5

-0,8

-1.5

A3

0,75

0,5

0,175

0,175

maxi

3

0.62

0.24

 

 

 

Рис. 2.1. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».

 

В данной матрице (рис. 2.1) нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию.

Решение задачи

 

1. В данной матрице имеются  отрицательные коэффициенты. Для  соблюдения условия неотрицательности в задачах линейного программирования прибавим к каждому коэффициенту матрицы модуль минимального отрицательного коэффициента. В данной задаче к каждому коэффициенту матрицы необходимо прибавить число 1,5 – значение модуля наименьшего отрицательного элемента матрицы. Получим платёжную матрицу, преобразованную для выполнения условия неотрицательности (рис. 2.2)

 

B1

B2

B3

A1

1,67

2,12

1,74

A2

4,5

0

0,7

A3

2,25

2

1,675


 

Рис. 2.2. Платёжная матрица, преобразованная для выполнения условия неотрицательности

 

2. Опишем задачу линейного  программирования для каждого  игрока в виде системы линейных неравенств:

Для игрока 1:

1,67×x1 + 4,5×x2 + 2,25×x3 ³ 1

2,12×x1 + 0×x2 + 2×x3 ³ 1

1,74×x1 + 0,7×x2 + 1,675×x3 ³ 1

x1³ 0; x2³ 0; x3³ 0

min Z = x1 + x2 + x3


Для игрока 2:

1,67×y1 + 2,12×y2 + 1,74×y3 £ 1

4,5×y1 + 0×y2 + 0,7×y3 £ 1

2,25×y1 + 2×y2 + 1,675×y3 £ 1

y1³ 0; y2³ 0; y3³ 0

max Z = y1 + y2 + y3


3. Решим обе задачи с  использованием симплекс-метода, применяя  программный комплекс "Линейная  оптимизация". [5].

В результате решения задачи получим следующие значения целевой функции и переменных:

Z = 0,5771

V* = 1/0,5771 = 1,7328

x1 = 0,5144; x2 = 0; x3 = 0,0626

y1 = 0,0582; y3 = 0,5189

4. Для определения значений вероятностей выбора стратегий игроков 1 и 2 умножим значения  переменных на V*. P1 = x1×V* = 0,8914, p2 =0,  p3 = x3×V* = 0,1083: q1 = y1×V* = 0,1008, q2 = 0, q3 = y3×V* = 0,8991.

5. Определим значение цены  игры. Для этого из величины  V* вычтем 1,5 (значение модуля наименьшего отрицательного элемента).

V = 1,7328 - 1,5  = 0,2328

Таким образом, в данной игре выиграет предприятие 1 (значение  V > 0). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с вероятностью 0,8914, а технологию 3 – с вероятностью 0,1083. Предприятие 2, соответственно, должно выбирать технологию 1 с вероятностью 0,1008, а технологию 3 – с вероятностью 0,8991. Значение математического ожидания выигрыша предприятия 1 составит 0,2328 тыс. д.е.

 


Информация о работе Матричная игра