Биматричные игры. Поиск равновесных ситуаций

биматричный игра парето

Игра - это идеализированная математическая модель коллективного поведения: несколько индивидуумов (участников, игроков) влияют на ситуацию (исход игры), причем их интересы (их выигрыши при различных возможных ситуациях) различны. Антагонизм интересов рождает конфликт, в то время как совпадение интересов сводит игру к чистой координации, для осуществления которой единственным разумным поведением является кооперация. В большинстве игр, возникающих из анализа социально-экономических ситуаций, интересы не являются ни строго антагонистическими, ни точно совпадающими. Продавец и покупатель согласны, что в их общих интересах договориться о продаже, конечно, при условии, что сделка выгодна обоим. Однако они энергично торгуются при выборе конкретной цены в пределах, определяющихся условиями взаимной выгодности сделки. Подобно этому рядовые избиратели, как правило, согласны отвести кандидатов, представляющих крайние точки зрения.

Однако при избрании одного из двух кандидатов, предлагающих различные компромиссные решения, возникает ожесточенная борьба. Нельзя не согласиться, что большинство напоминающих игры конфликтных ситуаций общественной жизни порождают как конфликтное, так и кооперативное поведение. Поэтому можно сделать вывод, что теория игр является полезным логическим аппаратом для анализа мотивов поведения участников в подобных ситуациях. Она располагает целым арсеналом формализованных сценариев поведения, начиная с некооперативного поведения и до кооперативных соглашений с использованием взаимных угроз. Для каждой игры в нормальной форме использование различных кооперативных и некооперативных концепций равновесия, как правило, приводит к различным исходам. Их сравнение является основным принципом теоретико-игрового анализа и, по-видимому, источником строгих и вместе с тем содержательных рассуждений о побудительных мотивах поведения вытекающих только из структуры игры в нормальной форме.

Во многих социальных науках имеется большое количество моделей, при анализе которых требуется изучать способы выбора стратегий. Приложения теории игр преимущественно развиваются в связи с исследованием экономики.

Это соответствует установкам основоположников теории игр фон Неймана и Моргенштерна. Однако прочная репутация теоретико - игрового подхода утвердилась только после теоремы Дебре - Скарфа, позволяющей рассматривать конкурентное равновесие как результат кооперативных действий. С тех пор целые разделы экономической теории (такие, как теория несовершенной конкуренции или теория экономического стимулирования) развиваются в тесном контакте с теорией игр.

Поиск равновесных концепций, являющихся идеализацией целого спектра некооперативных и кооперативных схем поведения, тесно связан с основами социологии. В современных социологических исследованиях формальные теоретико-игровые модели весьма редки и с математической точки зрения элементарны. И все - таки влияние теории игр кажется нам уже необратимым, по крайней мере на этапе обучения.

Математическая теория предлагает для решения поставленных задач теорию игр, определяемую как раздел математики, ориентированный на построение формальных моделей принятия оптимальных решений в ситуации конкурентного взаимодействия. Данное определение главной задачей теории игр ставит последовательность действий эффективного поведения в условиях конкуренции, конфликтности.).

В теории игр участников конкурирующего взаимодействия называют игроками, каждый из них имеет непустое множество допустимых действий, совершаемых им по ходу игры, которые называются ходами или выборами. Набор всех возможных ходов по одному из списка возможных ходов каждого игрока (участвующих в парах, тройках и т.д. ходов) называется стратегией. Грамотно построенные стратегии взаимно исключают друг друга, т.е. взаимно исчерпывают все способы поведения игроков. Исходом игры называется реализация игроком выбранной им стратегии. Каждому исходу игры соответствует определяемое игроками значение полезности (выигрыша), называемое платежом.

Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, доступности информации и т.д.

1. В зависимости от количества игроков различают парные игры и игры n игроков. Математический аппарат реализации парных игр наиболее проработан. Игры трёх и более игроков исследовать сложнее из-за трудностей технической реализации алгоритмов решения.
2. По количеству стратегий игры бывают конечные и бесконечные. Конечной называется игра с конечным числом возможных стратегий игроков. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, то игра называется бесконечной.
3. По характеру взаимодействия игры делятся на:
- · бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции;
- · коалиционные (кооперативные) - игроки могут вступать в коалиции.

В кооперативных играх коалиции жестко заданы на этапе постановки задачи и не могут меняться во время игры.

4. По характеру выигрышей игры делятся на:
- · игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю);
- · игры с ненулевой суммой.
5. По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, дуэли и др.

Матричная игра - это конечная парная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец - номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.

Биматричная игра - это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец - стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице - выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.

Целью любой игры является максимизация каждым игроком своей выгоды. Смысл математической теории игр, построенной на приведенной выше классификации, состоит в формализации (упрощении) и облегчении оптимального выбора. Множество всех возможных стратегий игр составляет большое число, растущее тем сильнее, чем больше игроков и набор доступных каждому ходов. Так для пары игроков, если условия игры позволяют каждому совершить по n ходов, в игре существует 2n стратегий.

Простой перебор и оценка (сравнение) такого числа стратегий представляют собой технически очень сложную задачу и неприемлемы на практике. Математический аппарат позволяет значительно снизить число требующих анализа и сравнения стратегий, отбросив заведомо неэффективные. Когда же получен ограниченный, разумный для анализа набор точек равновесия (одинаково предпочитаемых всеми игроками исходов игры), на основе анализа выигрышей игроков, выбирается наиболее рациональный результат. При выборе результата существуют два основных подхода, которые дают название окончательной стратегии игры:

· Минимаксная стратегия (выбор из максимальных (наихудших) проигрышей минимальных (наилучших).
· Максиминная стратегия (выбор из минимальных (наихудших) выигрышей максимальных (наилучших).

Развитием теории игр с использованием методов вероятностного анализа является математическая теория принятия решений. Эта теория оперирует не действительным (актуальным) решением, а средним, которое есть ожидаемое решение игры в течение ее многократного повторения. Данное свойство актуально для решения правовых задач, поскольку нормативный характер права означает, что оно ориентировано на неопределенного субъекта и предполагает многократное повторение правоотношений. Чтобы не вдаваться в глубокие математические выкладки, отметим лишь, что теория принятия решений предлагает систему критериев (например, критерий Гурвица, Хаджи-Лемана, критерий ожидаемого значения), которые с помощью вероятностного анализа исходов игр позволяют осуществить выбор оптимального решения в условиях риска и неопределенности.

65. В графическом методе решения игр 3*3 для нахождения оптимальных стратегий игроков:
а) строится два треугольника (*ответ*)
б) строится один треугольник.
в) треугольники не строятся вовсе.
66. График нижней огибающей для графического метода решения игр 2*m представляет в общем случае функцию:
а) монотонно убывающую.
б) монотонно возрастающую.
в) немотонную.
67. Если в антагонистической игре на отрезке функция выигрыша 1-го игрока F(x,y) равна 2*x+C, то в зависимости от C:
а) седловых точек нет никогда.
б) седловые точки есть всегда (*ответ*)
в) иной вариант
68.Чем можно задать задачу принятия решения в условиях неопределенности на конечных множествах:
а) двумя матрицами.
б) выигрышами.
в) чем-то еще (*ответ*)
69. В антагонистической игре произвольной размерности выигрыш первого игрока - это:
а) число.
б) множество.
в) вектор, или упорядоченное множество.
г) функция (*ответ*)
70. В матричной игре 3*3 две компоненты смешанной стратегии игрока:
а) определяют третью (*ответ*)
б) не определяют.
71. Биматричная игра может быть определена:
а) двумя матрицами одинаковой размерности с произвольными элементами,
б) двумя матрицами не обязательно одинаковой размерности,
в) одной матрицей.
72. В матричной игре элемент aij представляет собой:
а) проигрыш 2-го игрока при использовании им j-й стратегии, а 2-м - i-й стратегии (*ответ*)
б) оптимальную стратегию 2-го игрока при использовании противником i-й или j-й стратегии,
в) выигрыш 1-го игрока при использовании им j-й стратегии, а 2-м - i-й стратегии,
73. Элемент матрицы aij соответствует седловой точке. Возможны следующие ситуации:
а) оптимальных.
б) чистых.
в) нет однозначного ответа (*ответ*)
84. Если в матрице все столбцы одинаковы и имеют вид (4 3 0 2), то какая стратегия оптимальна для 2-го игрока?
a)первая. б)третья. в)любая (*ответ*)
85. Какое максимальное число седловых точек может быть в игре размерности 3*3 (матрица может содержать любые числа):
а)3.
б)9.
в)27 (*ответ*)
86.Пусть в антагонистической игре X=(1;5)- множество стратегий 1-го
игрока, Y=(2;8)- множество стратегий 2-го игрока. Является ли пара (1,2)
быть седловой точкой в этой игре:
а) всегда.
б) иногда (*ответ*)
в) никогда.
87. Бывает ли в биматричной игре размерности 3*3 ровно 2 ситуации равновесия?
а) Всегда.
б) иногда (*ответ*)
в) никогда.
88. Пусть в матричной игре размерности 2*3 одна из смешанных стратегий 1-го игрока имеет вид (0.3, 0.7), а одна из смешанных стратегий 2-го игрока имеет вид (0.3, x, x). Чему равно число x?
а)0.7 б)0.4 в)чему-то еще (*ответ*)
89. Матричная игра - это частный случай биматричной, при котором всегда справедливо:
а) матрица А равна матрице В, взятой с обратным знаком.
б) матрица A равна матрице В.
в) Произведение матриц А и В -единичная матрица..
90. В биматричной игре элемент by представляет собой:
а) выигрыш 2-го игрока при использовании им i-й стратегии, а 1-м - j-й стратегии,
б) оптимальную стратегию 2-го игрока при использовании противником i-й или j-й стратегии/
в) что-то иное (*ответ*)
91 .В биматричной игре элемент ац соответствует ситуации равновесия. Возможны следующие ситуации:
а) в столбце есть элементы, равные этому элементу (*ответ*)
б) этот элемент меньше некоторых в столбце.
в) этот элемент меньше всех в столбце.
92. В матричной игре, зная стратегии каждого игрока и функцию выигрыша,
цену игры в чистых стратегиях, можно найти:
а) всегда.
б) иногда (*ответ*)
в) вопрос некорректен.

В играх с ненулевой суммой в выигрыше или проигрыше могут оказаться все участники игры. Биматричная игра – это конечная игра двух игроков с ненулевой суммой. В этом случае для каждой игровой ситуации A i B j каждый из игроков имеет свой выигрыш a ij для первого игрока и b ij – для второго игрока. К биматричной игре сводится, например, поведение производителей на рынках несовершенной конкуренции. С помощью онлайн-калькулятора можно найти решение биматричной игры , а также ситуации оптимальные по Парето и ситуации устойчивые по Нэшу .

Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А – может выбрать любую из стратегий А 1 ,…,А m ,
игрок В – любую из стратегий В 1 ,…,В n .

При этом их совместный выбор оценивается вполне определённо: если игрок А выбрал i-ю стратегию А i , а игрок В – k -ю стратегию В k , то в итоге выигрыш игрока А будет равен некоторому числу a ik , а выигрыш игрока В некоторому, вообще говоря, другому числу b ik .
Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы.

Первая из таблиц описывает выигрыш игрока А, а вторая – выигрыш игрока В. Обычно эти таблицы записывают в виде матрицы.
Здесь А – платёжная матрица игрока А, В – платёжная матрица игрока В.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны) получаются две платёжные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная .

Равновесие Нэша – равновесие, когда каждый участник игры выбирает стратегию, которая является для него оптимальной при условии, что остальные участники игры придерживаются определенной стратегии.
Равновесие Нэша не всегда является наиболее оптимальным для участников. В этом случае говорят, что равновесие не является Парето-оптимальным .
Чистая стратегия – определенная реакция игрока на возможные варианты поведения других игроков.
Смешанная стратегия – вероятностная (не определенная точно) реакция игрока на поведение других игроков.

Пример №1 . Борьба за рынки сбыта.
Фирма а намерена сбыть партию товара на одном из двух рынков, контролируемых более крупной фирмой b . С этой целью она проводит подготовительную работу, связанную с определенными затратами. Если фирма b разгадает, на каком из рынков фирма а будет продавать свой товар, она примет контрмеры и воспрепятствует "захвату" рынка (этот вариант означает поражение фирмы а); если нет, то фирма а одерживает победу. Предположим, что для фирмы а проникновение на первый рынок более выгодно, чем проникновение на второй, но и борьба на первом рынке требует от нее больших средств. Например, победа фирмы а на первом рынке приносит ей вдвое большую прибыль, чем победа на втором, но зато поражение на первом рынке полностью ее разоряет.
Составим математическую модель этого конфликта, считая фирму а игроком 1 и фирму b игроком 2. Стратегии игрока 1: А 1 – проникновение на рынок 1, А 2 – проникновение на рынок 2; стратегии игрока 2: В 1 – контрмеры на рынке 1, В 2 – контрмеры на рынке 2. Пусть для фирмы а ее победа на 1-м рынке оценивается в 2 единицы, а победа на 2-м рынке – в 1 единицу; поражение фирмы а на 1-м рынке оценивается в -10, а на 2-м в -1. Для фирмы b ее победа составляет соответственно 5 и 1 единицу, а поражение -2 и -1. Получаем в итоге биматричную игру Г с матрицами выигрышей
.
По теореме эта игра может иметь либо чистые, либо вполне смешанные ситуации равновесия. Ситуаций равновесия в чистых стратегиях здесь нет. Убедимся теперь, что данная игра имеет вполне смешанную ситуацию равновесия. Находим , .
Итак, рассматриваемая игра имеет единственную ситуацию равновесия (x 0 ;y 0), где , . Она может быть реализована при многократном повторении игры (то есть при многократном воспроизведении описанной ситуации) следующим образом: фирма а должна использовать чистые стратегии 1 и 2 с частотами 2/9 и 7/9, а фирма b – чистые стратегии 1 и 2 с частотами 3/14 и 11/14. Любая из фирм, отклонившись от указанной смешанной стратегии, уменьшает свой ожидаемый выигрыш.

Пример №2 . Найти ситуации оптимальные по Парето и ситуации устойчивые по Нэшу для биматричной игры.

Пример №3 . Имеются 2 фирмы: первая может произвести одно из двух изделий А 1 и А 2 , вторая – одно из двух изделий B 1 , B 2 . Если первая фирма произведет продукцию A i (i = 1, 2), а вторая - B j (j = 1, 2), то прибыль этих фирм (зависящая от того, являются ли эти изделия взаимодополняющими или конкурирующими), определяется таблицей №1:

	В 1	В 2
А 1	(5, 6)	(3, 2)
А 2	(2, 1)	(5, 3)

Считая, что фирмы заключают между собой соглашение, определить справедливое распределение прибыли, используя арбитражное решение Нэша.

1. Как системно описывается задача принятия решения в условиях неопределенности?

2. Что такое управляющая подсистема, что такое среда?

3. Какими факторами определяется состояние системы?

4. Сформулируйте математическую модель задачи принятия решения в условиях неопределенности. Что такое функция полезности (выигрыша)? Что такое условие неопределенности?

5.Как задают функцию выигрыша при условии конечности множеств стратегий и состояний?

6.Какова основная цель задачи принятия решения?

7.Как в теории игр называют задачу принятия решения в условиях неопределенности?

8.Что понимают под оптимальной стратегией игрока? 9.Как задают игру в случае, если множества X иY конечны? 10.Какие имеются способы сравнения двух стратегий? 11.Что такое принцип доминирования?

12.Каков основной метод, позволяющий найти оптимальную стратегию

в ЗПР в условиях неопределенности? Какая стратегия считается оптимальной?

13.Что такое критерий для сравнения стратегий?

14.Каковы важнейшие критерии, используемые для задач принятия решений в условиях неопределенности? На каких гипотезах они основаны?

2. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ РИСКА

1.Как задается вероятностная мера на множестве состояний природы, если множество конечно?

2.Что такое априорное распределение вероятностей на множестве состояний природы.

3.В каких случаях говорят, что принятие решения происходит в условиях риска?

4.Как определяется критерий математического ожидания?

5.Что такое байесовская стратегия, байесовский подход?

3. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

1. Как называется задача принятия решения, в которых на систему воздействует не одна, а несколько управляющих подсистем, каждая из которых имеет свои цели и возможности действий?

2. Математическая модель какого конфликта называется антагонистической игрой?

3. Чем определяется состояние такой системы? Антагонистическую игру естественно задать системой Г= (Х, Y, F ).

4. Какая игра называется антагонистической и какими объектами ее

5. В чем содержательное различие между управляющей подсистемой и средой?

6. Как называется антагонистическая игра, если Х иY конечны?

7. Как определяются нижняя цена игры и верхняя цена игры? Как определяется цена игры?

8. Каково соотношение между максимином и минимаксом?

9. Что такое седловая точка? К чему приводит одностороннее отступление игрока от седловой точки?

10. Чему равно значение функции выигрыша в седловой точке?

11.Сформулируйте теорему о взаимозаменяемости и эквивалентности cедловых точек.

12. Сформируйте достаточное условие существования седловой точки.

13. При каких условиях в выпуклой игре у игрока есть единственная оптимальная стратегия?

4. ТЕОРИЯ МАТРИЧНЫХ ИГР

1. По какому алгоритму происходит поиск седловой точки в матричной

2. Всегда ли в матричной игре есть седловые точки?

3. Каким образом можно выбирать свои стратегии случайно?

4. Что такое чистая стратегия игрока?

5. Что такое смешанная стратегия игрока в в матричной игре и как она задается?

6. Что собой представляют содержательно компоненты смешанной стратегии?

7. Как определяется функция выигрыша игрока на смешанных стратегиях?

8. Как задается матричная игра со смешанными стратегиями? Какими свойствами обладают стратегии?

9. Сформулируйте основную теорему теории матричных игр.

10. Приведите критерии оптимальности стратегий игроков.

11. Какова структура множества оптимальных стратегий каждого

12. Сформулируйте теорему о достижимости максимумов и минимумов функций выигрыша на чистых стратегиях.

13. Какие чистые стратегии входят в качестве компонент седловой точки с положительной вероятностью?

14. Что такое выпуклая комбинация векторов?

15. В каком случае говорят, что один вектор доминирует(строго доминирует) другой?

16. Сформулируйте теорему о доминировании.

5. МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР

1.Как находят смешанные оптимальные стратегии для игры 2*2? Как находят для такой игры цену игры?

2. Как находят графическим методом оптимальные стратегии игроков в игре 2*m? На какой теореме основана эта методика?

3.Как можно использовать графический метод для игр m*2?

4.Опишите графический метод для игр 3*3?

5.Опишите метод Брауна-Робинсон.

6.Является ли метод Брауна-Робинсон аналитическим, или же итеративным?

7.На что опирается игрок при выборе своей стратегии на каждом шаге по методу Брауна-Робинсон?

8.Имеются ли при использовании метода Брауна-Робинсон ограничения по размерности матриц?

9.Что делает игрок, если стратегий, удовлетворяющих условию выбора, несколько?

10.Как игроками выбираются начальные стратегии?

11. К чему, согласно методу Брауна-Робинсон, стремятся воображаемые платежиυ 1 (k ) и υ 2 (k ) ?

6. БИМАТРИЧНЫЕ ИГРЫ

1. В каком случае возникает биматричная игра, чем она задается?

2. Как можно задать функции выигрыша игроков?

3. Как определяются смешанные стратегии игроков и функции выигрыша игроков?

4. Как определяется ситуация равновесия в биматричной игре?

5. В чем содержательный смысл ситуации равновесия?

6. В каком смысле седловая точка является частным случаем ситуации равновесия?

7. Какая пара стратегий игроков называется оптимальной по Парето?

8. Что означает содержательно оптимальность по Парето?

9. В чем формальное различие между ситуацией равновесия и ситуацией, оптимальной по Парето?

10.Как связаны ситуация равновесия и Парето-оптимальная стратегия в матричных играх?

11. Всегда ли в биматричной игре есть ситуация равновесия?

12.Сформулируйте теорему Брауэра.

13.Всегда ли в биматричной игре есть чистая ситуация равновесия? 14.Являются ли разными ситуации равновесия эквивалентными по

значениям функций выигрыша.

15.Что понимается под возможной в игре неустойчивостью ситуации равновесия?

16. Опишите алгоритм поиска ситуации равновесия в биматричных играх размерности 2×2. Что такое вполне смешанные стратегии?

17.Что такое совместная смешанная стратегия? Как могут быть реализованы на практике такие стратегии?

18.Как определяются выигрыши игроков при совместной смешанной стратегии?

19. Как задается в биматричной игре совместная смешанная стратегия?

20. Как определяется в биматричной игре ситуация равновесия в совместных смешанных стратегиях?

21. Какова структура множества ситуаций равновесия в совместных смешанных стратегиях биматричной игры размерности n×m ?

22. Какова связь между ситуациями равновесия в смешанных и в совместных смешанных стратегиях?