Стратегические игры. Доступный учебник по теории игр Диксит Авинаш

e) Составьте таблицу этой игры с одновременными ходами. Есть ли в ней равновесие Нэша в чистых стратегиях? Если да, назовите его.

S8. Игру «уличный сад», проанализированную в разделе 4 данной главы, можно отобразить в виде таблицы игры 16 на 4 на 2, если версия игры с последовательным выполнением ходов представлена в стратегической форме, как на рис. 6.12. В этой таблице много равновесий Нэша.

a) Используйте анализ наилучших ответов, чтобы найти все равновесия Нэша в таблице игры на рис. 6.12.

b) Определите совершенное равновесие подыгры во всей совокупности равновесий Нэша. Другие равновесные исходы игры напоминают совершенное равновесие подыгры (поскольку обеспечивают каждой из трех участниц игры те же выигрыши), однако появляются после различных комбинаций стратегий. Объясните, почему так происходит. Опишите проблемы с достоверностью, возникающие в случае равновесий, не являющихся совершенными равновесиями подыгры.

S9. На рис. 6.1 двухэтапная игра между компаниями CrossTalk и GlobalDialog представлена в виде сочетания таблиц и деревьев. Изобразите всю эту двухэтапную игру в виде одного большого дерева игры. Не забудьте указать, какой игрок в каждом узле принимает решение, и нарисуйте информационные множества между узлами там, где это необходимо.

S10. Вспомните последовательную игру с тремя участниками о размещении магазинов в торговых центрах, описанную в упражнении S9 в главе 3. Ее дерево напоминает дерево игры «уличный сад», показанное на рис. 6.10.

a) Нарисуйте дерево игры с размещением магазинов в торговых центрах. Сколько стратегий есть в распоряжении каждого магазина?

b) Проиллюстрируйте игру в стратегической форме и найдите в ней все равновесия Нэша в чистых стратегиях.

c) Используйте итеративное доминирование для поиска совершенного равновесия подыгры. (Подсказка: перечитайте два последних абзаца раздела 4.)

S11. Согласно правилам игры с размещением магазинов в торговых центрах, проанализированной в упражнении S10, когда все три магазина запрашивают торговую площадь в торговом центре Urban Mall, два самых крупных (и самых престижных) из них получают ее. Кроме того, в исходной версии игры предусматривается, что компании, пытающиеся получить торговую площадь в торговых центрах, ходят последовательно.

a) Допустим, три компании подают запросы на предоставление торговой площади одновременно. Составьте таблицу выигрышей для этой версии игры и найдите все равновесия Нэша. Какие из них, по вашему мнению, скорее всего будут выбраны на практике? Обоснуйте свой вывод.

Теперь предположим, что все три магазина одновременно отправляют запрос в Urban Mall, а два имеющихся помещения распределяются посредством лотереи, что дает каждому магазину равные шансы на получение торговой площади в Urban Mall. При такой схеме вероятность каждого магазина попасть в Urban Mall составляла бы две трети (или 66,67 процента), если бы все три магазина отправили запросы, а вероятность оказаться в одиночестве в Rural Mall — одну треть (33,33 процента).

b) Постройте таблицу новой версии одновременной игры с размещением магазинов в торговых центрах. Найдите в ней все равновесия Нэша. Какие из них, по вашему мнению, будут выбраны на практике с наибольшей вероятностью? Обоснуйте свой вывод.

c) Сравните и проведите различие между равновесиями, найденными в пункте b и а. Вы получили одни и те же равновесия Нэша? Почему да или почему нет?

S12. Вернитесь к игре между Моникой и Нэнси из упражнения S10 в главе 5. Допустим, они выбирают количество усилий последовательно, а не одновременно. Моника делает выбор первой, а Нэнси, узнав об этом, также делает выбор.

a) Найдите совершенное равновесие подыгры, при котором общая прибыль определяется по формуле 4m + 4n + mn, затраты Моники и Нэнси, связанные с вложением усилий, составляют m2 и n2 соответственно, и Моника принимает решение о количестве усилий первой.

b) Сравните выигрыши Моники и Нэнси с выигрышами, вычисленными в упражнении S10 в главе 5. В этой игре присутствует преимущество первого или второго хода? Обоснуйте свой ответ.

S13. В расширенном варианте упражнения S12 Монике и Нэнси необходимо решить, кто из них выберет количество усилий в первую очередь. Для этого каждая из них пишет на листке бумаги, будет ли она делать это первой. Если обе напишут «да» или «нет», значит, им предстоит выбирать количество усилий одновременно, как в упражнении S10 в главе 5. Если Моника напишет «да», а Нэнси «нет», то Моника будет первой принимать решение о количестве усилий, как в упражнении S12. Если Моника напишет «нет», а Нэнси «да», тогда Нэнси первой примет решение.

a) На основании выигрышей Моники и Нэнси, полученных в упражнении S12 выше, а также в упражнении S10 в главе 5, постройте таблицу для первого этапа игры в принятие решений. (Подсказка: обратите внимание на симметричность игры.)

b) Найдите равновесия Нэша в чистых стратегиях на первом этапе игры.

Упражнения без решений

U1. Рассмотрим игру с участием двух игроков, А и Б. Игрок А ходит первым и выбирает либо «вверх», либо «вниз». Если игрок А выберет «вверх», игра завершится и каждый получит выигрыш 2. Если игрок А сыграет «вниз», наступит очередь игрока Б делать ход, выбрав один из двух вариантов — «налево» или «направо». Если Б выберет «налево», оба игрока получат выигрыш 0, если «направо», игрок А получит выигрыш 3, а игрок Б — выигрыш 1.

a) Нарисуйте дерево этой игры и найдите совершенное равновесие подыгры.

b) Представьте эту игру с последовательными ходами в стратегической форме и отыщите все равновесия Нэша. Какое из них будет совершенным равновесием подыгры? Если таковых нет, объясните почему.

c) Какой метод решения можно было бы использовать для поиска совершенного равновесия подыгры на основании стратегической формы игры? (Подсказка: перечитайте два последних абзаца раздела 4.)

U2. Вернитесь к дереву игры с двумя участниками в пункте а упражнения U2 в главе 3.

a) Опишите игру в стратегической форме, где Альбусу соответствуют строки, а Минерве — столбцы. Найдите все равновесия Нэша.

b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а данного упражнения, которые не будут совершенными равновесиями подыгры.

U3. Вернитесь к дереву игры с двумя участниками в пункте b упражнения U2 в главе 3.

a) Опишите игру в стратегической форме. Найдите все равновесия Нэша.

b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а данного упражнения, которые не будут совершенными равновесиями подыгры.

U4. Вернитесь к дереву игры с двумя участниками в пункте а упражнения U2 в главе 3.

a) Составьте таблицу этой игры, в которой Альбусу соответствуют строки, Минерве — столбцы, а Северусу — страницы. Найдите все равновесия Нэша.

b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а, которые не будут совершенными равновесиями подыгры.

U5. Рассмотрим отрасль по производству колы, в которой Coke и Pepsi — две ведущие компании (для простоты анализа просто забудем об остальных). Объем рынка составляет 8 миллиардов долларов. Каждая компания решает, рекламировать ли ей свою продукцию; если да, то реклама обойдется в 1 миллиард долларов. Если одна компания будет размещать рекламу, а другая нет, то первая компания захватит весь рынок. Если обе компании будут рекламировать свою продукцию, они разделят рынок поровну и понесут расходы на рекламу. Если обе компании не будут размещать рекламу, они разделят рынок поровну без расходов на рекламу.

a) Составьте таблицу выигрышей для этой игры и найдите равновесие в случае, если обе компании ходят одновременно.

b) Постройте дерево игры исходя их предположения, что ходы в ней выполняются последовательно: первой ходит Coke, а затем Pepsi.

c) Будет ли любое из равновесий, найденных в пунктах а и b, более выгодным по сравнению с общей перспективой для Coke и Pepsi? Как обе компании могли бы добиться большего?

U6. На участке вдоль пляжа отдыхают 500 детей, разделенных на пять кластеров, по 100 детей в каждом. (Обозначим их А, Б, В, Г, Д.) Два торговца мороженым одновременно решают, где разместить свои торговые точки по его продаже. Они должны выбрать точное местоположение одного из кластеров.

Если в одном кластере есть один торговец, мороженое купят все 100 детей, входящие в состав этого кластера. Для кластеров без торговца мороженым 50 из 100 детей захотят пойти к торговой точке, находящейся на расстоянии в один кластер, 20 детей захотят пойти к точке, расположенной на расстоянии в два кластера, и никто не пожелает преодолевать ради мороженого расстояние в три и более кластеров. Мороженое быстро тает, поэтому дети, которые все же отправятся за ним, не смогут купить его и для тех, кто остался на месте.

Если оба торговца мороженым выберут один и тот же кластер, каждый получит 50 процентов доли от общего спроса на мороженое. Если они предпочтут разные кластеры, то те дети (остающиеся на месте или ушедшие за мороженым), к которым один торговец находится ближе, чем к другим, отправятся к нему, а дети, находящиеся на равном расстоянии от двух торговцев, разделятся между ними поровну. Каждый торговец стремится максимально увеличить объем продаж.

a) Составьте таблицу выигрышей пять на пять для игры в местоположение торговцев мороженым; приведенные ниже исходные данные помогут вам начать и проверить правильность своих расчетов:

• если оба торговца решают разместить свои торговые точки в кластере А, каждый из них продаст 85 единиц продукции;

• если первый торговец выберет кластер Б, а второй кластер В, первый продаст 150, а второй 170 единиц продукции;

• если первый торговец выберет кластер Д, а второй кластер Б, первый продаст 150, а второй 200 единиц продукции.

b) Исключите как можно больше доминируемых стратегий.

c) В оставшихся ячейках таблицы найдите все равновесия Нэша в чистых стратегиях.

d) Если преобразовать эту игру в игру с последовательными ходами, в которой первый торговец выбирает место первым, а второй вторым, то каким будет местоположение торговых точек и какой объем продаж будет получен в результате совершенного равновесия подыгры? Как изменение времени выполнения ходов помогает участникам игры решить проблему координации, о которой идет речь в пункте с?

U7. Вернитесь к игре между тремя львами в римском Колизее, представленной в упражнении S8 в главе 3.

a) Опишите ее в стратегической форме, где льву 1 соответствуют строки, льву 2 столбцы, а льву 3 страницы.

b) Найдите равновесия Нэша в этой игре. Сколько их вы нашли?

c) Вы должны были обнаружить равновесия Нэша, которые не будут совершенными равновесиями подыгры. Какой лев представляет недостоверные угрозы в случае каждого из этих равновесий? Объясните свою точку зрения.

U8. Предположим, что в игре с размещением магазинов в торговых центрах (из упражнения S9 главы 3 и упражнения S10 в данной главе) ходы выполняются последовательно, но в другом порядке: Big Giant, затем Titan, а затем Frieda’s.

a) Нарисуйте новое дерево игры.

b) Найдите совершенное равновесие подыгры этой игры. Чем оно отличается от совершенного равновесия подыгры, полученного в упражнении S9 в главе 3?

c) Опишите новую версию игры в стратегической форме.

d) Найдите все равновесия Нэша в этой игре. Сколько их? Как это соотносится с количеством равновесий, найденных в упражнении S10 в данной главе?

U9. Вернитесь к игре между Моникой и Нэнси из упражнения U10 в главе 5. Допустим, они выбирают количество усилий последовательно, а не одновременно. Моника делает это первой, а Нэнси, узнав об этом решении, также выбирает количество усилий.

a) Найдите совершенное равновесие подыгры, при котором общая прибыль определяется по формуле 5m + 4n + mn, затраты Моники и Нэнси, связанные с вложением усилий, составляют m2 и n2 соответственно и Моника принимает решение о количестве усилий первой.

b) Сравните выигрыши Моники и Нэнси с выигрышами, вычисленными в упражнении S10 в главе 5. В этой игре есть преимущество первого или второго хода?

c) Воспользовавшись той же функцией общей прибыли, что и в пункте а, найдите совершенное равновесие подыгры для игры, в которой Нэнси первой принимает решение о количестве усилий.

U10. В расширенном варианте упражнения U9 Монике и Нэнси необходимо решить, кто из них выберет количество усилий в первую очередь. Для этого каждая пишет на листке бумаги, будет ли она принимать решение первой. Если обе напишут «да» или «нет», им предстоит выбирать количество усилий одновременно, как в упражнении U10 в главе 5. Если Моника напишет «да», а Нэнси «нет», то они сыграют в игру, представленную в пункте а упражнения U9. Если Моника напишет «нет», а Нэнси «да», то они сыграют в игру из пункта c.

a) На основании выигрышей Моники и Нэнси, полученных в упражнении U9 выше, а также в упражнении U10 в главе 5, составьте таблицу для первого этапа игры в принятие решений.

b) Найдите равновесия Нэша в чистых стратегиях на первом этапе игры.

U11. В отдаленном городке Сент-Джеймс две компании, Bilge и Chem, конкурируют на рынке безалкогольных напитков (Coke и Pepsi пока на этом рынке нет). Bilge и Chem продают идентичную продукцию, а так как их продукт — жидкость, у них есть возможность выпускать его в более мелких емкостях. Поскольку на данном рынке представлены только эти две компании, цена товара P (в долларах) определяется по формуле P = (30 — QB — QC), где QB — количество продукции, выпускаемой Bilge, а QC — количество продукции Chem (в обоих случаях оно измеряется в литрах). В настоящее время обе компании рассматривают возможность инвестиций в новое оборудование для разлива напитков в бутылки, которое позволит сократить переменные издержки.

a) Если компания j решит не инвестировать, ее затраты составят Cj = Q2j / 2, где j обозначает либо B (Bilge), либо C (Chem).

b) Если компания j решит инвестировать, ее затраты составят Cj = 20 + Q2j / 6, где j обозначает либо B (Bilge), либо C (Chem). Эта новая функция издержек отображает фиксированную стоимость оборудования (20), а также более низкие переменные издержки.

Две компании принимают решения об инвестициях одновременно, но выигрыш в этой игре в инвестиции будет зависеть от игр в дуополию, которые возникнут впоследствии. Следовательно, игра состоит из двух этапов: сначала принять решение об инвестициях, а затем играть в дуополию.

a) Предположим, обе компании решают инвестировать. Запишите функции их прибыли, выраженные через QB и QC, и найдите с их помощью равновесия Нэша в игре с определением количества. Чему равны количество и прибыль обеих компаний при таком равновесии? Какова рыночная цена?

b) Допустим, обе компании решают не инвестировать. Чему равно количество продукции и прибыль обеих компаний при таком равновесии? Какова рыночная цена?

c) Теперь предположим, что компания Bilge решает инвестировать, а Chem — нет. Чему равно количество продукции и прибыль обеих компаний при таком равновесии? Какова рыночная цена?

d) Составьте таблицу два на два для игры в инвестиции между этими компаниями. В распоряжении каждой из них есть две стратегии: «инвестировать» и «не инвестировать». Выигрыши компаний — их прибыль, вычисленная в пунктах а, b и с. (Подсказка: обратите внимание на симметричность игры.)

e) Есть ли совершенное равновесие подыгры в этой двухэтапной игре в целом?

U12. Два французских аристократа, шевалье Шагрин и маркиз де Ренар, дерутся на дуэли. У каждого пистолет заряжен одной пулей. Находясь на расстоянии 10 шагов, они начинают идти навстречу друг другу, перемещаясь с одинаковой скоростью, по 1 шагу за один раз. После каждого шага один из них может выстрелить. Когда один из дуэлянтов стреляет, вероятность попасть в цель зависит от расстояния. После k шагов она составляет k/5, а значит, повышается с 0,2 после первого шага до 1 (определенность) после 5 шагов, когда соперники находятся напротив друг друга. Если один игрок выстрелит и промахнется, тогда как другому еще предстоит сделать выстрел, оба должны продолжать движение даже несмотря на то, что того, кто уже не может стрелять, ждет неминуемая смерть, — таковы правила кодекса чести аристократии. Каждый игрок получает выигрыш 1, если он сам будет убит, и 1, если будет убит его соперник. Если оба останутся живы или оба будут убиты, каждый получит выигрыш 0.

Это игра с пятью последовательными шагами и одновременными ходами (стрелять или не стрелять) на каждом шаге. Найдите совершенное равновесие подыгры в этой игре.

Подсказка: начните с шага 5, когда дуэлянты стоят прямо напротив друг друга. Составьте таблицу два на два для игры с одновременными ходами на этом этапе и найдите равновесие Нэша. Теперь перейдите к шагу 4, где вероятность попасть в цель составляет 4/5, или 0,8 для каждого игрока. Составьте таблицу два на два для игры с одновременными ходами на этом этапе, правильно указав в соответствующй ячейке, что произойдет в дальнейшем. Например, если один игрок стреляет и промахивается, а другой не стреляет, то другой подождет, пока сможет сделать пятый шаг, и точно попадет в цель. Если ни один из игроков не стреляет, тогда игра перейдет на следующий этап, по которому вы уже нашли равновесие. С помощью всей этой информации определите выигрыши в таблице два на два на шаге 4 и найдите равновесие Нэша на этом этапе. Для поиска равновесных стратегий всей игры проанализируйте оставшиеся шаги в обратном порядке.

U13. Опишите пример конкуренции между компаниями, аналогичный по своей структуре дуэли из упражнения U12.

Глава 7. Игры с одновременными ходами: смешанные стратегии

* * *

В ходе анализа игр с одновременными ходами в главе 4 мы столкнулись с целым классом игр, нерешаемых посредством описанных там методов. Дело в том, что в играх этого класса нет равновесий Нэша в чистых стратегиях, и для того чтобы определить исход таких игр, необходимо расширить концепции стратегии и равновесий. Это можно сделать с помощью рандомизации ходов, которая и будет в центре внимания в данной главе.

Рассмотрим игру в розыгрыш очка в теннисе, описанную в конце главы 4. Это игра с нулевой суммой, в которой интересы двух теннисисток прямо противоположны. Эверт стремится направить обводящий удар в любую сторону — по линии (ПЛ) или по диагонали (ПД), — не прикрытую Навратиловой, тогда как Навратилова старается прикрыть именно ту сторону, в которую Эверт сделает удар. В главе 4 мы отметили, что в такой ситуации Навратилова сможет использовать любой системный выбор Эверт себе на пользу, а значит, во вред Эверт. Со своей стороны, Эверт может использовать любой системный выбор Навратиловой. Для того чтобы этого избежать, каждая теннисистка пытается держать соперницу в неведении с помощью бессистемных или случайных действий.

Однако хаотичность действий не означает выбора каждого типа удара в половине случаев или их чередование. Чередование ударов уже само по себе было бы системным действием, которое можно использовать, поэтому случайная комбинация действий в соотношении 60 на 40 или 75 на 25 (в зависимости от ситуации) может быть лучше, чем 50 на 50. В данной главе мы рассмотрим методы расчета наилучшей комбинации ходов, а также обсудим, как эта теория поможет нам понять фактический ход таких игр.

Наш метод вычисления лучшей комбинации применим также к играм с ненулевой суммой. Однако в них интересы игроков частично совпадают, поэтому когда игрок Б использует системный выбор игрока А с выгодой для себя, это не всегда вредит игроку А. Следовательно, в играх с ненулевой суммой логика действий, согласно которой другого игрока следует держать в неведении, более слабая или вообще отсутствует. Мы поговорим о том, имеют ли равновесия в смешанных стратегиях смысл в таких играх и когда именно это происходит.

Начнем главу с анализа смешивания стратегий в играх два на два, а также с самого прямого метода поиска наилучших ответов и равновесия в смешанных стратегиях. Многие концепции и методы, которые мы сформулируем в разделе 2, сохранят свою актуальность и в более общих играх, а в разделе 6 и разделе 7 их область применения распространится на игры, участники которых могут иметь свыше двух чистых стратегий. В конце мы выскажем ряд общих наблюдений по поводу смешивания стратегий на практике, а также приведем некоторые эмпирические данные о том, присутствует ли такое смешивание стратегий в реальной жизни.

1. Что такое смешанная стратегия

Когда игроки предпочитают действовать бессистемно, они делают случайный выбор из имеющихся чистых стратегий. В игре в розыгрыш очка в теннисе Навратилова и Эверт выбирают одну из двух заданных чистых стратегий, ПЛ или ПД. Мы называем случайную комбинацию этих двух стратегий смешанной стратегией.

Такие смешанные стратегии охватывают целый диапазон непрерывных значений. На одном его конце вариант ПЛ может быть выбран с вероятностью 1 (гарантированно), тогда как вариант ПД не будет выбран никогда (вероятность 0); эта комбинация представляет собой чистую стратегию ПЛ. На другом конце диапазона вариант ПЛ может быть выбран с вероятностью 0, а ПД — с вероятностью 1; данная комбинация представляет собой чистую стратегию ПД. В промежутке между ними находится целое множество возможностей: ПЛ выбирается с вероятностью 75 % (0,75), а ПД — 25 % (0,25); или оба варианта выбираются с вероятностью 50 % (0,5) каждый; или вариант ПЛ выбирается с вероятностью 1/3 (33,33…%), а ПД — 2/3 (66,66…%) и т. д.[89]

Выигрыши, полученные в результате применения смешанной стратегии, определяются как соответствующие значения взвешенного по вероятности среднего выигрышей от чистых стратегий, входящих в состав данной смешанной стратегии. Например, в игре в теннис из раздела 7 главы 4 (против стратегии ПЛ Навратиловой) выигрыш Эверт от стратегии ПЛ равен 50, а от стратегии ПД 90. Следовательно, ее выигрыш от смешанной стратегии (0,75 ПЛ, 0,25 ПД) в игре против стратегии ПЛ Навратиловой составит 0,75  50 + 0,25  90 = 37,5 + 22,5 = 60. Это и есть ожидаемый выигрыш Эверт от данной смешанной стратегии[90].

Вероятность выбора той или иной чистой стратегии — это непрерывная переменная с диапазоном значений от 0 до 1. Стало быть, смешанные стратегии — просто особый тип непрерывно меняющихся стратегий наподобие тех, которые мы изучали в главе 5. Каждая чистая стратегия — это предельный частный случай, в котором вероятность ее выбора равна 1.

Понятие равновесия Нэша также можно расширить, включив в него смешанные стратегии. Равновесие Нэша определяется как совокупность стратегий (по одной на каждого игрока), при которой выбор каждого игрока для него наилучший с точки зрения обеспечения его максимального ожидаемого выигрыша с учетом смешанных стратегий других игроков. Допустимость использования в игре смешанных стратегий автоматически и практически полностью решает проблему возможного отсутствия равновесия Нэша, с которой мы столкнулись в случае чистых стратегий. Знаменитая теорема Нэша показывает, что при самых общих условиях (достаточно широких, чтобы охватывать все игры, рассматриваемые в данной книге, и многие другие) равновесие Нэша в смешанных стратегиях существует всегда.

Таким образом, на самом обобщенном уровне включение смешанных стратегий в наш анализ не подразумевает ничего выходящего за пределы общей теории непрерывных стратегий, сформулированной в главе 5. Тем не менее частный случай смешанных стратегий действительно поднимает ряд особых концептуальных и методологических вопросов, поэтому заслуживает специального изучения.

2. Смешивание ходов

Начнем с примера игры в теннис из раздела 7 главы 4, в которой не было равновесия Нэша в чистых стратегиях, и покажем, как расширение этой концепции на смешанные стратегии позволяет устранить данный недостаток, а также объясним полученное в итоге равновесие как равновесие, при котором каждый игрок держит соперника в неведении.

А. Преимущество смешивания ходов

На рис. 7.1 воспроизведена матрица выигрышей, представленная на рис. 4.14. В этой игре, если Эверт будет всегда выбирать удар по линии (ПЛ), Навратилова будет прикрывать ПЛ и удерживать выигрыш Эверт на уровне 50. Точно так же, если Эверт будет всегда выбирать удар по диагонали (ПД), Навратилова будет удерживать выигрыш Эверт на уровне 20. Если Эверт может выбирать только одну из двух базовых (чистых) стратегий, а Навратилова — спрогнозировать е выбор, то более подходящая (или менее неподходящая) стратегия Эверт — ПЛ, обеспечивающая ей выигрыш 50.

Рис. 7.1. Отсутствие равновесия в чистых стратегиях

Но допустим, Эверт не ограничена выбором только чистых стратегий и может применить смешанную стратегию, возможно, именно ту, в соответствии с которой вероятность того, что она выберет ПЛ в каком бы то ни было случае, составляет 75 %, или 0,75, что означает, что вероятность того, что она выберет ПД, равна 25 %, или 0,25. С помощью метода, представленного в разделе 1, можно рассчитать ожидаемый выигрыш Навратиловой при выборе Эверт такой комбинации стратегий. Он составляет:

0,75  50 + 0,25  10 = 37,5 + 2,5 = 40, если она прикроет ПЛ,

0,75  20 + 0,25  80 = 15 + 20 = 35, если она прикроет ПД.

Если Эверт выберет комбинацию стратегий 75 на 25, ожидаемые выигрыши показывают, что Навратилова может использовать эту комбинацию с максимальной выгодой для себя, прикрыв удар ПЛ.

Когда Навратилова выбирает ПЛ, чтобы наилучшим образом использовать комбинацию Эверт 75 на 25, это наносит Эверт ущерб, поскольку перед нами игра с нулевой суммой. Ожидаемые выигрыши Эверт составляют:

0,75  50 + 0,25  90 = 37,5 + 22,5 = 60, если Навратилова прикроет ПЛ,

0,75  80 + 0,25  20 = 60 + 5 = 65, если Навратилова прикроет ПД.

Выбрав ПЛ, Навратилова удержит выигрыш Эверт на уровне 60, а не 65. Но заметьте, что выигрыш Эверт при такой комбинации стратегий все равно лучше выигрыша 50 в случае использования чистой стратегии ПЛ или 20 при выборе чистой стратегии ПД[91].

Комбинация стратегий в соотношении 75 на 25 позволяет Эверт повысить выигрыш по сравнению с выигрышем в чистых стратегиях, однако все же оставляет стратегию Эверт в какой-то степени открытой для того, чтобы Навратилова использовала ее с выгодой для себя. Решив прикрывать удар ПЛ, она может добиться того, что Эверт получит более низкий выигрыш, чем при выборе стратегии ПД. Эверт хотела бы найти комбинацию стратегий, защищенную от использования, то есть такую, при которой у Навратиловой не было бы очевидного варианта чистой стратегии, которую можно было бы применить против данной стратегии Эверт. Комбинация стратегий Эверт, защищенная от использования, должна обладать свойством, обеспечивающим Навратиловой один и тот же ожидаемый выигрыш, какой бы удар она ни прикрывала, ПЛ или ПД: Навратиловой должно быть безразлично, какую из двух имеющихся чистых стратегий выбрать. Мы называем это свойством безразличия соперника, и, как мы увидим ниже в данной главе, это ключ к равновесиям в смешанных стратегиях в ненулевых играх.

Для поиска комбинации стратегий, защищенной от использования соперником, необходимо применить более общий подход к описанию смешанной стратегии Эверт, чтобы алгебраическим путем рассчитать вероятности чистых стратегий, входящих в соответствующую смешанную стратегию. Обозначим вероятность выбора Эверт ПЛ алгебраическим символом p, тогда вероятность выбора ПД будет 1 — p. Для краткости назовем такую совокупность p-комбинацией.

Если Эверт выберет р-комбинацию, ожидаемые выигрыши Навратиловой составят:

50p + 10(1 — p), если она прикроет ПЛ,

20p + 80(1 — p), если она прикроет ПД.

Для стратегии Эверт, чтобы ее р-комбинация была защищена от использования, два выигрыша Навратиловой должны быть равны, то есть 50p + 10(1 — p) = 20p + 80(1 — p), или 30p = 70(1 — p), или 100p = 70, или p = 0,7. Таким образом, в комбинации стратегий Эверт, защищенной от использования, стратегия ПЛ применяется в 70 % случаев, а ПД — в 30 % случаев. При таких вероятностях, заданных смешанной стратегией, Навратилова получит один и тот же ожидаемый выигрыш за счет каждой из своих чистых стратегий, а значит, не сможет использовать ни одну из них с выгодой для себя (или в ущерб Эверт в игре с нулевой суммой). Ожидаемый выигрыш Эверт от смешанной стратегии составит:

50  0,7 + 90  0,3 = 35 + 27 = 62, если Навратилова прикроет ПЛ,

80  0,7 + 20  0,3 = 56 + 6 = 62, если Навратилова прикроет ПД.

Этот ожидаемый выигрыш лучше выигрыша 50, который Эверт получила бы при использовании чистой стратегии ПЛ, и выигрыша 60, полученного в случае комбинации 75 на 25. Теперь мы знаем, что эта смешанная стратегия защищена от использования, но является ли она оптимальной или равновесной стратегией Эверт?

Б. Наилучшие ответы и равновесие

Для того чтобы найти равновесную комбинацию стратегий в этой игре, вернемся к методу анализа наилучших ответов, описанному в главе 4, и расширим его на игры с непрерывными стратегиями наподобие тех, которые представлены в главе 5. Наша первоочередная задача — определить наилучший ответ Эверт (ее наилучший выбор вероятности p) на каждую из возможных стратегий Навратиловой. Поскольку эти стратегии также могут быть смешанными, их можно описать посредством вероятности того, что она прикроет ПЛ. Обозначим эту вероятность как q; тогда 1 — q — вероятность того, что Навратилова прикроет ПД. Назовем смешанную стратегию Навратиловой «q-комбинация» и попытаемся найти наилучший ответ Эверт p в случае выбора Навратиловой каждого возможного значения q.

Из таблицы выигрышей на рис. 7.1 следует, что р-комбинация Эверт обеспечивает ей такой ожидаемый выигрыш:

50p + 90(1 — p), если Навратилова выберет ПЛ,

80p + 20(1 — p), если Навратилова выберет ПД.

Стало быть, в случае q-комбинации Навратиловой ожидаемый выигрыш Эверт составит:

[50p + 90(1 — p)]q + [80p + 20(1 — p)](1 — q).

Перегруппировав члены выражения, получаем следующую формулу вычисления ожидаемого выигрыша Эверт:

[50q + 80(1 — q)]p + [90q + 20(1 — q)] (1 — p) = [90q + 20(1 — q)] + [50q + 80(1 — q) — 90q — 20(1 — q)]p = [20 + 70q] + [60 — 100q]p.

Используем этот ожидаемый выигрыш для поиска значений наилучших ответов p Эверт.

Мы пытаемся определить значение p, максимизирующее выигрыш Эверт при каждом значении q, поэтому основной вопрос состоит в том, как формула расчета ожидаемого выигрыша зависит от p. Здесь важную роль играет коэффициент перед p: [60 –100 q]. В частности, имеет значение положительный он (тогда ожидаемый выигрыш Эверт увеличивается по мере увеличения p) или отрицательный (тогда ожидаемый выигрыш Эверт уменьшается по мере увеличения p). Очевидно, что знак этого коэффициента зависит от значения q, причем q имеет критическое значение в случае, когда 60 — 100q = 0; то есть q равно 0,6.

Когда при q < 0,6 Навратиловой коэффициент [60 — 100q] имеет положительное значение, ожидаемый выигрыш Эверт увеличивается по мере повышения значения p и ее наилучший выбор p = 1, или чистая стратегия ПЛ. Аналогичным образом при q > 0,6 Навратиловой наилучший выбор Эверт — p = 0, или чистая стратегия ПД. Если q = 0,6, Эверт получит один и тот же ожидаемый выигрыш независимо от значения p; при этом любая комбинация стратегий ПЛ и ПД так же эффективна, как и любая другая: любое значение p в диапазоне от 0 до 1 может быть наилучшимответом. Кратко сформулируем эти выводы, для того чтобы использовать их в будущем.

Если q < 0,6, наилучший ответ p = 1 (чистая стратегия ПЛ).

Если q = 0,6, любая p-комбинация будет наилучшим ответом.

Если q > 0,6, наилучший ответ p = 0 (чистая стратегия ПД).

Для быстрого подтверждения этих интуитивных выводов заметим, что при низком значении q (Навратилова с достаточно низкой вероятностью будет прикрывать удар ПЛ) Эверт следует выбрать ПЛ, а при высоком значении q (Навратилова с достаточно высокой вероятностью будет прикрывать удар ПЛ) — ПД. Точное значение этой «достаточности», а значит, и точка перехода на другую стратегию q = 0,6 зависят от конкретных выигрышей в данном примере[92].

Мы уже говорили о том, что смешанные стратегии — это просто особый тип непрерывной стратегии, в которой вероятность играет роль непрерывной переменной. Теперь мы нашли наилучшее значение p Эверт, соответствующее каждому значению q, выбранному Навратиловой. Иными словами, определили правило наилучших ответов Эверт, которое можно отобразить на графике так же, как мы это делали в главе 5.

Этот график расположен в левом фрагменте рисунка 7.2, где значения q показаны на горизонтальной оси, а значения p — на вертикальной. Обе вероятности ограничены диапазоном от 0 до 1. Если q меньше 0,6, p имеет максимальное значение 1; если q больше 0,6, p имеет минимальное значение 0. При q = 0,6 все значения p от 0 до 1 в равной степени наилучшие для Эверт, поэтому наилучший ответ — вертикальная линия, находящаяся между 0 и 1. Этому графику наилучших ответов присуща своя особенность: в отличие от непрерывно восходящих или нисходящих прямых или кривых линий в главе 5, данный график плоский в двух интервалах значений q и опускается за один шаг в точке сопряжения этих интервалов. Тем не менее в концептуальном смысле он ничем не отличается от любого другого графика наилучших ответов.

Рис. 7.2. Наилучшие ответы и равновесие в игре в теннис

Аналогичным образом можно вычислить правило наилучших ответов Навратиловой (ее наилучшую q-комбинацию, соответствующую каждой из p-комбинаций Эверт). Мы предлагаем вам сделать это самостоятельно, чтобы закрепить понимание самой концепции и алгебраических вычислений. Кроме того, вы должны проверить правильность интуитивных выводов в отношении выбора Навратиловой так, как мы это делали для Эверт. Мы же просто приведем здесь полученный результат.

Если p < 0,7, наилучший ответ q = 0 (чистая стратегия ПД).

Если p = 0,7, любая q-комбинация будет наилучшим ответом.

Если p > 0,7, наилучший ответ q = 1 (чистая стратегия ПЛ).

График этого правила наилучших ответов Навратиловой расположен в среднем фрагменте рис. 7.2.

В правом фрагменте рис. 7.2 объединены графики из двух соседних фрагментов, причем левый график отражен по диагонали (линия p = q) с тем, чтобы значения p оказались на горизонтальной оси, а значения q — на вертикальной, после чего совмещен со средним графиком. Теперь серые и черные линии пересекаются в одной точке, где p = 0,7, а q = 0,6. В этой точке выбор смешанной стратегии каждым игроком будет наилучшим ответом на выбор другого игрока, поэтому данная пара образует равновесие Нэша в смешанных стратегиях.

В таком представлении правил наилучших ответов чистые стратегии — особые случаи, соответствующие предельным значениям переменных p и q. Как видим, графики наилучших ответов не имеют общих точек на любой из сторон квадрата, где каждое значение p и q равно либо 0, либо 1. Это говорит об отсутствии в игре равновесий в чистых стратегиях, как и было показано в разделе 7 главы 4. В этом примере равновесие в смешанных стратегиях — единственное равновесие Нэша в данной игре.

С помощью метода, примененного нами в разделе 2.А для поиска защищенного от использования значения p для Эверт, вы также можете вычислить выбор Навратиловой значения q, защищенного от использования. Выполнив соответствующие расчеты, получите значение q = 0,6. Таким образом, две выбранные участницами игры смешанные стратегии, защищенные от использования, на самом деле и наилучшие ответы друг на друга, которые представляют собой смешанные стратегии двух игроков, образующие равновесие Нэша.

В действительности, чтобы найти равновесие в смешанных стратегиях в игре с нулевой суммой, каждый участник которой располагает двумя чистыми стратегиями, не нужно проходить весь процесс определения правил наилучших ответов, построения соответствующих графиков и поиска точки их пересечения. Вы можете просто записать уравнения защищенности от использования из раздела 2.А по комбинации каждого игрока, а затем решить их. Если в полученном решении обе вероятности попадают в диапазон от 0 до 1, вы нашли то, что нужно. Если одна из вероятностей имеет отрицательное значение или значение больше 1, значит, в данной игре нет равновесия в смешанных стратегиях и вам необходимо снова поискать его в чистых стратегиях. В разделе 6 и разделе 7 представлен анализ методов решения игр, участники которых имеют более двух чистых стратегий.

3. Равновесие Нэша как система убеждений и ответов

При одновременном выполнении ходов ни один из игроков не может отреагировать на фактический выбор другого игрока. Вместо этого каждый участник игры предпринимает свое наилучшее действие, исходя из представлений о том, какой именно ход выбирает в данный момент соперник. В главе 4 мы назвали такие представления убеждениями игрока относительно выбора стратегии другим игроком, затем интерпретировали равновесие Нэша как конфигурацию стратегий, при которой эти убеждения верны, а значит, каждый игрок выбирает свой наилучший ответ на фактические действия другого игрока. Эта концепция оказалась весьма полезной для понимания структуры и исхода многих важных типов игр, особенно таких, как дилемма заключенных, координационные игры и игра в труса.

Однако в главе 4 мы рассматривали исключительно равновесия Нэша в чистых стратегиях. По этой причине осталось почти незамеченным одно скрытое предположение: каждый игрок твердо убежден, что другой игрок выберет определенную чистую стратегию. Теперь, когда мы анализируем более общие смешанные стратегии, концепция убеждения требует новой интерпретации.

Порой игроки не уверены в предполагаемых действиях других участников игры. Так, в координационной игре из главы 4, в которой Гарри хочет встретиться с Салли, Гарри не уверен в том, куда отправится Салли — в Starbucks или Local Latte, и его убеждение может сводиться к тому, что она окажется в любом из этих кафе с вероятностью 50 на 50. А в примере с игрой в теннис Эверт могла осознавать, что Навратилова пытается держать ее в неведении, а значит, она (Эверт) не может быть уверена в том, какое из доступных действий выберет Навратилова. В разделе 4 главы 2 мы обозначили такую ситуацию термином «стратегическая неопределенность», а в главе 4 указали, что такая неопределенность приводит к формированию равновесий в смешанных стратегиях. Теперь же рассмотрим эту идею более подробно.

Однако важно различать неуверенность и неправильные убеждения. Скажем, в примере с игрой в теннис Навратилова не может быть уверена в том, что выберет Эверт в каждом конкретном случае. Тем не менее у нее могут быть правильные убеждения относительно комбинации стратегий Эверт, а именно вероятности, с которой она выбирает между своими двумя чистыми стратегиями. Наличие правильных убеждений по поводу смешанных действий означает знание, или вычисление, или догадки в отношении правильных вероятностей, с которыми другой игрок делает выбор между своими базовыми или чистыми стратегиями. Что касается равновесия в нашем примере, оказалось, что равновесная комбинация стратегий Эверт составила 70 % для ПЛ и 30 % для ПД. Если Навратилова убеждена в том, что Эверт выберет ПЛ с вероятностью 70 % и ПД с вероятностью 30 %, то ее убеждения в данном равновесии будут правильными, хотя и неопределенными.

Таким образом, у нас есть альтернативный и математически эквивалентный способ определения равновесия Нэша в категориях убеждений: каждый игрок формирует убеждения о вероятностях в той комбинации стратегий, которую применяет другой игрок, и выбирает на нее собственный наилучший ответ. Равновесие Нэша в смешанных стратегиях наблюдается в случае правильности этих убеждений в указанном нами смысле.

В следующем разделе мы рассмотрим смешанные стратегии и соответствующие равновесия Нэша в играх с ненулевой суммой. В таких играх нет общих оснований для того, чтобы стремление другого игрока удовлетворить собственные интересы противоречило вашим интересам. Следовательно, в таких играх вам далеко не всегда нужно скрывать свои намерения от другого игрока, а также нет причин держать его в неведении. Тем не менее из-за одновременного выполнения ходов каждый игрок может испытывать субъективную неуверенность относительно действий другого игрока, поэтому у него могут быть неопределенные убеждения, вынуждающие его сомневаться в целесообразности собственных действий. Все это может привести к формированию равновесий в смешанных стратегиях, а их интерпретация в категориях субъективно неопределенных, но правильных убеждений играет особенно важную роль.

4. Смешивание стратегий в играх с ненулевой суммой

Методы поиска равновесий в смешанных стратегиях в играх с нулевой суммой (такие как защищенность от использования соперником или свойство безразличия соперника) применимы и к играм с ненулевой суммой, причем в некоторых из них действительно позволяют найти равновесия в смешанных стратегиях. Однако в таких играх интересы игроков могут в определенной степени совпадать. Следовательно, тот факт, что другой игрок использует ваш системный выбор стратегий с выгодой для себя, необязательно означает, что это нанесет ущерб вам, как в случае игр с нулевой суммой. Например, в координационной игре, которую мы анализировали в главе 4, игроки способны лучше координировать свои действия, если каждый из них может полагаться на системные действия другого, поскольку случайный выбор действий только повышает риск неудачи с их координацией. Именно поэтому в играх с ненулевой суммой равновесия в смешанных стратегиях имеют слабое логическое обоснование или не имеют его вообще. Ниже мы проанализируем равновесия в смешанных стратегиях в контексте некоторых известных игр с ненулевой суммой, а также обсудим их значимость или отсутствие таковой.

А. Встретятся ли Гарри и Салли? Доверие, чистая координация и битва полов

Проиллюстрируем смешивание стратегий в играх с ненулевой суммой на примере игры «встреча», основанной на игре в доверие. Для вашего удобства мы воспроизводим таблицу этой игры (см. рис. 4.11) на рис. 7.3. Сначала проанализируем игру с точки зрения Салли. Если она уверена в том, что Гарри отправится в Starbucks, ей тоже следует туда пойти. Если она уверена, что Гарри выберет Local Latte, то же самое нужно сделать и ей. Но если Салли сомневается в выборе Гарри, то каким должен быть ее наилучший выбор?

Рис. 7.3. Игра в доверие

Чтобы ответить на этот вопрос, мы должны дать более четкую трактовку неопределенности в понимании Салли. (В теории вероятностей и статистике есть специальный термин для обозначения такой неопределенности — субъективная неопределенность. В контексте неопределенности относительно действий другого игрока это стратегическая неопределенность; вспомните о различиях, которые мы анализировали в разделе 2.Г главы 2). Для большей точности укажем, с какой вероятностью Гарри выберет то или иное кафе, по мнению Салли. Вероятность того, что это будет Local Latte, может быть выражена любым вещественным числом от 0 до 1 (то есть от 0 % до 100 %). Мы охватим все возможные варианты с помощью алгебраических формул, обозначив символом p вероятность того, что Гарри (по мнению Салли) выберет Starbucks; переменная p может иметь любое вещественное значение в диапазоне от 0 до 1. Тогда (1 — p) — это вероятность (снова по мнению Салли) того, что Гарри предпочтет Local Latte. Иными словами, мы описываем стратегическую неопределенность Салли следующим образом: она считает, что Гарри использует смешанную стратегию, применив совокупность двух чистых стратегий (Starbucks и Local Latte) в пропорциях или с вероятностью p и (1 — p) соответственно. Назовем эту смешанную стратегию p-комбинацией Гарри, хотя на данный момент это всего лишь идея, существующая в сознании Салли.

С учетом этой неопределенности Салли может вычислить ожидаемые выигрыши от своих действий, предпринятых на основании убежденности в отношении р-комбинации Гарри. Если Салли выберет Starbucks, это даст ей 1  p + 0  (1 — p) = p, если Local Latte, это даст 0  p + 2  (1 — p) = 2  (1 — p). Когда p имеет высокое значение, p > 2(1 — p), то есть Салли достаточно уверена в том, что Гарри отправится в Starbucks, ей лучше пойти туда же. Точно так же, когда p имеет низкое значение, p < 2(1 — p), а значит, Салли достаточно уверена в том, что Гарри отправится в Local Latte, ей тоже нужно пойти в это кафе. При p = 2(1 — p), или 3p = 2, или p = 2/3 эти два варианта выбора обеспечивают Салли один и тот же выигрыш. Следовательно, если она убеждена в том, что p = 2/3, она может быть не уверена в собственном выборе и колебаться между этими двумя вариантами.

Понимание этого факта может вызвать у Гарри неуверенность в выборе Салли. Следовательно, Гарри также испытывает субъективную стратегическую неопределенность. Предположим, он считает, что Салли выберет Starbucks с вероятностью q, а Local Latte с вероятностью (1 — q). Аналогичные рассуждения показывают, что Гарри следует выбрать Starbucks, если q > 2/3, и Local Latte, если q < 2/3. В случае если q = 2/3, ему будет безразлично, какое из этих двух действий предпринять, и у него возникнет неуверенность в собственном выборе.

Теперь у нас есть основа для равновесия в смешанных стратегиях с p = 2/3 и q = 2/3. При таком равновесии данные значения p и q одновременно являются и фактическими вероятностями чистых стратегий, входящих в соответствующую смешанную стратегию, и субъективными убеждениями каждого игрока относительно вероятностей чистых стратегий в смешанной стратегии другого игрока. Правильность этих убеждений поддерживает собственное безразличие каждого игрока в отношении выбора между двумя чистыми стратегиями, а значит, и готовность каждого смешать их. Это полностью соответствует концепции равновесия Нэша как системы самоисполняющихся убеждений и ответных действий, описанной в разделе 3.

Ключ к поиску равновесия в смешанных стратегиях состоит в том, что Салли готова смешать две чистые стратегии только тогда, когда ее субъективная неопределенность в отношении выбора Гарри правильна, то есть если правильно значение р в р-комбинации Гарри. Алгебраичски это утверждение можно обосновать посредством вычисления равновесного значения р с помощью уравнения р = 2(1 — р), которое гарантирует, что Салли получит такой же ожидаемый выигрыш от двух своих чистых стратегий при сопоставлении каждой из них с р-комбинацией Гарри. Если данное равенство справедливо в случае равновесия, вероятности чистых стратегий в смешанной стратегии Гарри как будто поддерживают безразличие Салли. Мы особо подчеркиваем сочетание «как будто», поскольку в этой игре у Гарри нет причин поддерживать безразличие Салли, поэтому полученный результат — просто свойство данного равновесия. Тем не менее общая идея такова: в равновесии Нэша в смешанных стратегиях вероятности чистых стратегий, входящих в смешанную стратегию каждого игрока, поддерживают безразличие другого игрока в отношении выбора между его чистыми стратегиями. Мы вывели свойство безразличия соперника выше в ходе обсуждения игр с нулевой суммой, а теперь видим, что оно актуально и для игр с ненулевой суммой.

Однако в игре в доверие равновесие в смешанных стратегиях имеет ряд весьма нежелательных свойств. Во-первых, оно обеспечивает обоим игрокам достаточно низкие ожидаемые выигрыши. Формулы расчета ожидаемых выигрышей Салли от двух ее действий, р и 2 (1 — р), в обоих случаях равны 2/3 при р = 2/3. Точно так же ожидаемые выигрыши Гарри в случае равновесной q-комбинации Салли при q = 2/3 также одинаковы и составляют 2/3. Следовательно, при равновесии в смешанных стратегиях каждый игрок получает выигрыш 2/3. В главе 4 мы нашли в этой игре два равновесия в чистых стратегиях, причем даже худшее из них (оба выбирают Starbucks) обеспечивает каждому игроку выигрыш 1, а лучшее (оба выбирают Local Latte) — выигрыш 2.

Причина, по которой в случае равновесия в смешанных стратегиях два игрока получают такие плохие результаты, состоит в следующем: при выборе игроками своих действий независимо и бессистемно достаточно высока вероятность того, что они отправятся в разные места и в результате не встретятся и оба получат выигрыш 0. Гарри и Салли не увидятся, если один из них пойдет в Starbucks, а другой в Local Latte или наоборот. Вероятность такого развития событий при использовании обоими равновесных комбинаций составляет 2  (2/3)  (1/3) = 4/9[93]. Аналогичная проблема наблюдается в равновесиях в смешанных стратегиях в большинстве игр с ненулевой суммой.

Второе нежелательное свойство равновесия в смешанных стратегиях — его неустойчивость. Если любой из игроков хотя бы немного отклонится от точных значений р = 2/3 или q = 2/3, наилучшим выбором другого игрока станет одна из чистых стратегий. И как только он ее применит, другой игрок получит более высокий выигрыш при выборе той же чистой стратегии, а значит, в игре наступит одно из двух равновесий в чистых стратегиях. Такая неустойчивость равновесий в смешанных стратегиях присуща многим играм с ненулевой суммой. Тем не менее в некоторых играх с ненулевой суммой все же есть более устойчивые равновесия в смешанных стратегиях. Один из примеров, описанный ниже в данной главе и в главе 12, — это равновесие в смешанных стратегиях в игре в труса, в отношении которой существует интересная эволюционная интерпретация.

С учетом результатов анализа равновесия в смешанных стратегиях в версии игры во встречу, основанной на игре в доверие, вы, по всей вероятности, теперь можете оценить равновесия в смешанных стратегиях в других вариантах игры во встречу с ненулевой суммой. В ее версии, построенной на чистой координации (см. рис. 4.10), выигрыш от встречи в двух кафе один и тот же, а значит, в равновесии в смешанных стратегиях значения p и q будут такими: p = 1/2 и q = 1/2. В варианте этой игры, представляющем собой битву полов (см. рис. 4.12), Салли предпочитает встретиться с Гарри в Local Latte, поскольку так она получит выигрыш 2 вместо 1 в случае встречи в Starbucks. Решение Салли зависит от того, больше или меньше 2/3 ее субъективная вероятность, что Гарри отправится в Starbucks. (В этом случае выигрыши Салли аналогичны выигрышам в версии игры в доверие, поэтому критическое значение p не меняется.) Гарри предпочитает встретиться в Starbucks, поэтому его решение зависит от того, больше или меньше 1/3 его субъективная вероятность, что Салли пойдет в Starbucks. Таким образом, при равновесии Нэша в смешанных стратегиях p = 2/3, а q = 1/3.

Б. Встретит ли Джеймс Дина? Игра в труса

В игре в труса с ненулевой суммой также существует равновесие в смешанных стратегиях, которое можно найти с помощью описанных выше методов, хотя у этой игры несколько иная интерпретация. Если вы помните, ее участники — Джеймс и Дин, пытающиеся избежать встречи. Таблица игры, первоначально представленная на рис. 4.13, воспроизведена здесь на рис. 7.4.

Рис. 7.4. Игра в труса

Если применить в этой игре смешанные стратегии, то в p-комбинации Джеймса вероятность того, что он свернет в сторону, будет равна p, а вероятность того, что он поедет прямо, составит 1 — p. При такой p-комбинации Дин получит выигрыш 0  p — 1  (1 — p) = p — 1, выбрав вариант «свернуть», и 1  p — 2  (1 — p) = 3p — 2, предпочтя вариант «ехать прямо». При сравнении этих уравнений видно, что Дин получит более высокий выигрыш при выборе «свернуть», когда p — 1 > 3p — 2, или когда 2p < 1, или когда p < 1/2 — иными словами, когда p имеет малое значение и Джеймс с большей вероятностью выберет «ехать прямо». Напротив, когда у p высокое значение и Джеймс с большей вероятностью выберет «свернуть», Дину лучше «ехать прямо». Если в p-комбинации Джеймса значение p в точности равно 1/2, то Дину безразлично, какую из двух чистых стратегий применить; следовательно, он в равной мере готов их смешивать. Аналогичный анализ игры с точки зрения Джеймса в плане оценки его вариантов в игре против q-комбинации Дина дает те же результаты. Таким образом, p = 1/2 и q = 1/2 и есть равновесие в смешанных стратегиях в этой игре.

В свойствах этого равновесия присутствуют общие черты и различия с равновесиями в смешанных стратегиях в игре «встреча». Здесь ожидаемый выигрыш каждого игрока достаточно низкий: (1/2). Это плохо, как и в случае игры во встречу, но в отличие от нее выигрыш при равновесии в смешанных стратегиях не хуже для обоих игроков, чем выигрыш при двух равновесиях в чистых стратегиях. В действительности, поскольку в данной игре интересы игроков в какой-то степени противоположны, каждый непременно получит более высокий выигрыш от равновесия в смешанных стратегиях, чем от равновесия в чистых стратегиях, подразумевающего выбор варианта «свернуть».

Однако такое равновесие в смешанных стратегиях тоже неустойчиво. Если Джеймс повысит вероятность применения варианта «ехать прямо» до значения чуть больше 1/2, это приведет к выбору Дином чистой стратегии «свернуть». В результате сочетание стратегий «ехать прямо» / «свернуть» становится равновесием в чистых стратегиях. Если Джеймс, наоборот, снизит вероятность выбора варианта «ехать прямо» до значения чуть меньше 1/2, Дин выберет вариант «ехать прямо» и игра снова перейдет к другому равновесию в чистых стратегиях[94].

В данном разделе мы нашли равновесия в смешанных стратегиях в нескольких играх с ненулевой суммой путем решения уравнений, вытекающих из свойства безразличия соперника. Из главы 4 мы уже знаем, что в таких играх есть и равновесия в чистых стратегиях. Кривые наилучших ответов позволяют составить исчерпывающую картину, отобразив все равновесия Нэша одновременно. Поскольку в уже ознакомились с ними в двух отдельных фрагментах книги, мы не будем тратить время и место на построение графиков, а просто подчеркнем, что при наличии двух равновесий в чистых стратегиях и одного в смешанных стратегиях (как в приведенных выше примерах) кривые наилучших ответов пересекаются в трех разных местах, по одному на каждое равновесие Нэша. В конце этой главы мы предложим вам самостоятельно построить графики наилучших ответов для аналогичных игр.

5. Общий анализ равновесий в смешанных стратегиях

Теперь, узнав, как найти равновесия в смешанных стратегиях в играх с нулевой и ненулевой суммой, целесообразно проанализировать дополнительные свойства этих равновесий. В частности, в данном разделе мы отметим ряд общих свойств равновесий в смешанных стратегиях, а также ознакомим вас с некоторыми результатами, которые поначалу покажутся вам парадоксальными, но лишь до тех пор, пока вы полностью не проанализируете рассматриваемую игру.

А. Равновесие в слабом смысле

Свойство безразличия соперника, о котором шла речь в разделе 2, подразумевает, что в случае равновесия в смешанных стратегиях каждый игрок получает один и тот же ожидаемый выигрыш от каждой из двух своих чистых стратегий, а значит, получит один и тот же ожидаемый выигрыш и от любой их комбинации. Следовательно, равновесия в смешанных стратегиях — это равновесия Нэша только в слабом смысле. Когда один игрок выбирает свою равновесную комбинацию стратегий, у другого нет явных оснований отступать от своей равновесной комбинации. С другой стороны, этот игрок ничего бы не потерял, выбрав другую смешанную стратегию или даже одну из своих чистых стратегий. Каждому игроку безразлично, какую из чистых стратегий или их комбинацию выбрать, до тех пор, пока другой игрок разыгрывает свою правильную (равновесную) комбинацию.

На первый взгляд это сводит на нет принцип использования равновесия Нэша в смешанных стратегиях в качестве концепции решения игр. Зачем игроку выбирать соответствующую комбинацию стратегий, когда другой игрок применяет свою комбинацию? Почему бы не поступить проще, выбрав одну из чистых стратегий? Ведь ожидаемый выигрыш в обоих случаях тот же. Ответ состоит в том, что это не будет равновесием Нэша; такой исход игры не будет устойчивым, поскольку тогда другой игрок отклонится от своей комбинации стратегий. Предположим, Эверт говорит себе: «Когда Навратилова применит свою наилучшую комбинацию (q = 0,6), я получу один и тот же выигрыш от ПЛ, ПД или их любого сочетания. Так зачем же их смешивать? Почему бы просто не использовать ПЛ?» В таком случае Навратиловой выгоднее перейти к чистой стратегии прикрытия удара ПЛ. Аналогичным образом, если Гарри выберет чистую стратегию Starbucks в игре во встречу, основанной на доверии, то Салли может получить более высокий выигрыш в равновесии 1 вместо 2/3 благодаря переходу с комбинации 50 на 50 на чистую стратегию Starbucks.

Б. Парадоксальное изменение вероятностей чистых стратегий в смешанной стратегии в играх с нулевой суммой

Игры с равновесиями в смешанных стратегиях порой демонстрируют свойства, которые на первый взгляд могут казаться противоречащими здравому смыслу. Самое интересное из них — это изменение вероятностей чистых стратегий в равновесной смешанной стратегии, приводящее к изменению структуры выигрышей в соответствующей игре. Чтобы проиллюстрировать это, вернемся к Эверт и Навратиловой и их игре с розыгрышем очка в теннисе.

Предположим, Навратилова усовершенствует навыки прикрытия удара по линии до уровня, при котором результативность Эверт в использовании стратегии ПЛ против стратегии Навратиловой по прикрытию ПЛ сокращается с 50 до 30 %. Такое улучшение мастерства Навратиловой обусловливает изменение таблицы выигрышей, в том числе смешанных стратегий каждой участницы игры, представленной на рис. 7.1. Новая таблица игры отображена на рис. 7.5.

Рис. 7.5. Измененные выигрыши в игре в теннис

Единственное отличие от таблицы на рис. 7.1 наблюдается в верхней левой ячейке, где выигрыш Эверт 50 теперь составляет 30, а выигрыш Навратиловой 50 равен 70. Это изменение не приводит к игре с равновесием в чистых стратегиях, поскольку у ее участниц по-прежнему противоположные интересы: Навратилова все так же хочет, чтобы их выбор совпадал, а Эверт все так же необходимо, чтобы их выбор отличался. Так что мы все еще имеем игру, подразумевающую смешивание стратегий.

Но чем эти равновесные комбинации стратегий отличаются от рассчитанных в разделе 2? Многие могли бы заявить, что теперь, научившись очень хорошо прикрывать ПЛ, Навратилова должна делать это чаще. В основе таких рассуждений лежит предположение о том, что равновесная q-комбинация Навратиловой должна быть в большей степени смещена в сторону ПЛ, а ее равновесное значение q должно превышать рассчитанное значение 0,6.

Но при вычислении q-комбинации Навратиловой на основании условия о безразличии Эверт в отношении выбора между двумя чистыми стратегиями мы получим 30q + 80(1 — q) = 90q + 20(1 — q), или q = 0,5. Фактическое равновесное значение q (50 %) связано с исходным значением q (60 %) в прямо противоположном смысле по сравнению с интуитивными прогнозами многих людей.

Хотя на первый взгляд подобные интуитивные выводы кажутся вполне обоснованными, в них упущен один важный аспект теории стратегий: взаимодействие между двумя игроками. После изменения выигрышей Эверт также будет пересматривать свою равновесную комбинацию, а Навратилова должна учитывать как новую структуру выигрышей, так и поведение Эверт при определении своей новой комбинации стратегий. В частности, поскольку теперь Навратилова гораздо лучше прикрывает ПЛ, Эверт в своей смешанной стратегии чаще использует ПД. И чтобы противодействовать этому, Навратилова тоже чаще прикрывает ПД.

Это станет более очевидным после того, как мы вычислим новую комбинацию Эверт. Ее равновесное значение p должно обеспечивать равенство между ожидаемым выигрышем Навратиловой от прикрытия ПЛ, 30p + 90(1 — p), и ее ожидаемым выигрышем от прикрытия ПД, 80р + 20(1 — p). Таким образом, мы имеем уравнение 30p + 90(1 — p) = 80p + 20(1 — p), или 90–60p = 20 + 60p, или 120p = 70. Следовательно, значение p Эверт должно составлять 7/12, или 0,583 (58,3 %). Сравнение этого нового равновесного значения p с рассчитанным в разделе 2 первоначальным значением 70 % показывает, что Эверт существенно сократила количество использования ПЛ в ответ на повышение мастерства Навратиловой. С учетом такого поведения Эверт Навратиловой также лучше сократить частоту применения стратегии ПЛ. Теперь Эверт будет использовать с выгодой для себя любой другой выбор комбинации стратегий Навратиловой, особенно той, в которой предпочтительна стратегия ПЛ.

Означает ли это, что Навратилова совершенствовала навыки зря? Нет, но мы должны судить об этом не по частоте применения той или иной стратегии, а по итоговым выигрышам. Когда Навратилова использует свою новую равновесную комбинацию с q = 0,5, процент успеха Эверт при выборе любой из ее чистых стратегий составляет (30  0,5) + (80  0,5) = (90  0,5) + (20  0,5) = 55. Это меньше, чем процент успеха Эверт 62 в исходном примере. Следовательно, средний выигрыш Навратиловой также возрастает с 38 до 45, а значит, улучшение навыков прикрытия удара ПЛ действительно принесло ей пользу.

В отличие от парадоксального результата, который мы наблюдали при анализе стратегического ответа Навратиловой на изменение в структуре выигрышей, здесь мы видим, что этот ответ полностью соответствует интуитивным представлениям, если рассматривать его в свете ожидаемго выигрыша Навратиловой. На самом деле с точки зрения ожидаемых выигрышей ответы игроков на изменение структуры выигрышей просто не могут противоречить здравому смыслу, хотя стратегические ответы, как мы уже убедились, могут[95]. Самый интересный аспект такого парадоксального результата стратегических ответов игроков — это сигнал, который он подает теннисистам и, в более общем плане, участникам стратегических игр. Этот результат эквивалентен утверждению, что Навратилова должна усовершенствовать навыки прикрытия удара по линии с тем, чтобы ей не пришлось использовать такое прикрытие слишком часто.

Далее мы представим еще более общий и неожиданный результат, обусловленный изменениями вероятностей применения чистых стратегий в смешанной стратегии. Условие безразличия соперника означает, что равновесные вероятности чистых стратегий в смешанной стратегии каждого игрока зависят исключительно от выигрышей другого игрока, а не от его собственных. Рассмотрим игру в доверие на рис. 7.3. Предположим, выигрыш Салли от встречи в Local Latte увеличивается с 2 до 3, тогда как все остальные выигрыши не меняются. Теперь в случае p-комбинации Гарри Салли получит выигрыш 1  p + 0  (1 — p) = p, если выберет Starbucks, и 0  p + 3  (1 — p) = 3–3p, если Local Latte. Условие безразличия Салли выглядит так: p = 3–3p, или 4p = 3, или p = 3/4 по сравнению со значением 2/3, вычисленным нами выше для p-комбинации Гарри в исходной игре. Расчет условия безразличия Гарри остается прежним и дает результат q = 2/3 в случае равновесной стратегии Салли. Изменение выигрышей Салли меняет вероятности применения чистых стратегий в смешанной стратегии Гарри, а не Салли! В упражнении S13 у вас будет возможность доказать истинность этого вывода в общей формулировке: доли чистых стратегий в равновесной смешанной стратегии игрока меняются не вследствие изменения его выигрышей, а только в случае изменения выигрышей его соперника.

В. Рискованный и безопасный выбор в играх с нулевой суммой

В спорте некоторые стратегии сравнительно безопасны; они не приводят к полной катастрофе, даже если соперник предвидит такой выбор, но и не позволяют добиться сверхрезультатов, если оказываются неожиданными для соперника. Другие стратегии достаточно рискованны; они обеспечивают блестящие результаты, если другая сторона к ним не готова, но терпят полное поражение, когда другая сторона готова. В американском футболе на третьем дауне, когда остается пройти один ярд, пробежка на середину поля — это безопасная стратегия, а длинный пас — рискованная. Здесь возникает интересный вопрос, поскольку порой в ситуациях «третий даун, один ярд» на кону стоит больше, чем в других подобных ситуациях. Например, начало игры с 10-ярдовой линии соперника гораздо сильнее влияет на возможное количество заработанных очков, чем ее старт с вашей собственной 20-ярдовой линии. Вопрос в том, следует ли вам чаще или реже прибегать к рискованным стратегиям в случае более высоких ставок, чем низких.

Для того чтобы представить это в более конкретном виде, проанализируйте вероятности успеха, представленные на рис. 7.6. (Обратите внимание, что тогда как в теннисе мы использовали проценты от 0 до 100, здесь мы используем вероятности от 0 до 1.) Безопасная игра команды нападения — пробежка; вероятность успешного первого дауна составляет 60 %, если команда защиты ожидает пробежки, и 70 %, если защита полагает, что будет пас. Рискованная игра команды нападения — пас, поскольку вероятность успеха в куда большей степени зависит от действий команды защиты; вероятность успеха равна 80 %, если защита ожидает пробежки, и всего 30 %, если защита рассчитывает на пас.

Рис. 7.6. Вероятность успеха команды нападения в игре «третий даун, один ярд»

Допустим, в случае успешной игры команда защиты получает выигрыш, равный V, а неудачной — выигрыш 0. Выигрыш V может представлять собой то или иное количество очков, скажем, три очка за гол в ворота или семь очков за тачдаун. Кроме того, выигрыш V может отображать определенный уровень статуса или количество денег, заработанных командой; например, V = 100 за успешную игру в обычном матче или V = 1 000 000 за победу в Суперкубке по американскому футболу[96].

В фактической таблице игры между командами нападения и защиты, представленной на рис. 7.7, отображены ожидаемые выигрыши каждой команды. Они представляют собой среднее между выигрышем V при успешной игре и 0 при неудачной. Например, ожидаемый выигрыш команды нападения, использующей стратегию «пробежка» в случае, если команда защиты ожидает стратегии «пробежка», составляет 0,6  V + 0,4  0 = 0,6V. Поскольку данная игра относится к категории игр с нулевой суммой, выигрыш команды защиты в этой ячейке равен –0,6V. Аналогичным образом вы можете рассчитать выигрыши во всех остальных ячейках таблицы, чтобы убедиться, что значения, приведенные ниже, правильные.

Рис. 7.7. Игра «третий даун, один ярд»

При равновесии в смешанных стратегиях вероятность p того, что команда нападения выберет стратегию «пробежка», определяется свойством безразличия соперника. Стало быть, правильное значение p удовлетворяет следующему условию:

p[–0,6V] + (1 — p)[–0,8V] = p[–0,7V] + (1 — p)[–0,3V].

Обратите внимание, что мы можем разделить обе стороны этого равенства на V, чтобы полностью исключить V из процесса вычисления p[97]. Тогда упрощенное уравнение будет выглядеть так: –0,6p — 0,8(1 — p) = –0,7p — 0,3(1 — p), или 0,1p = 0,5(1 — p). Решив его, получим p = 5/6; следовательно, команда нападения с высокой вероятностью применит стратегию «пробежка» в своей комбинации стратегий. Такую безопасную игру часто называют «процентной игрой», потому что это нормальный ход игры в подобных ситуациях. Рискованная игра (стратегия «пас») разыгрывается лишь изредка, чтобы держать соперника в неведении или, говоря на языке футбольных комментаторов, «не давать защите расслабиться».

Интересный аспект этого результата состоит в том, что выражение для вычисления p совершенно не зависит от V. То есть, согласно теории, процентную и рискованную игру следует смешивать в равных пропорциях как в очень важных, так и во второстепенных ситуациях. Но этот результат противоречит интуитивным выводам многих людей, которые считают, что в более важных ситуациях рисковать следует реже. Длинный пас на третьем дауне с одним оставшимся ярдом приемлем в обычный октябрьский воскресный день, но делать такой пас во время Суперкубка слишком рискованно.

Так кто же прав: теория или интуиция? По всей вероятности, мнения читателей по этому вопросу разделятся. Некоторые будут утверждать, что спортивные комментаторы ошибаются, и с радостью обнаружат, что теоретические аргументы опровергают их заявления. Другие примут сторону комментаторов и будут доказывать, что важные матчи требуют более безопасной игры. Есть и те, кто считает, что ради более крупных призов следует больше рисковать, однако даже они не находят поддержки данной идеи в теории, а это говорит о том, что размер приза или ущерба вряд ли оказывает какое-либо влияние на вероятности чистых стратегий в смешанной стратегии.

Во многих предыдущих случаях возникновения расхождений между теорией и интуицией мы утверждали, что они кажущиеся и являются результатом неспособности сделать теорию настолько общей или глубокой, чтобы она охватывала все аспекты ситуации, в отношении котрой делаются интуитивные выводы, и что улучшение теории позволяет устранить такие расхождения. В данном случае ситуация иная: проблема имеет фундаментальное значение для вычисления выигрышей от смешанных стратегий как взвешенных по вероятности средних значений, или ожидаемых выигрышей. И это отправная точка почти всех научных работ в современной теории игр[98].

6. Смешивание стратегий при наличии трех или более чистых стратегий у одного игрока

Наше обсуждение игр со смешанными стратегиями до сих пор ограничивалось только играми, в которых у каждого участника было по две чистые стратегии, а также их комбинации. Однако во многих стратегических ситуациях каждый игрок располагает большим количеством чистых стратегий, поэтому мы должны подготовиться к вычислению равновесных смешанных стратегий и в подобных случаях. Но уровень сложности таких расчетов стремительно повышается. В поистине сложных играх для поиска равновесия в смешанных стратегиях нам пришлось бы прибегнуть к помощи компьютера. Тем не менее в некоторых небольших играх найти такое равновесие вручную не составит труда. И этот процесс вычислений позволит лучше понять, как работает равновесие, чем при анализе решения, сгенерированного компьютером. По этой причине в данном и следующем разделах мы поищем решение более крупных игр.

В этом разделе мы остановимся на играх с нулевой суммой, в которых у одного из игроков всего две чистые стратегии, тогда как у другого — больше. Как мы заметили, в таких играх игрок, имеющий три (или более) чистые стратегии, как правило, использует в равновесии только две. Остальные просто не входят в эту комбинацию стратегий, то есть вероятность их применения равна нулю. Мы должны лишь определить, какие стратегии используются в равновесии, а какие нет[99].

В качестве примера рассмотрим игру в розыгрыш очка в теннисе, включив в число стратегий Эверт третий тип возврата подачи. Помимо удара по линии и удара по диагонали теперь она может использовать свечу (более медленный, но и более высокий и длинный удар). Равновесие зависит от выигрышей в случае применения свечи против каждой из двух оборонительных стратегий Навратиловой. Начнем с самого вероятного случая, а затем перейдем к анализу особого случая.

А. Общий случай

Теперь в распоряжении Эверт три чистые стратегии: ПЛ (по линии), ПД (по диагонали) и СВ (свеча), а у Навратиловой только две: прикрывать удар ПЛ или прикрывать удар ПД. Таблица выигрышей этой новой игры представлена на рис. 7.8. Мы исходили из предположения, что выигрыши Эверт от стратегии СВ находятся в диапазоне между максимальным и минимальным выигрышами, которые она может получить от стратегий ПЛ и ПД, а также что они не слишком отличаются в случаях, когда Навратилова прикрывает ПЛ или ПД. В таблице отображены выигрыши не только от чистых стратегий, но и от трех чистых стратегий Эверт против q-комбинации Навратиловой. (Мы не показываем строку для p-комбинации Эверт, поскольку в этом нет необходимости. Для этого понадобились бы две вероятности, скажем, p1 в случае стратегии ПЛ и p2 в случае стратегии ПД; тогда вероятность стратегии СВ составила бы (1 — p1 — p2). В следующем разделе мы расскажем, как найти равновесные комбинации стратегий такого типа.)

Рис. 7.8. Таблица выигрышей в игре с розыгрышем очка с использованием стратегии «свеча»

Строго говоря, прежде чем приступать к поиску равновесия в смешанных стратегиях, мы должны убедиться в том, что в игре отсутствует равновесие в чистых стратегиях. Однако сделать это достаточно легко, поэтому оставляем эту задачу вам и переходим к смешанным стратегиям.

Мы проанализируем оптимальный выбор q Навратиловой с помощью логики наилучших ответов. На рис. 7.9 показаны ожидаемые выигрыши Эверт (проценты успеха) в случае выбора каждой из чистых стратегий — ПЛ, ПД и СВ, тогда как значение q в q-комбинации Навратиловой меняется в интервале от 0 до 1. На данном рисунке изображены графики формул расчета выигрышей, представленных в правом столбце таблицы на рис. 7.8. По каждому значению q при выборе Навратиловой данной q-комбинации в равновесии наилучшим ответом Эверт был бы выбор стратегии, обеспечивающей ей (Эверт) самый высокий выигрыш. На рис. 7.9 совокупность наилучших исходов для Эверт выделена более жирной линией, называемой на языке математики верхней огибающей трех линий выигрышей. Навратилова стремится выбрать свое наилучшее значение q, которое бы позволило ей получить как можно более высокий выигрыш (тем самым понизив выигрыш Эверт, насколько возможно) из этой совокупности наилучших ответов Эверт.

Страницы: «« 345678910 ... »»

Читать бесплатно другие книги:

В данный том вошли лучшие романы Грандмастера НФ Роберта Хайнлайна 50-х годов XX века.«Звездный деса...
Страшные драконы, несущие разрушения, остались в далеком прошлом? Так думали маги, до того как в гор...
Книга о стратегическом менеджменте. Обо всем, что вам действительно нужно знать, чтобы выжить в усло...
2084 – год действия нового романа Алекса Белла, автора «Мирового правительства».Красочный, полный уд...
В книгу вошли краткие обзорные статьи с отрывками из литературных, исторических, философских памятни...
Как известно, человека, пережившего удар молнии, она одаривает, вскрывая доселе скрытые возможности....