Стратегические игры. Доступный учебник по теории игр Диксит Авинаш
e) Составьте таблицу этой игры с одновременными ходами. Есть ли в ней равновесие Нэша в чистых стратегиях? Если да, назовите его.
S8. Игру «уличный сад», проанализированную в разделе 4 данной главы, можно отобразить в виде таблицы игры 16 на 4 на 2, если версия игры с последовательным выполнением ходов представлена в стратегической форме, как на рис. 6.12. В этой таблице много равновесий Нэша.
a) Используйте анализ наилучших ответов, чтобы найти все равновесия Нэша в таблице игры на рис. 6.12.
b) Определите совершенное равновесие подыгры во всей совокупности равновесий Нэша. Другие равновесные исходы игры напоминают совершенное равновесие подыгры (поскольку обеспечивают каждой из трех участниц игры те же выигрыши), однако появляются после различных комбинаций стратегий. Объясните, почему так происходит. Опишите проблемы с достоверностью, возникающие в случае равновесий, не являющихся совершенными равновесиями подыгры.
S9. На рис. 6.1 двухэтапная игра между компаниями CrossTalk и GlobalDialog представлена в виде сочетания таблиц и деревьев. Изобразите всю эту двухэтапную игру в виде одного большого дерева игры. Не забудьте указать, какой игрок в каждом узле принимает решение, и нарисуйте информационные множества между узлами там, где это необходимо.
S10. Вспомните последовательную игру с тремя участниками о размещении магазинов в торговых центрах, описанную в упражнении S9 в главе 3. Ее дерево напоминает дерево игры «уличный сад», показанное на рис. 6.10.
a) Нарисуйте дерево игры с размещением магазинов в торговых центрах. Сколько стратегий есть в распоряжении каждого магазина?
b) Проиллюстрируйте игру в стратегической форме и найдите в ней все равновесия Нэша в чистых стратегиях.
c) Используйте итеративное доминирование для поиска совершенного равновесия подыгры. (Подсказка: перечитайте два последних абзаца раздела 4.)
S11. Согласно правилам игры с размещением магазинов в торговых центрах, проанализированной в упражнении S10, когда все три магазина запрашивают торговую площадь в торговом центре Urban Mall, два самых крупных (и самых престижных) из них получают ее. Кроме того, в исходной версии игры предусматривается, что компании, пытающиеся получить торговую площадь в торговых центрах, ходят последовательно.
a) Допустим, три компании подают запросы на предоставление торговой площади одновременно. Составьте таблицу выигрышей для этой версии игры и найдите все равновесия Нэша. Какие из них, по вашему мнению, скорее всего будут выбраны на практике? Обоснуйте свой вывод.
Теперь предположим, что все три магазина одновременно отправляют запрос в Urban Mall, а два имеющихся помещения распределяются посредством лотереи, что дает каждому магазину равные шансы на получение торговой площади в Urban Mall. При такой схеме вероятность каждого магазина попасть в Urban Mall составляла бы две трети (или 66,67 процента), если бы все три магазина отправили запросы, а вероятность оказаться в одиночестве в Rural Mall — одну треть (33,33 процента).
b) Постройте таблицу новой версии одновременной игры с размещением магазинов в торговых центрах. Найдите в ней все равновесия Нэша. Какие из них, по вашему мнению, будут выбраны на практике с наибольшей вероятностью? Обоснуйте свой вывод.
c) Сравните и проведите различие между равновесиями, найденными в пункте b и а. Вы получили одни и те же равновесия Нэша? Почему да или почему нет?
S12. Вернитесь к игре между Моникой и Нэнси из упражнения S10 в главе 5. Допустим, они выбирают количество усилий последовательно, а не одновременно. Моника делает выбор первой, а Нэнси, узнав об этом, также делает выбор.
a) Найдите совершенное равновесие подыгры, при котором общая прибыль определяется по формуле 4m + 4n + mn, затраты Моники и Нэнси, связанные с вложением усилий, составляют m2 и n2 соответственно, и Моника принимает решение о количестве усилий первой.
b) Сравните выигрыши Моники и Нэнси с выигрышами, вычисленными в упражнении S10 в главе 5. В этой игре присутствует преимущество первого или второго хода? Обоснуйте свой ответ.
S13. В расширенном варианте упражнения S12 Монике и Нэнси необходимо решить, кто из них выберет количество усилий в первую очередь. Для этого каждая из них пишет на листке бумаги, будет ли она делать это первой. Если обе напишут «да» или «нет», значит, им предстоит выбирать количество усилий одновременно, как в упражнении S10 в главе 5. Если Моника напишет «да», а Нэнси «нет», то Моника будет первой принимать решение о количестве усилий, как в упражнении S12. Если Моника напишет «нет», а Нэнси «да», тогда Нэнси первой примет решение.
a) На основании выигрышей Моники и Нэнси, полученных в упражнении S12 выше, а также в упражнении S10 в главе 5, постройте таблицу для первого этапа игры в принятие решений. (Подсказка: обратите внимание на симметричность игры.)
b) Найдите равновесия Нэша в чистых стратегиях на первом этапе игры.
Упражнения без решений
U1. Рассмотрим игру с участием двух игроков, А и Б. Игрок А ходит первым и выбирает либо «вверх», либо «вниз». Если игрок А выберет «вверх», игра завершится и каждый получит выигрыш 2. Если игрок А сыграет «вниз», наступит очередь игрока Б делать ход, выбрав один из двух вариантов — «налево» или «направо». Если Б выберет «налево», оба игрока получат выигрыш 0, если «направо», игрок А получит выигрыш 3, а игрок Б — выигрыш 1.
a) Нарисуйте дерево этой игры и найдите совершенное равновесие подыгры.
b) Представьте эту игру с последовательными ходами в стратегической форме и отыщите все равновесия Нэша. Какое из них будет совершенным равновесием подыгры? Если таковых нет, объясните почему.
c) Какой метод решения можно было бы использовать для поиска совершенного равновесия подыгры на основании стратегической формы игры? (Подсказка: перечитайте два последних абзаца раздела 4.)
U2. Вернитесь к дереву игры с двумя участниками в пункте а упражнения U2 в главе 3.
a) Опишите игру в стратегической форме, где Альбусу соответствуют строки, а Минерве — столбцы. Найдите все равновесия Нэша.
b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а данного упражнения, которые не будут совершенными равновесиями подыгры.
U3. Вернитесь к дереву игры с двумя участниками в пункте b упражнения U2 в главе 3.
a) Опишите игру в стратегической форме. Найдите все равновесия Нэша.
b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а данного упражнения, которые не будут совершенными равновесиями подыгры.
U4. Вернитесь к дереву игры с двумя участниками в пункте а упражнения U2 в главе 3.
a) Составьте таблицу этой игры, в которой Альбусу соответствуют строки, Минерве — столбцы, а Северусу — страницы. Найдите все равновесия Нэша.
b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а, которые не будут совершенными равновесиями подыгры.
U5. Рассмотрим отрасль по производству колы, в которой Coke и Pepsi — две ведущие компании (для простоты анализа просто забудем об остальных). Объем рынка составляет 8 миллиардов долларов. Каждая компания решает, рекламировать ли ей свою продукцию; если да, то реклама обойдется в 1 миллиард долларов. Если одна компания будет размещать рекламу, а другая нет, то первая компания захватит весь рынок. Если обе компании будут рекламировать свою продукцию, они разделят рынок поровну и понесут расходы на рекламу. Если обе компании не будут размещать рекламу, они разделят рынок поровну без расходов на рекламу.
a) Составьте таблицу выигрышей для этой игры и найдите равновесие в случае, если обе компании ходят одновременно.
b) Постройте дерево игры исходя их предположения, что ходы в ней выполняются последовательно: первой ходит Coke, а затем Pepsi.
c) Будет ли любое из равновесий, найденных в пунктах а и b, более выгодным по сравнению с общей перспективой для Coke и Pepsi? Как обе компании могли бы добиться большего?
U6. На участке вдоль пляжа отдыхают 500 детей, разделенных на пять кластеров, по 100 детей в каждом. (Обозначим их А, Б, В, Г, Д.) Два торговца мороженым одновременно решают, где разместить свои торговые точки по его продаже. Они должны выбрать точное местоположение одного из кластеров.
Если в одном кластере есть один торговец, мороженое купят все 100 детей, входящие в состав этого кластера. Для кластеров без торговца мороженым 50 из 100 детей захотят пойти к торговой точке, находящейся на расстоянии в один кластер, 20 детей захотят пойти к точке, расположенной на расстоянии в два кластера, и никто не пожелает преодолевать ради мороженого расстояние в три и более кластеров. Мороженое быстро тает, поэтому дети, которые все же отправятся за ним, не смогут купить его и для тех, кто остался на месте.
Если оба торговца мороженым выберут один и тот же кластер, каждый получит 50 процентов доли от общего спроса на мороженое. Если они предпочтут разные кластеры, то те дети (остающиеся на месте или ушедшие за мороженым), к которым один торговец находится ближе, чем к другим, отправятся к нему, а дети, находящиеся на равном расстоянии от двух торговцев, разделятся между ними поровну. Каждый торговец стремится максимально увеличить объем продаж.
a) Составьте таблицу выигрышей пять на пять для игры в местоположение торговцев мороженым; приведенные ниже исходные данные помогут вам начать и проверить правильность своих расчетов:
• если оба торговца решают разместить свои торговые точки в кластере А, каждый из них продаст 85 единиц продукции;
• если первый торговец выберет кластер Б, а второй кластер В, первый продаст 150, а второй 170 единиц продукции;
• если первый торговец выберет кластер Д, а второй кластер Б, первый продаст 150, а второй 200 единиц продукции.
b) Исключите как можно больше доминируемых стратегий.
c) В оставшихся ячейках таблицы найдите все равновесия Нэша в чистых стратегиях.
d) Если преобразовать эту игру в игру с последовательными ходами, в которой первый торговец выбирает место первым, а второй вторым, то каким будет местоположение торговых точек и какой объем продаж будет получен в результате совершенного равновесия подыгры? Как изменение времени выполнения ходов помогает участникам игры решить проблему координации, о которой идет речь в пункте с?
U7. Вернитесь к игре между тремя львами в римском Колизее, представленной в упражнении S8 в главе 3.
a) Опишите ее в стратегической форме, где льву 1 соответствуют строки, льву 2 столбцы, а льву 3 страницы.
b) Найдите равновесия Нэша в этой игре. Сколько их вы нашли?
c) Вы должны были обнаружить равновесия Нэша, которые не будут совершенными равновесиями подыгры. Какой лев представляет недостоверные угрозы в случае каждого из этих равновесий? Объясните свою точку зрения.
U8. Предположим, что в игре с размещением магазинов в торговых центрах (из упражнения S9 главы 3 и упражнения S10 в данной главе) ходы выполняются последовательно, но в другом порядке: Big Giant, затем Titan, а затем Frieda’s.
a) Нарисуйте новое дерево игры.
b) Найдите совершенное равновесие подыгры этой игры. Чем оно отличается от совершенного равновесия подыгры, полученного в упражнении S9 в главе 3?
c) Опишите новую версию игры в стратегической форме.
d) Найдите все равновесия Нэша в этой игре. Сколько их? Как это соотносится с количеством равновесий, найденных в упражнении S10 в данной главе?
U9. Вернитесь к игре между Моникой и Нэнси из упражнения U10 в главе 5. Допустим, они выбирают количество усилий последовательно, а не одновременно. Моника делает это первой, а Нэнси, узнав об этом решении, также выбирает количество усилий.
a) Найдите совершенное равновесие подыгры, при котором общая прибыль определяется по формуле 5m + 4n + mn, затраты Моники и Нэнси, связанные с вложением усилий, составляют m2 и n2 соответственно и Моника принимает решение о количестве усилий первой.
b) Сравните выигрыши Моники и Нэнси с выигрышами, вычисленными в упражнении S10 в главе 5. В этой игре есть преимущество первого или второго хода?
c) Воспользовавшись той же функцией общей прибыли, что и в пункте а, найдите совершенное равновесие подыгры для игры, в которой Нэнси первой принимает решение о количестве усилий.
U10. В расширенном варианте упражнения U9 Монике и Нэнси необходимо решить, кто из них выберет количество усилий в первую очередь. Для этого каждая пишет на листке бумаги, будет ли она принимать решение первой. Если обе напишут «да» или «нет», им предстоит выбирать количество усилий одновременно, как в упражнении U10 в главе 5. Если Моника напишет «да», а Нэнси «нет», то они сыграют в игру, представленную в пункте а упражнения U9. Если Моника напишет «нет», а Нэнси «да», то они сыграют в игру из пункта c.
a) На основании выигрышей Моники и Нэнси, полученных в упражнении U9 выше, а также в упражнении U10 в главе 5, составьте таблицу для первого этапа игры в принятие решений.
b) Найдите равновесия Нэша в чистых стратегиях на первом этапе игры.
U11. В отдаленном городке Сент-Джеймс две компании, Bilge и Chem, конкурируют на рынке безалкогольных напитков (Coke и Pepsi пока на этом рынке нет). Bilge и Chem продают идентичную продукцию, а так как их продукт — жидкость, у них есть возможность выпускать его в более мелких емкостях. Поскольку на данном рынке представлены только эти две компании, цена товара P (в долларах) определяется по формуле P = (30 — QB — QC), где QB — количество продукции, выпускаемой Bilge, а QC — количество продукции Chem (в обоих случаях оно измеряется в литрах). В настоящее время обе компании рассматривают возможность инвестиций в новое оборудование для разлива напитков в бутылки, которое позволит сократить переменные издержки.
a) Если компания j решит не инвестировать, ее затраты составят Cj = Q2j / 2, где j обозначает либо B (Bilge), либо C (Chem).
b) Если компания j решит инвестировать, ее затраты составят Cj = 20 + Q2j / 6, где j обозначает либо B (Bilge), либо C (Chem). Эта новая функция издержек отображает фиксированную стоимость оборудования (20), а также более низкие переменные издержки.
Две компании принимают решения об инвестициях одновременно, но выигрыш в этой игре в инвестиции будет зависеть от игр в дуополию, которые возникнут впоследствии. Следовательно, игра состоит из двух этапов: сначала принять решение об инвестициях, а затем играть в дуополию.
a) Предположим, обе компании решают инвестировать. Запишите функции их прибыли, выраженные через QB и QC, и найдите с их помощью равновесия Нэша в игре с определением количества. Чему равны количество и прибыль обеих компаний при таком равновесии? Какова рыночная цена?
b) Допустим, обе компании решают не инвестировать. Чему равно количество продукции и прибыль обеих компаний при таком равновесии? Какова рыночная цена?
c) Теперь предположим, что компания Bilge решает инвестировать, а Chem — нет. Чему равно количество продукции и прибыль обеих компаний при таком равновесии? Какова рыночная цена?
d) Составьте таблицу два на два для игры в инвестиции между этими компаниями. В распоряжении каждой из них есть две стратегии: «инвестировать» и «не инвестировать». Выигрыши компаний — их прибыль, вычисленная в пунктах а, b и с. (Подсказка: обратите внимание на симметричность игры.)
e) Есть ли совершенное равновесие подыгры в этой двухэтапной игре в целом?
U12. Два французских аристократа, шевалье Шагрин и маркиз де Ренар, дерутся на дуэли. У каждого пистолет заряжен одной пулей. Находясь на расстоянии 10 шагов, они начинают идти навстречу друг другу, перемещаясь с одинаковой скоростью, по 1 шагу за один раз. После каждого шага один из них может выстрелить. Когда один из дуэлянтов стреляет, вероятность попасть в цель зависит от расстояния. После k шагов она составляет k/5, а значит, повышается с 0,2 после первого шага до 1 (определенность) после 5 шагов, когда соперники находятся напротив друг друга. Если один игрок выстрелит и промахнется, тогда как другому еще предстоит сделать выстрел, оба должны продолжать движение даже несмотря на то, что того, кто уже не может стрелять, ждет неминуемая смерть, — таковы правила кодекса чести аристократии. Каждый игрок получает выигрыш 1, если он сам будет убит, и 1, если будет убит его соперник. Если оба останутся живы или оба будут убиты, каждый получит выигрыш 0.
Это игра с пятью последовательными шагами и одновременными ходами (стрелять или не стрелять) на каждом шаге. Найдите совершенное равновесие подыгры в этой игре.
Подсказка: начните с шага 5, когда дуэлянты стоят прямо напротив друг друга. Составьте таблицу два на два для игры с одновременными ходами на этом этапе и найдите равновесие Нэша. Теперь перейдите к шагу 4, где вероятность попасть в цель составляет 4/5, или 0,8 для каждого игрока. Составьте таблицу два на два для игры с одновременными ходами на этом этапе, правильно указав в соответствующй ячейке, что произойдет в дальнейшем. Например, если один игрок стреляет и промахивается, а другой не стреляет, то другой подождет, пока сможет сделать пятый шаг, и точно попадет в цель. Если ни один из игроков не стреляет, тогда игра перейдет на следующий этап, по которому вы уже нашли равновесие. С помощью всей этой информации определите выигрыши в таблице два на два на шаге 4 и найдите равновесие Нэша на этом этапе. Для поиска равновесных стратегий всей игры проанализируйте оставшиеся шаги в обратном порядке.
U13. Опишите пример конкуренции между компаниями, аналогичный по своей структуре дуэли из упражнения U12.
Глава 7. Игры с одновременными ходами: смешанные стратегии
* * *
В ходе анализа игр с одновременными ходами в главе 4 мы столкнулись с целым классом игр, нерешаемых посредством описанных там методов. Дело в том, что в играх этого класса нет равновесий Нэша в чистых стратегиях, и для того чтобы определить исход таких игр, необходимо расширить концепции стратегии и равновесий. Это можно сделать с помощью рандомизации ходов, которая и будет в центре внимания в данной главе.
Рассмотрим игру в розыгрыш очка в теннисе, описанную в конце главы 4. Это игра с нулевой суммой, в которой интересы двух теннисисток прямо противоположны. Эверт стремится направить обводящий удар в любую сторону — по линии (ПЛ) или по диагонали (ПД), — не прикрытую Навратиловой, тогда как Навратилова старается прикрыть именно ту сторону, в которую Эверт сделает удар. В главе 4 мы отметили, что в такой ситуации Навратилова сможет использовать любой системный выбор Эверт себе на пользу, а значит, во вред Эверт. Со своей стороны, Эверт может использовать любой системный выбор Навратиловой. Для того чтобы этого избежать, каждая теннисистка пытается держать соперницу в неведении с помощью бессистемных или случайных действий.
Однако хаотичность действий не означает выбора каждого типа удара в половине случаев или их чередование. Чередование ударов уже само по себе было бы системным действием, которое можно использовать, поэтому случайная комбинация действий в соотношении 60 на 40 или 75 на 25 (в зависимости от ситуации) может быть лучше, чем 50 на 50. В данной главе мы рассмотрим методы расчета наилучшей комбинации ходов, а также обсудим, как эта теория поможет нам понять фактический ход таких игр.
Наш метод вычисления лучшей комбинации применим также к играм с ненулевой суммой. Однако в них интересы игроков частично совпадают, поэтому когда игрок Б использует системный выбор игрока А с выгодой для себя, это не всегда вредит игроку А. Следовательно, в играх с ненулевой суммой логика действий, согласно которой другого игрока следует держать в неведении, более слабая или вообще отсутствует. Мы поговорим о том, имеют ли равновесия в смешанных стратегиях смысл в таких играх и когда именно это происходит.
Начнем главу с анализа смешивания стратегий в играх два на два, а также с самого прямого метода поиска наилучших ответов и равновесия в смешанных стратегиях. Многие концепции и методы, которые мы сформулируем в разделе 2, сохранят свою актуальность и в более общих играх, а в разделе 6 и разделе 7 их область применения распространится на игры, участники которых могут иметь свыше двух чистых стратегий. В конце мы выскажем ряд общих наблюдений по поводу смешивания стратегий на практике, а также приведем некоторые эмпирические данные о том, присутствует ли такое смешивание стратегий в реальной жизни.
1. Что такое смешанная стратегия
Когда игроки предпочитают действовать бессистемно, они делают случайный выбор из имеющихся чистых стратегий. В игре в розыгрыш очка в теннисе Навратилова и Эверт выбирают одну из двух заданных чистых стратегий, ПЛ или ПД. Мы называем случайную комбинацию этих двух стратегий смешанной стратегией.
Такие смешанные стратегии охватывают целый диапазон непрерывных значений. На одном его конце вариант ПЛ может быть выбран с вероятностью 1 (гарантированно), тогда как вариант ПД не будет выбран никогда (вероятность 0); эта комбинация представляет собой чистую стратегию ПЛ. На другом конце диапазона вариант ПЛ может быть выбран с вероятностью 0, а ПД — с вероятностью 1; данная комбинация представляет собой чистую стратегию ПД. В промежутке между ними находится целое множество возможностей: ПЛ выбирается с вероятностью 75 % (0,75), а ПД — 25 % (0,25); или оба варианта выбираются с вероятностью 50 % (0,5) каждый; или вариант ПЛ выбирается с вероятностью 1/3 (33,33…%), а ПД — 2/3 (66,66…%) и т. д.[89]
Выигрыши, полученные в результате применения смешанной стратегии, определяются как соответствующие значения взвешенного по вероятности среднего выигрышей от чистых стратегий, входящих в состав данной смешанной стратегии. Например, в игре в теннис из раздела 7 главы 4 (против стратегии ПЛ Навратиловой) выигрыш Эверт от стратегии ПЛ равен 50, а от стратегии ПД 90. Следовательно, ее выигрыш от смешанной стратегии (0,75 ПЛ, 0,25 ПД) в игре против стратегии ПЛ Навратиловой составит 0,75 50 + 0,25 90 = 37,5 + 22,5 = 60. Это и есть ожидаемый выигрыш Эверт от данной смешанной стратегии[90].
Вероятность выбора той или иной чистой стратегии — это непрерывная переменная с диапазоном значений от 0 до 1. Стало быть, смешанные стратегии — просто особый тип непрерывно меняющихся стратегий наподобие тех, которые мы изучали в главе 5. Каждая чистая стратегия — это предельный частный случай, в котором вероятность ее выбора равна 1.
Понятие равновесия Нэша также можно расширить, включив в него смешанные стратегии. Равновесие Нэша определяется как совокупность стратегий (по одной на каждого игрока), при которой выбор каждого игрока для него наилучший с точки зрения обеспечения его максимального ожидаемого выигрыша с учетом смешанных стратегий других игроков. Допустимость использования в игре смешанных стратегий автоматически и практически полностью решает проблему возможного отсутствия равновесия Нэша, с которой мы столкнулись в случае чистых стратегий. Знаменитая теорема Нэша показывает, что при самых общих условиях (достаточно широких, чтобы охватывать все игры, рассматриваемые в данной книге, и многие другие) равновесие Нэша в смешанных стратегиях существует всегда.
Таким образом, на самом обобщенном уровне включение смешанных стратегий в наш анализ не подразумевает ничего выходящего за пределы общей теории непрерывных стратегий, сформулированной в главе 5. Тем не менее частный случай смешанных стратегий действительно поднимает ряд особых концептуальных и методологических вопросов, поэтому заслуживает специального изучения.
2. Смешивание ходов
Начнем с примера игры в теннис из раздела 7 главы 4, в которой не было равновесия Нэша в чистых стратегиях, и покажем, как расширение этой концепции на смешанные стратегии позволяет устранить данный недостаток, а также объясним полученное в итоге равновесие как равновесие, при котором каждый игрок держит соперника в неведении.
На рис. 7.1 воспроизведена матрица выигрышей, представленная на рис. 4.14. В этой игре, если Эверт будет всегда выбирать удар по линии (ПЛ), Навратилова будет прикрывать ПЛ и удерживать выигрыш Эверт на уровне 50. Точно так же, если Эверт будет всегда выбирать удар по диагонали (ПД), Навратилова будет удерживать выигрыш Эверт на уровне 20. Если Эверт может выбирать только одну из двух базовых (чистых) стратегий, а Навратилова — спрогнозировать е выбор, то более подходящая (или менее неподходящая) стратегия Эверт — ПЛ, обеспечивающая ей выигрыш 50.
Рис. 7.1. Отсутствие равновесия в чистых стратегиях
Но допустим, Эверт не ограничена выбором только чистых стратегий и может применить смешанную стратегию, возможно, именно ту, в соответствии с которой вероятность того, что она выберет ПЛ в каком бы то ни было случае, составляет 75 %, или 0,75, что означает, что вероятность того, что она выберет ПД, равна 25 %, или 0,25. С помощью метода, представленного в разделе 1, можно рассчитать ожидаемый выигрыш Навратиловой при выборе Эверт такой комбинации стратегий. Он составляет:
0,75 50 + 0,25 10 = 37,5 + 2,5 = 40, если она прикроет ПЛ,
0,75 20 + 0,25 80 = 15 + 20 = 35, если она прикроет ПД.
Если Эверт выберет комбинацию стратегий 75 на 25, ожидаемые выигрыши показывают, что Навратилова может использовать эту комбинацию с максимальной выгодой для себя, прикрыв удар ПЛ.
Когда Навратилова выбирает ПЛ, чтобы наилучшим образом использовать комбинацию Эверт 75 на 25, это наносит Эверт ущерб, поскольку перед нами игра с нулевой суммой. Ожидаемые выигрыши Эверт составляют:
0,75 50 + 0,25 90 = 37,5 + 22,5 = 60, если Навратилова прикроет ПЛ,
0,75 80 + 0,25 20 = 60 + 5 = 65, если Навратилова прикроет ПД.
Выбрав ПЛ, Навратилова удержит выигрыш Эверт на уровне 60, а не 65. Но заметьте, что выигрыш Эверт при такой комбинации стратегий все равно лучше выигрыша 50 в случае использования чистой стратегии ПЛ или 20 при выборе чистой стратегии ПД[91].
Комбинация стратегий в соотношении 75 на 25 позволяет Эверт повысить выигрыш по сравнению с выигрышем в чистых стратегиях, однако все же оставляет стратегию Эверт в какой-то степени открытой для того, чтобы Навратилова использовала ее с выгодой для себя. Решив прикрывать удар ПЛ, она может добиться того, что Эверт получит более низкий выигрыш, чем при выборе стратегии ПД. Эверт хотела бы найти комбинацию стратегий, защищенную от использования, то есть такую, при которой у Навратиловой не было бы очевидного варианта чистой стратегии, которую можно было бы применить против данной стратегии Эверт. Комбинация стратегий Эверт, защищенная от использования, должна обладать свойством, обеспечивающим Навратиловой один и тот же ожидаемый выигрыш, какой бы удар она ни прикрывала, ПЛ или ПД: Навратиловой должно быть безразлично, какую из двух имеющихся чистых стратегий выбрать. Мы называем это свойством безразличия соперника, и, как мы увидим ниже в данной главе, это ключ к равновесиям в смешанных стратегиях в ненулевых играх.
Для поиска комбинации стратегий, защищенной от использования соперником, необходимо применить более общий подход к описанию смешанной стратегии Эверт, чтобы алгебраическим путем рассчитать вероятности чистых стратегий, входящих в соответствующую смешанную стратегию. Обозначим вероятность выбора Эверт ПЛ алгебраическим символом p, тогда вероятность выбора ПД будет 1 — p. Для краткости назовем такую совокупность p-комбинацией.
Если Эверт выберет р-комбинацию, ожидаемые выигрыши Навратиловой составят:
50p + 10(1 — p), если она прикроет ПЛ,
20p + 80(1 — p), если она прикроет ПД.
Для стратегии Эверт, чтобы ее р-комбинация была защищена от использования, два выигрыша Навратиловой должны быть равны, то есть 50p + 10(1 — p) = 20p + 80(1 — p), или 30p = 70(1 — p), или 100p = 70, или p = 0,7. Таким образом, в комбинации стратегий Эверт, защищенной от использования, стратегия ПЛ применяется в 70 % случаев, а ПД — в 30 % случаев. При таких вероятностях, заданных смешанной стратегией, Навратилова получит один и тот же ожидаемый выигрыш за счет каждой из своих чистых стратегий, а значит, не сможет использовать ни одну из них с выгодой для себя (или в ущерб Эверт в игре с нулевой суммой). Ожидаемый выигрыш Эверт от смешанной стратегии составит:
50 0,7 + 90 0,3 = 35 + 27 = 62, если Навратилова прикроет ПЛ,
80 0,7 + 20 0,3 = 56 + 6 = 62, если Навратилова прикроет ПД.
Этот ожидаемый выигрыш лучше выигрыша 50, который Эверт получила бы при использовании чистой стратегии ПЛ, и выигрыша 60, полученного в случае комбинации 75 на 25. Теперь мы знаем, что эта смешанная стратегия защищена от использования, но является ли она оптимальной или равновесной стратегией Эверт?
Для того чтобы найти равновесную комбинацию стратегий в этой игре, вернемся к методу анализа наилучших ответов, описанному в главе 4, и расширим его на игры с непрерывными стратегиями наподобие тех, которые представлены в главе 5. Наша первоочередная задача — определить наилучший ответ Эверт (ее наилучший выбор вероятности p) на каждую из возможных стратегий Навратиловой. Поскольку эти стратегии также могут быть смешанными, их можно описать посредством вероятности того, что она прикроет ПЛ. Обозначим эту вероятность как q; тогда 1 — q — вероятность того, что Навратилова прикроет ПД. Назовем смешанную стратегию Навратиловой «q-комбинация» и попытаемся найти наилучший ответ Эверт p в случае выбора Навратиловой каждого возможного значения q.
Из таблицы выигрышей на рис. 7.1 следует, что р-комбинация Эверт обеспечивает ей такой ожидаемый выигрыш:
50p + 90(1 — p), если Навратилова выберет ПЛ,
80p + 20(1 — p), если Навратилова выберет ПД.
Стало быть, в случае q-комбинации Навратиловой ожидаемый выигрыш Эверт составит:
[50p + 90(1 — p)]q + [80p + 20(1 — p)](1 — q).
Перегруппировав члены выражения, получаем следующую формулу вычисления ожидаемого выигрыша Эверт:
[50q + 80(1 — q)]p + [90q + 20(1 — q)] (1 — p) = [90q + 20(1 — q)] + [50q + 80(1 — q) — 90q — 20(1 — q)]p = [20 + 70q] + [60 — 100q]p.
Используем этот ожидаемый выигрыш для поиска значений наилучших ответов p Эверт.
Мы пытаемся определить значение p, максимизирующее выигрыш Эверт при каждом значении q, поэтому основной вопрос состоит в том, как формула расчета ожидаемого выигрыша зависит от p. Здесь важную роль играет коэффициент перед p: [60 –100 q]. В частности, имеет значение положительный он (тогда ожидаемый выигрыш Эверт увеличивается по мере увеличения p) или отрицательный (тогда ожидаемый выигрыш Эверт уменьшается по мере увеличения p). Очевидно, что знак этого коэффициента зависит от значения q, причем q имеет критическое значение в случае, когда 60 — 100q = 0; то есть q равно 0,6.
Когда при q < 0,6 Навратиловой коэффициент [60 — 100q] имеет положительное значение, ожидаемый выигрыш Эверт увеличивается по мере повышения значения p и ее наилучший выбор p = 1, или чистая стратегия ПЛ. Аналогичным образом при q > 0,6 Навратиловой наилучший выбор Эверт — p = 0, или чистая стратегия ПД. Если q = 0,6, Эверт получит один и тот же ожидаемый выигрыш независимо от значения p; при этом любая комбинация стратегий ПЛ и ПД так же эффективна, как и любая другая: любое значение p в диапазоне от 0 до 1 может быть наилучшимответом. Кратко сформулируем эти выводы, для того чтобы использовать их в будущем.
Если q < 0,6, наилучший ответ p = 1 (чистая стратегия ПЛ).
Если q = 0,6, любая p-комбинация будет наилучшим ответом.
Если q > 0,6, наилучший ответ p = 0 (чистая стратегия ПД).
Для быстрого подтверждения этих интуитивных выводов заметим, что при низком значении q (Навратилова с достаточно низкой вероятностью будет прикрывать удар ПЛ) Эверт следует выбрать ПЛ, а при высоком значении q (Навратилова с достаточно высокой вероятностью будет прикрывать удар ПЛ) — ПД. Точное значение этой «достаточности», а значит, и точка перехода на другую стратегию q = 0,6 зависят от конкретных выигрышей в данном примере[92].
Мы уже говорили о том, что смешанные стратегии — это просто особый тип непрерывной стратегии, в которой вероятность играет роль непрерывной переменной. Теперь мы нашли наилучшее значение p Эверт, соответствующее каждому значению q, выбранному Навратиловой. Иными словами, определили правило наилучших ответов Эверт, которое можно отобразить на графике так же, как мы это делали в главе 5.
Этот график расположен в левом фрагменте рисунка 7.2, где значения q показаны на горизонтальной оси, а значения p — на вертикальной. Обе вероятности ограничены диапазоном от 0 до 1. Если q меньше 0,6, p имеет максимальное значение 1; если q больше 0,6, p имеет минимальное значение 0. При q = 0,6 все значения p от 0 до 1 в равной степени наилучшие для Эверт, поэтому наилучший ответ — вертикальная линия, находящаяся между 0 и 1. Этому графику наилучших ответов присуща своя особенность: в отличие от непрерывно восходящих или нисходящих прямых или кривых линий в главе 5, данный график плоский в двух интервалах значений q и опускается за один шаг в точке сопряжения этих интервалов. Тем не менее в концептуальном смысле он ничем не отличается от любого другого графика наилучших ответов.
Рис. 7.2. Наилучшие ответы и равновесие в игре в теннис
Аналогичным образом можно вычислить правило наилучших ответов Навратиловой (ее наилучшую q-комбинацию, соответствующую каждой из p-комбинаций Эверт). Мы предлагаем вам сделать это самостоятельно, чтобы закрепить понимание самой концепции и алгебраических вычислений. Кроме того, вы должны проверить правильность интуитивных выводов в отношении выбора Навратиловой так, как мы это делали для Эверт. Мы же просто приведем здесь полученный результат.
Если p < 0,7, наилучший ответ q = 0 (чистая стратегия ПД).
Если p = 0,7, любая q-комбинация будет наилучшим ответом.
Если p > 0,7, наилучший ответ q = 1 (чистая стратегия ПЛ).
График этого правила наилучших ответов Навратиловой расположен в среднем фрагменте рис. 7.2.
В правом фрагменте рис. 7.2 объединены графики из двух соседних фрагментов, причем левый график отражен по диагонали (линия p = q) с тем, чтобы значения p оказались на горизонтальной оси, а значения q — на вертикальной, после чего совмещен со средним графиком. Теперь серые и черные линии пересекаются в одной точке, где p = 0,7, а q = 0,6. В этой точке выбор смешанной стратегии каждым игроком будет наилучшим ответом на выбор другого игрока, поэтому данная пара образует равновесие Нэша в смешанных стратегиях.
В таком представлении правил наилучших ответов чистые стратегии — особые случаи, соответствующие предельным значениям переменных p и q. Как видим, графики наилучших ответов не имеют общих точек на любой из сторон квадрата, где каждое значение p и q равно либо 0, либо 1. Это говорит об отсутствии в игре равновесий в чистых стратегиях, как и было показано в разделе 7 главы 4. В этом примере равновесие в смешанных стратегиях — единственное равновесие Нэша в данной игре.
С помощью метода, примененного нами в разделе 2.А для поиска защищенного от использования значения p для Эверт, вы также можете вычислить выбор Навратиловой значения q, защищенного от использования. Выполнив соответствующие расчеты, получите значение q = 0,6. Таким образом, две выбранные участницами игры смешанные стратегии, защищенные от использования, на самом деле и наилучшие ответы друг на друга, которые представляют собой смешанные стратегии двух игроков, образующие равновесие Нэша.
В действительности, чтобы найти равновесие в смешанных стратегиях в игре с нулевой суммой, каждый участник которой располагает двумя чистыми стратегиями, не нужно проходить весь процесс определения правил наилучших ответов, построения соответствующих графиков и поиска точки их пересечения. Вы можете просто записать уравнения защищенности от использования из раздела 2.А по комбинации каждого игрока, а затем решить их. Если в полученном решении обе вероятности попадают в диапазон от 0 до 1, вы нашли то, что нужно. Если одна из вероятностей имеет отрицательное значение или значение больше 1, значит, в данной игре нет равновесия в смешанных стратегиях и вам необходимо снова поискать его в чистых стратегиях. В разделе 6 и разделе 7 представлен анализ методов решения игр, участники которых имеют более двух чистых стратегий.
3. Равновесие Нэша как система убеждений и ответов
При одновременном выполнении ходов ни один из игроков не может отреагировать на фактический выбор другого игрока. Вместо этого каждый участник игры предпринимает свое наилучшее действие, исходя из представлений о том, какой именно ход выбирает в данный момент соперник. В главе 4 мы назвали такие представления убеждениями игрока относительно выбора стратегии другим игроком, затем интерпретировали равновесие Нэша как конфигурацию стратегий, при которой эти убеждения верны, а значит, каждый игрок выбирает свой наилучший ответ на фактические действия другого игрока. Эта концепция оказалась весьма полезной для понимания структуры и исхода многих важных типов игр, особенно таких, как дилемма заключенных, координационные игры и игра в труса.
Однако в главе 4 мы рассматривали исключительно равновесия Нэша в чистых стратегиях. По этой причине осталось почти незамеченным одно скрытое предположение: каждый игрок твердо убежден, что другой игрок выберет определенную чистую стратегию. Теперь, когда мы анализируем более общие смешанные стратегии, концепция убеждения требует новой интерпретации.
Порой игроки не уверены в предполагаемых действиях других участников игры. Так, в координационной игре из главы 4, в которой Гарри хочет встретиться с Салли, Гарри не уверен в том, куда отправится Салли — в Starbucks или Local Latte, и его убеждение может сводиться к тому, что она окажется в любом из этих кафе с вероятностью 50 на 50. А в примере с игрой в теннис Эверт могла осознавать, что Навратилова пытается держать ее в неведении, а значит, она (Эверт) не может быть уверена в том, какое из доступных действий выберет Навратилова. В разделе 4 главы 2 мы обозначили такую ситуацию термином «стратегическая неопределенность», а в главе 4 указали, что такая неопределенность приводит к формированию равновесий в смешанных стратегиях. Теперь же рассмотрим эту идею более подробно.
Однако важно различать неуверенность и неправильные убеждения. Скажем, в примере с игрой в теннис Навратилова не может быть уверена в том, что выберет Эверт в каждом конкретном случае. Тем не менее у нее могут быть правильные убеждения относительно комбинации стратегий Эверт, а именно вероятности, с которой она выбирает между своими двумя чистыми стратегиями. Наличие правильных убеждений по поводу смешанных действий означает знание, или вычисление, или догадки в отношении правильных вероятностей, с которыми другой игрок делает выбор между своими базовыми или чистыми стратегиями. Что касается равновесия в нашем примере, оказалось, что равновесная комбинация стратегий Эверт составила 70 % для ПЛ и 30 % для ПД. Если Навратилова убеждена в том, что Эверт выберет ПЛ с вероятностью 70 % и ПД с вероятностью 30 %, то ее убеждения в данном равновесии будут правильными, хотя и неопределенными.
Таким образом, у нас есть альтернативный и математически эквивалентный способ определения равновесия Нэша в категориях убеждений: каждый игрок формирует убеждения о вероятностях в той комбинации стратегий, которую применяет другой игрок, и выбирает на нее собственный наилучший ответ. Равновесие Нэша в смешанных стратегиях наблюдается в случае правильности этих убеждений в указанном нами смысле.
В следующем разделе мы рассмотрим смешанные стратегии и соответствующие равновесия Нэша в играх с ненулевой суммой. В таких играх нет общих оснований для того, чтобы стремление другого игрока удовлетворить собственные интересы противоречило вашим интересам. Следовательно, в таких играх вам далеко не всегда нужно скрывать свои намерения от другого игрока, а также нет причин держать его в неведении. Тем не менее из-за одновременного выполнения ходов каждый игрок может испытывать субъективную неуверенность относительно действий другого игрока, поэтому у него могут быть неопределенные убеждения, вынуждающие его сомневаться в целесообразности собственных действий. Все это может привести к формированию равновесий в смешанных стратегиях, а их интерпретация в категориях субъективно неопределенных, но правильных убеждений играет особенно важную роль.
4. Смешивание стратегий в играх с ненулевой суммой
Методы поиска равновесий в смешанных стратегиях в играх с нулевой суммой (такие как защищенность от использования соперником или свойство безразличия соперника) применимы и к играм с ненулевой суммой, причем в некоторых из них действительно позволяют найти равновесия в смешанных стратегиях. Однако в таких играх интересы игроков могут в определенной степени совпадать. Следовательно, тот факт, что другой игрок использует ваш системный выбор стратегий с выгодой для себя, необязательно означает, что это нанесет ущерб вам, как в случае игр с нулевой суммой. Например, в координационной игре, которую мы анализировали в главе 4, игроки способны лучше координировать свои действия, если каждый из них может полагаться на системные действия другого, поскольку случайный выбор действий только повышает риск неудачи с их координацией. Именно поэтому в играх с ненулевой суммой равновесия в смешанных стратегиях имеют слабое логическое обоснование или не имеют его вообще. Ниже мы проанализируем равновесия в смешанных стратегиях в контексте некоторых известных игр с ненулевой суммой, а также обсудим их значимость или отсутствие таковой.
Проиллюстрируем смешивание стратегий в играх с ненулевой суммой на примере игры «встреча», основанной на игре в доверие. Для вашего удобства мы воспроизводим таблицу этой игры (см. рис. 4.11) на рис. 7.3. Сначала проанализируем игру с точки зрения Салли. Если она уверена в том, что Гарри отправится в Starbucks, ей тоже следует туда пойти. Если она уверена, что Гарри выберет Local Latte, то же самое нужно сделать и ей. Но если Салли сомневается в выборе Гарри, то каким должен быть ее наилучший выбор?
Рис. 7.3. Игра в доверие
Чтобы ответить на этот вопрос, мы должны дать более четкую трактовку неопределенности в понимании Салли. (В теории вероятностей и статистике есть специальный термин для обозначения такой неопределенности — субъективная неопределенность. В контексте неопределенности относительно действий другого игрока это стратегическая неопределенность; вспомните о различиях, которые мы анализировали в разделе 2.Г главы 2). Для большей точности укажем, с какой вероятностью Гарри выберет то или иное кафе, по мнению Салли. Вероятность того, что это будет Local Latte, может быть выражена любым вещественным числом от 0 до 1 (то есть от 0 % до 100 %). Мы охватим все возможные варианты с помощью алгебраических формул, обозначив символом p вероятность того, что Гарри (по мнению Салли) выберет Starbucks; переменная p может иметь любое вещественное значение в диапазоне от 0 до 1. Тогда (1 — p) — это вероятность (снова по мнению Салли) того, что Гарри предпочтет Local Latte. Иными словами, мы описываем стратегическую неопределенность Салли следующим образом: она считает, что Гарри использует смешанную стратегию, применив совокупность двух чистых стратегий (Starbucks и Local Latte) в пропорциях или с вероятностью p и (1 — p) соответственно. Назовем эту смешанную стратегию p-комбинацией Гарри, хотя на данный момент это всего лишь идея, существующая в сознании Салли.
С учетом этой неопределенности Салли может вычислить ожидаемые выигрыши от своих действий, предпринятых на основании убежденности в отношении р-комбинации Гарри. Если Салли выберет Starbucks, это даст ей 1 p + 0 (1 — p) = p, если Local Latte, это даст 0 p + 2 (1 — p) = 2 (1 — p). Когда p имеет высокое значение, p > 2(1 — p), то есть Салли достаточно уверена в том, что Гарри отправится в Starbucks, ей лучше пойти туда же. Точно так же, когда p имеет низкое значение, p < 2(1 — p), а значит, Салли достаточно уверена в том, что Гарри отправится в Local Latte, ей тоже нужно пойти в это кафе. При p = 2(1 — p), или 3p = 2, или p = 2/3 эти два варианта выбора обеспечивают Салли один и тот же выигрыш. Следовательно, если она убеждена в том, что p = 2/3, она может быть не уверена в собственном выборе и колебаться между этими двумя вариантами.
Понимание этого факта может вызвать у Гарри неуверенность в выборе Салли. Следовательно, Гарри также испытывает субъективную стратегическую неопределенность. Предположим, он считает, что Салли выберет Starbucks с вероятностью q, а Local Latte с вероятностью (1 — q). Аналогичные рассуждения показывают, что Гарри следует выбрать Starbucks, если q > 2/3, и Local Latte, если q < 2/3. В случае если q = 2/3, ему будет безразлично, какое из этих двух действий предпринять, и у него возникнет неуверенность в собственном выборе.
Теперь у нас есть основа для равновесия в смешанных стратегиях с p = 2/3 и q = 2/3. При таком равновесии данные значения p и q одновременно являются и фактическими вероятностями чистых стратегий, входящих в соответствующую смешанную стратегию, и субъективными убеждениями каждого игрока относительно вероятностей чистых стратегий в смешанной стратегии другого игрока. Правильность этих убеждений поддерживает собственное безразличие каждого игрока в отношении выбора между двумя чистыми стратегиями, а значит, и готовность каждого смешать их. Это полностью соответствует концепции равновесия Нэша как системы самоисполняющихся убеждений и ответных действий, описанной в разделе 3.
Ключ к поиску равновесия в смешанных стратегиях состоит в том, что Салли готова смешать две чистые стратегии только тогда, когда ее субъективная неопределенность в отношении выбора Гарри правильна, то есть если правильно значение р в р-комбинации Гарри. Алгебраичски это утверждение можно обосновать посредством вычисления равновесного значения р с помощью уравнения р = 2(1 — р), которое гарантирует, что Салли получит такой же ожидаемый выигрыш от двух своих чистых стратегий при сопоставлении каждой из них с р-комбинацией Гарри. Если данное равенство справедливо в случае равновесия, вероятности чистых стратегий в смешанной стратегии Гарри как будто поддерживают безразличие Салли. Мы особо подчеркиваем сочетание «как будто», поскольку в этой игре у Гарри нет причин поддерживать безразличие Салли, поэтому полученный результат — просто свойство данного равновесия. Тем не менее общая идея такова: в равновесии Нэша в смешанных стратегиях вероятности чистых стратегий, входящих в смешанную стратегию каждого игрока, поддерживают безразличие другого игрока в отношении выбора между его чистыми стратегиями. Мы вывели свойство безразличия соперника выше в ходе обсуждения игр с нулевой суммой, а теперь видим, что оно актуально и для игр с ненулевой суммой.
Однако в игре в доверие равновесие в смешанных стратегиях имеет ряд весьма нежелательных свойств. Во-первых, оно обеспечивает обоим игрокам достаточно низкие ожидаемые выигрыши. Формулы расчета ожидаемых выигрышей Салли от двух ее действий, р и 2 (1 — р), в обоих случаях равны 2/3 при р = 2/3. Точно так же ожидаемые выигрыши Гарри в случае равновесной q-комбинации Салли при q = 2/3 также одинаковы и составляют 2/3. Следовательно, при равновесии в смешанных стратегиях каждый игрок получает выигрыш 2/3. В главе 4 мы нашли в этой игре два равновесия в чистых стратегиях, причем даже худшее из них (оба выбирают Starbucks) обеспечивает каждому игроку выигрыш 1, а лучшее (оба выбирают Local Latte) — выигрыш 2.
Причина, по которой в случае равновесия в смешанных стратегиях два игрока получают такие плохие результаты, состоит в следующем: при выборе игроками своих действий независимо и бессистемно достаточно высока вероятность того, что они отправятся в разные места и в результате не встретятся и оба получат выигрыш 0. Гарри и Салли не увидятся, если один из них пойдет в Starbucks, а другой в Local Latte или наоборот. Вероятность такого развития событий при использовании обоими равновесных комбинаций составляет 2 (2/3) (1/3) = 4/9[93]. Аналогичная проблема наблюдается в равновесиях в смешанных стратегиях в большинстве игр с ненулевой суммой.
Второе нежелательное свойство равновесия в смешанных стратегиях — его неустойчивость. Если любой из игроков хотя бы немного отклонится от точных значений р = 2/3 или q = 2/3, наилучшим выбором другого игрока станет одна из чистых стратегий. И как только он ее применит, другой игрок получит более высокий выигрыш при выборе той же чистой стратегии, а значит, в игре наступит одно из двух равновесий в чистых стратегиях. Такая неустойчивость равновесий в смешанных стратегиях присуща многим играм с ненулевой суммой. Тем не менее в некоторых играх с ненулевой суммой все же есть более устойчивые равновесия в смешанных стратегиях. Один из примеров, описанный ниже в данной главе и в главе 12, — это равновесие в смешанных стратегиях в игре в труса, в отношении которой существует интересная эволюционная интерпретация.
С учетом результатов анализа равновесия в смешанных стратегиях в версии игры во встречу, основанной на игре в доверие, вы, по всей вероятности, теперь можете оценить равновесия в смешанных стратегиях в других вариантах игры во встречу с ненулевой суммой. В ее версии, построенной на чистой координации (см. рис. 4.10), выигрыш от встречи в двух кафе один и тот же, а значит, в равновесии в смешанных стратегиях значения p и q будут такими: p = 1/2 и q = 1/2. В варианте этой игры, представляющем собой битву полов (см. рис. 4.12), Салли предпочитает встретиться с Гарри в Local Latte, поскольку так она получит выигрыш 2 вместо 1 в случае встречи в Starbucks. Решение Салли зависит от того, больше или меньше 2/3 ее субъективная вероятность, что Гарри отправится в Starbucks. (В этом случае выигрыши Салли аналогичны выигрышам в версии игры в доверие, поэтому критическое значение p не меняется.) Гарри предпочитает встретиться в Starbucks, поэтому его решение зависит от того, больше или меньше 1/3 его субъективная вероятность, что Салли пойдет в Starbucks. Таким образом, при равновесии Нэша в смешанных стратегиях p = 2/3, а q = 1/3.