Стратегические игры. Доступный учебник по теории игр Диксит Авинаш

Рис. 7.9. Поиск q-комбинации Навратиловой графическим способом

Для более точного определения оптимального выбора q Навратиловой мы должны вычислить координаты точек излома линии, соответствующей ее наихудшему исходу (и наилучшему исходу для Эверт). Значение q в крайней левой точке излома линии означает безразличие Эверт в отношении выбора между ПЛ и СВ. Это значение q должно равняться двум выигрышам от использования стратегий ПЛ и СВ против данной q-комбинации. Приравняв эти два выражения, получим 50q + 80(1 — q) = 70q + 60(1 — q), или q = 20/40 = 1/2 = 50 %. Ожидаемый выигрыш Эверт в этой точке составит 50  0,5 + 80  0,5 = 70  0,5 + 60  0,5 = 65. Во второй (крайней правой) точке излома Эверт безразлично, какую стратегию выбрать, ПД или СВ. Таким образом, значение q в этой точке приравнивает выражения для вычисления выигрышей от стратегий ПД и СВ. Установив равенство 90q + 20(1 — q) = 70q + 60(1 — q), находим значение q = 40/60 = 2/3 = 66,7 %. В этом случае ожидаемый выигрыш Эверт составляет 90  0,667 + 20  0,333 = 70  0,667 + 60  0,333 = 66,67. Следовательно, наилучший (или наименее неблагоприятный) выбор q Навратиловой находится в крайней левой точке излома, то есть q = 0,5. При этом ожидаемый выигрыш Эверт равен 65, а Навратиловой, соответственно, 35.

Когда Навратилова выбирает q = 0,5, Эверт безразлично, какую стратегию применить, ПЛ или СВ, а значит, выбор любой из них обеспечивает ей более высокий выигрыш, чем стратегия ПД. Поэтому Эверт не станет включать стратегию ПД в равновесие, и она станет неиспользуемой в равновесной комбинации стратегий Эверт.

Теперь продолжим анализ равновесия так, как если бы это была игра с двумя чистыми стратегиями у каждой из ее участницы: ПЛ и ПД у Навратиловой и ПЛ и СВ у Эверт. Итак, мы вернулись на знакомую почву, поэтому предоставляем вам возможность выполнить необходимые расчеты самостоятельно и приводим здесь только результат. Оптимальная комбинация стратегий Эверт в данной игре подразумевает выбор стратегии ПЛ с вероятностью 0,25 и стратегии СВ с вероятностью 0,75. Ожидаемый выигрыш Эверт от этой комбинации стратегий, использованных в игре против ПЛ и ПД Навратиловой соответственно, составляет 50  0,25 + 70  0,75 = 80  0,25 + 60  0,75 = 65, как, разумеется, и должно быть.

Мы не могли начать этот анализ с игры два на два, поскольку не знали заранее, какую из трех стратегий Эверт не будет использовать. Однако мы не сомневаемся, что в общем случае обязательно будет одна такая стратегия. Когда три линии ожидаемых выигрышей занимают самые общие положения, они пересекаются попарно, а не все в одной точке. При этом верхняя огибающая имеет форму как на рис. 7.9. Самая нижняя точка огибающей задается пересечением линий выигрышей, соответствующих двум из трех стратегий. Выигрыш от третьей стратегии находится ниже пересечения в этой точке, а значит, игрок, выбрающий между тремя стратегиями, не будет использовать именно третью стратегию.

Б. Особые случаи

Положения и пересечения трех линий на рис. 7.9 зависят от выигрышей, указанных для чистых стратегий. Для данной игры мы выбирали выигрыши, позволяющие проиллюстрировать общую конфигурацию линий. Однако, если выигрыши находятся в весьма своеобразной зависимости друг от друга, мы можем получить особые конфигурации с различными результатами. Мы проанализируем здесь такие варианты, а возможность построить новые графики для этих случаев предоставляем вам.

Во-первых, если выигрыши от стратегии СВ, применяемой Эверт против стратегий ПЛ и ПД Навратиловой, равны, прямая СВ будет горизонтальной; при этом весь диапазон значений q делает комбинацию стратегий Навратиловой защищенной от использования. Например, если каждый из двух выигрышей в строке СВ таблицы на рис. 7.8 равен 70, то нетрудно определить, что левая точка излома на обновленном рис. 7.9 находилась бы в точке, соответствующей значению q = 1/3, а правая точка излома — в точке q = 5/7. При любом значении q в диапазоне от 1/3 до 5/7 наилучший ответ Эверт — СВ, а значит, мы получаем необычное равновесие, в котором Эверт выбирает чистую стратегию, а Навратилова чистые стратегии смешивает. Более того, вероятности чистых стратегий в равновесной смешанной стратегии Навратиловой имеют неопределенное значение в диапазоне от q = 1/3 до q = 5/7.

Во-вторых, если выигрыши Эверт при использовании стратегии СВ против стратегий ПЛ и ПД Навратиловой на определенную величину ниже выигрышей, представленных в таблице на рис. 7.8 (или если выигрыши от оставшихся двух стратегий на определенную величину выше указанных в таблице), все три прямые могут пересекаться в одной точке. Например, если выигрыши Эверт от стратегии СВ против стратегий ПЛ и ПД Навратиловой составляют не 70 и 60, а 66 и 56 соответственно, то при q = 0,6 ожидаемый выигрыш Эверт от стратегии СВ равен 66  0,6 + 56  0,4 = 39,6 + 22,6 = 62, то есть такой же, как и выигрыш от стратегий ПЛ и ПД при q = 0,6. В таком случае Эверт безразлично, какую из трех имеющихся стратегий выбрать при q = 0,6, и она готова смешивать все три.

В этом особом случае вероятности чистых стратегий в равновесной комбинации стратегий Эверт не могут быть полностью определенными. Напротив, целый диапазон комбинаций (в том числе и использующих все три стратегии) может выполнять задачу по поддержанию безразличия Навратиловой в отношении выбора между стратегиями ПЛ и ПД, а значит, и готовности их смешивать. Тем не менее Навратилова должна применить комбинацию со значением q = 0,6. Если она этого не сделает, наилучшим ответом Эверт будет переход к одной из чистых стратегий в ущерб Навратиловой. Мы не станем подробно останавливаться на определении точного диапазона, в котором могут меняться равновесные смешанные стратегии Эверт, поскольку такая ситуация может сложиться лишь при особых комбинациях выигрышей и, стало быть, это не столь важно.

Обратите внимание, что выигрыши Эверт от использования стратегии СВ против стратегий ПЛ и ПД Навратиловой могут быть даже ниже значения, при котором все три прямые пересекаются в одной точке (например, если бы выигрыши от СВ равнялись 75 и 30 вместо 70 и 60, как на рис. 7.8). Тогда стратегия СВ не может быть наилучшим ответом Эверт, хотя она не является ни доминируемой стратегией ПЛ, ни доминируемой стратегией ПД. Случай, когда стратегия СВ доминируема по отношению к комбинации стратегий ПЛ и ПД, рассматривается в онлайн-приложении в данной главе.

7. Смешивание стратегий при наличии трех стратегий у обоих игроков

При рассмотрении игр, в которых у обоих игроков есть по три чистые стратегии с возможностью смешивания всех трех, необходимы две переменные, чтобы задать каждую комбинацию стратегий[100]. В комбинации игрока, данные которого отображаются в строках, его первой чистой стратегии соответствует вероятность p1, а второй — вероятность p2. Тогда вероятность использования третьей чистой стратегии должна составлять 1 минус сумма вероятностей остальных двух стратегий. То же самое касается комбинации игрока, которому соответствуют столбцы. Таким образом, когда каждый игрок имеет по три чистые стратегии, найти равновесие в смешанных стратегиях без выполнения алгебраических операций с двумя переменными нельзя. Тем не менее зачастую такие алгебраические расчеты вполне выполнимы.

А. Полная комбинация всех стратегий

Рассмотрим упрощенное представление пенальти в футболе. Предположим, выполняющий его игрок, бьющий правой ногой, имеет три чистые стратегии: удар влево, вправо или в центр (налево или направо по отношению к вратарю; для игрока-правши было бы логично отправить мяч направо от вратаря), и может смешивать их с вероятностями, обозначенными как pл, pп, pц соответственно. Любые две из этих вероятностей можно принять как независимые переменные, а третью выразить через них. Если pл и pп — независимые переменные, то pц = 1 — pл — pп. Вратарь также располагает тремя чистыми стратегиями, а именно двигаться налево от бьющего игрока (направо от самого вратаря), направо от бьющего игрока (налево от вратаря) или оставаться в центре. Кроме того, вратарь может их смешивать с вероятностями qл, qп, qц, две из которых могут быть выбраны в качестве независимых переменных.

Как и в разделе 6.А, график наилучших ответов для этой игры потребовал бы более двух размерностей. (Точнее говоря, четыре. Вратарь выбрал бы свои две независимые переменные, скажем (qл, qп), как свой наилучший ответ на две независимые переменные игрока, выполняющего пенальти (pл, pп), и наоборот.) Вместо этого мы снова воспользуемся свойством безразличия соперника, чтобы сфокусироваться на вероятностях чистых стратегий в смешанной стратегии по одному игроку за один раз. В случае каждого игрока вероятности должны быть такими, чтобы другому игроку было безразлично, какую стратегию из имеющихся в его комбинации стратегий выбрать. Это дает нам систему уравнений, которая позволит найти вероятности применения чистых стратегий в смешанной стратегии. В примере с футболом переменные (pл, pп) удовлетворяли бы двум уравнениям, выражающим требование о том, что ожидаемый выигрыш вратаря от использования стратегии «налево» должен быть равен ожидаемому выигрышу от применения стратегии «направо», а также что ожидаемый выигрыш вратаря от выбора стратегии «направо» должен равняться ожидаемому выигрышу от выбора стратегии «в центре». (В таком случае равенство ожидаемых выигрышей от применения стратегий «налево» и «в центре» определяется автоматически и не требует отдельного уравнения.) При большем количестве стратегий число вероятностей, подлежащих вычислению, и уравнений, которым они должны удовлетворять, тоже увеличивается.

На рис. 7.10 показана таблица взаимодействия между игроком, выполняющим пенальти, и вратарем, где в качестве выигрышей каждого игрока указаны проценты успешных действий. (В этой таблице для упрощения расчетов приведены не фактические данные европейского футбола, представленные чуть ниже, а аналогичные округленные числа.) Поскольку игрок, бьющий пенальти, хочет максимально увеличить выраженную в процентах вероятность того, что он забьет гол, а вратарь стремится минимизировать вероятность того, что он его пропустит, мы имеем дело с игрой с нулевой суммой. Например, в ситуации, когда бьюий игрок отправит мяч налево от себя, а вратарь сделает движение налево от бьющего игрока (ячейка в верхнем левом углу), мы исходим из предположения, что бьющему игроку все равно удастся забить гол в 45 % случаев, стало быть, вратарь сможет отразить удар в 55 % случаев. Однако если бьющий игрок отправит мяч направо от себя, а вратарь сделает движение налево от него, то у бьющего есть возможность забить гол с вероятностью 90 %; мы исходим из того, что он с вероятностью 10 % может ударить мимо или выше ворот, а значит, вратарь может добиться успеха в 10 % случаев. Вы можете поэкспериментировать с другими, более приемлемыми, на ваш взгляд, значениями выигрышей.

Рис. 7.10. Игра в пенальти в футболе

Легко убедиться, что в этой игре нет равновесия в чистых стратегиях. Поэтому допустимя, что игрок, выполняющий пенальти, смешивает стратегии с вероятностями pл, pп и pц = 1 — pл — pп. По каждой чистой стратегии вратаря эта комбинация обеспечивает ему следующие выигрыши:

«Налево»: 55pл + 15pц + 5pп = 55pл + 15(1 — pл — pп) + 5pп.

«В центр»: 10pл + 100pц + 5pп = 10pл + 100(1 — pл — pп) + 5pп.

«Направо»: 10pл + 15pц + 40pп = 10pл + 15(1 — pл — pп) + 40pп.

Правило безразличия соперника гласит, что бьющий игрок должен выбрать pл и pп, с тем чтобы в равновесии все три выражения были эквивалентны.

Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 45pл = 35pп, или pп = (9/7)pл. Далее приравниваем выражения, соответствующие стратегиям «в центре» и «направо», и упрощаем полученное равенство с помощью только что выведенного соотношения между pп. Это дает 10pл + 100[1 — pл — (9pл / 7)] + 5(9pл / 7) = 10pл + 15[1 — pл — (9pл / 7)] + 40 (9pл / 7), или [85 + 120(9/7)] pл = 85, что дает pл = 0,355. Далее получаем pп = 0,355(9/7) = 0,457 и, наконец, pц = 1–0,355 — 0,457 = 0,188. Затем вычисляем с помощью представленных выше трех строк выигрышей выигрыш вратаря от любой из его трех стратегий против этой комбинации стратегий; результат — 24,6.

Вероятности чистых стратегий в смешанной стратегии вратаря можно определить, записав и решив уравнения безразличия бьющего игрока в отношении его выбора из трех чистых стратегий в игре против комбинации стратегий вратаря. Мы будем это делать в ходе анализа несколько измененного варианта этой игры в разделе 7.Б, поэтому здесь опускаем детали и просто приводим полученный результат: qл = 0,325, qп = 0,561 и qц = 0,113. Выигрыш бьющего игрока от любой из его чистых стратегий в игре против равновесной комбинации стратегий вратаря составляет 75,4. Разумеется, он согласуется с выигрышем вратаря 24,6, который мы вычислили выше.

Теперь можем разъяснить эти выводы. Игрок, выполняющий пенальти, получит более высокий выигрыш от своей чистой стратегии «направо», чем от чистой стратегии «налево», как в случае, если вратарь правильно угадает его ход (60 > 45), так и если он ошибется (95 > 90). (Предположительно игрок будет бить левой, а значит, может сделать более сильный удар направо.) Таким образом, бьющий игрок выберет с самой высокой вероятностью стратегию «направо», и чтобы противостоять этому, вратарь также с высокой вероятностью выберет стратегию «направо»; однако при таком раскладе выигрыш бьющего в итоге составит всего 60, то есть меньше выигрыша 75,4, который он получит при равновесии в смешанных стратегиях.

Б. Равновесные комбинации, в которых используются не все стратегии

В равновесии из предыдущего примера вероятность применения стратегии «в центре» в смешанной стратегии достаточно низкая для каждого игрока. Комбинация «в центр» / «в центре» привела бы к гарантированному отражению пенальти, и бьющий игрок получил бы поистине низкий выигрыш, то есть ноль. В связи с чем данный игрок присваивает этому выбору низкую вероятность. Но тогда вратарь также должен присвоить выбору этой стратегии низкую вероятность, сосредоточившись на противодействии более вероятным стратегиям бьющего игрока. Но если последний получит достаточно высокий выигрыш от выбора стратегии «в центр», когда вратарь применит «налево» или «направо», то он будет выбирать «в центр» с определенной положительной вероятностью. Если бы выигрыши бьющего игрока в строке, соответствующей стратегии «в центр», были ниже, то он мог бы использовать стратегию «в центр» с нулевой вероятностью; тогда вратарь также присвоил бы нулевую вероятность стратегии «в центре». При таком развитии событий данная игра превратилась бы в игру с двумя базовыми чистыми стратегиями, «налево» и «направо», находящимися в распоряжении каждого игрока.

Этот вариант игры в футбол показан на рис. 7.11. Единственное различие между выигрышами в данной и первоначальной версии игры (рис. 7.10) состоит в том, что выигрыши бьющего игрока от комбинации стратегий «в центр» / «слева» и «в центр» / «справа» сократились еще больше, с 85 до 70. Это могло произойти потому, что бьющему игроку свойственно посылать мяч слишком высоко, а значит, он часто промахивается, целясь в центр. Попробуем вычислить равновесие в этой игре, воспользовавшись тем же методом, что и в разделе 7.А. На этот раз сделаем это с позиции вратаря, попытавшись найти вероятности применения чистых стратегий qл, qп и qц в смешанной стратегии с помощью условия безразличия бьющего игрока в отношении выбора между тремя чистыми стратегиями в игре против данной комбинации стратегий.

Рис. 7.11. Вариант игры в пенальти в футболе

Выигрыши бьющего игрока от его чистых стратегий составляют:

«Налево»: 45qл + 90qц + 90qп = 45qл + 90(1 — qл — qп) + 90qп = 45qл + 90(1 — qл).

«В центре»: 70qл + 0qц + 70qп = 70qл + 70qп.

«Направо»: 95qл + 95qц + 60qп = 95qл + 95(1 — qл — qп) + 60qп = 95(1 — qл) + 60qп.

Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 90–45qл = 95–35qп, или 35qп = 5 + 45qл. Далее приравниваем выражения, соответствующие стратегиям «налево» и «в центр», и упрощаем их, что дает 90–45qл = 70qл + 70qп, или 115qл + 70qп = 90. Подставив qп из первого уравнения (сначала умножив все члены уравнения на 2, чтобы вышло 70qп = 10 + 90qл) во второе, получаем 205qл = 80, или qл = 0,390. Затем, подставив это значение qл в любое из уравнений, получим qп = 0,644. И наконец, используем эти оба значения, чтобы получить qц = 1–0,390 — 0,644 = –0,034. Поскольку значение вероятности не может быть отрицательным, что-то явно пошло не так.

Чтобы понять, что происходит в данном примере, для начала обратите внимание на то, что теперь для бьющего пенальти игрока стратегия «в центр» хуже этой же стратегии в первоначальной версии игры, где вероятность ее выбора уже была достаточно низкой. Однако логика безразличия соперника, выраженная в виде уравнений, приведших к данному решению, означает, что бьющий игрок должен быть готов использовать эту плохую стратегию. Это может произойти только тогда, когда вратарь достаточно редко применяет свою наилучшую стратегию противодействия стратегии бьющего игрока «в центр», а именно стратегию «в центре». В данном примере такую логику рассуждений необходимо продолжать до тех пор, пока вероятность применения вратарем стратегии «в центре» не станет отрицательной.

С сугубо алгебраической точки зрения полученное решение вполне приемлемо, однако оно нарушает требование теории вероятностей и свойственной реальной жизни рандомизации в отношении того, что значение вероятности не может быть отрицательным. Лучшее, что здесь можно сделать, — снизить вероятность выбора вратарем стратегии «в центре» до минимального значения, то есть до нуля. Но в этом случае бьющий игрок не склонен к выбору стратегии «в центр». Иными словами, мы получаем ситуацию, в которой каждый игрок не использует одну из своих чистых стратегий в смешанной стратегии или использует ее с нулевой вероятностью.

Но тогда может ли существовать равновесие, в котором каждый игрок смешивает две оставшиеся стратегии — «налево» и «направо»? Если рассматривать эту сокращенную игру два на два саму по себе, можно без труда найти ее равновесие в смешанных стратегиях. Учитывая, что к настоящему моменту вы уже накопили достаточно большой опыт, мы оставляем детали поиска равновесия вам и приводим только полученный результат.

Вероятности применения чистых стратегий в смешанной стратегии бьющего игрока: pл = 0,4375, pл = 0,5625.

Вероятности применения чистых стратегий в смешанной стратегии вратаря: qл = 0,3750, qп = 0,6250.

Ожидаемый выигрыш бьющего игрока (процент успеха): 73,13.

Ожидаемый выигрыш вратаря (процент успеха): 26,87.

Мы получили этот результат, просто исключив стратегии двух игроков «в центр» и «в центре», руководствуясь интуицией. Но мы должны проверить, действительно ли это равновесие будет таковым в полной игре три на три, то есть должны убедиться, что ни один игрок не сочтет нужным применить третью стратегию в случае комбинации двух стратегий, выбранных другим игроком.

При выборе вратарем той или иной комбинации стратегий выигрыш бьющего игрока от применения чистой стратегии «в центр» составляет 0,375  70 + 0,625  70 = 70, что меньше выигрыша 73,13, который он получит от любой из своих чистых стратегий «налево» и «направо» или от любой их комбинации, а значит, бьющему игроку нет необходимости применять стратегию «в центр». Когда бьющий игрок выбирает комбинацию из двух стратегий с указанными выше вероятностями, выигрыш вратаря от использования чистой стратегии «в центре» составляет 0,4375  10 + 0,5625  50 = 7,2. И он существенно ниже выигрыша 26,87, который вратарь получил бы в случае применения любой из своих чистых стратегий «налево» и «направо» или от любой их комбинации. Таким образом, вратарю также не имеет смысла применять стратегию «в центре». Следовательно, равновесие, которое мы нашли для игры два на два, актуально и для игры три на три.

Чтобы предусмотреть вероятность того, что некоторые стратегии могут остаться незадействованными в равновесной комбинации стратегий, следует уточнить или расширить принцип безразличия соперника. Равновесная комбинация каждого игрока должна быть такой, чтобы другому игроку было безразлично, какую именно стратегию выбрать из тех, которые действительно используются в его равновесной комбинации, то есть другому игроку не безразличен выбор между ними и неиспользованными стратегиями и он отдает предпочтение выбранным стратегиям перед невыбранными. Иными словами, в игре против равновесной комбинации соперника все стратегии, вошедшие в состав вашей равновесной комбинации, должны обеспечивать вам один и тот же ожидаемый выигрыш, а он, в свою очередь, должен превышать выигрыш, который бы вы получили от любой из неиспользованных стратегий.

Какие именно стратегии останутся неиспользованными в равновесии? Ответ на этот вопрос требует применения метода проб и ошибок, как в приведенных выше вычислениях, либо выполнения соответствующих расчетов с помощью компьютерной программы. Как только вы поймете саму концепцию, можете приступать ко второму. Описание общей теории равновесий в смешанных стратегиях в случаях, когда в распоряжении игроков есть любое количество возможных стратегий, ищите в онлайн-приложении к данной главе.

8. Как использовать смешанные стратегии на практике

При поиске или выборе смешанной стратегии в игре с нулевой суммой следует помнить о нескольких важных моментах. Во-первых, для эффективного использования смешанной стратегии в такой игре ее участникам нужно сделать нечто большее, чем просто вычислить выраженные в процентах равновесные вероятности применения каждого из своих действий. На самом деле в игре с розыгрышем очка в теннисе Эверт не может просто выбирать стратегию ПЛ в семи из десяти случаев и стратегию ПД в трех из десяти случаев, механически чередуя семь ударов по линии и три удара по диагонали. Почему? Потому что смешивание стратегий должно помочь вам в полной мере воспользоваться элементом неожиданности в игре против соперника. Если вы задействуете узнаваемую схему игры, соперник наверняка это выявит и обернет себе на пользу.

Отсутствие закономерности означает, что после любой последовательности выбранных стратегий вероятность выбора стратегии ПЛ или ПД в следующий раз остается такой же, как всегда. Скажем, если стратегия ПЛ случайно используется несколько раз подряд, это отнюдь не означает, что ее «обязательно» должна сменить стратегия ПД. На практике многие ошибочно рассуждают совсем иначе, поэтому слишком часто чередуют варианты выбора по сравнению с тем, какой была бы их истинная случайная последовательность, и крайне редко используют несколько идентичных вариантов подряд. Тем не менее обнаружение закономерности в наблюдаемых действиях требует сложных статистических расчетов, которые соперники зачастую не в состоянии выполнять во время игры. Как мы увидим в разделе 9, анализ результатов финальных матчей турниров Большого шлема привел к выводу, что подающие игроки слишком часто чередовали свои подачи, но принимающие не смогли обнаружить и воспользоваться этим отклонением от истинного вероятностного выбора действий.

Важность предотвращения предсказуемости наиболее очевидна в случае непрерывного взаимодействия в играх с нулевой суммой. Поскольку в таких играх интересы игроков диаметрально противоположны, ваш соперник всегда стремится использовать ваш выбор действий с максимальной выгодой для себя. Таким образом, если вы регулярно ведете против друг друга одну и ту же игру, соперник будет постоянно искать способ взломать код, используемый вами для рандомизации своих ходов. И если ему это удастся, у него появится шанс увеличить свой выигрыш в следующих раундах игры. Однако даже в случае однократных игр с нулевой суммой смешивание стратегий приносит пользу благодаря тактической неожиданности.

Победитель Мировой серии покера Дэниел Харрингтон, написавший в соавторстве с Биллом Роберти ряд замечательных книг об игре в разновидность покера под названием «техаский холдем», отмечает важность рандомизации стратегии в покере, позволяющей помешать сопернику угадать, какие карты у вас на руках, и использовать ваше поведение с выгодой для себя[101]. Поскольку людям зачастую трудно вести себя непредсказуемо, Харрингтон дает следующий совет относительно того, как применять комбинацию таких чистых стратегий, «поднять ставку» и «ответить»:

Очень трудно точно вспомнить, что ты делал в последних четырех или пяти случаях при возникновении похожей ситуации. К счастью, это и не надо. Просто используй тот маленький генератор случайных чисел, который ты носишь в течение дня с собой. Что это? Ты и не знаешь, что у тебя такое есть? Да это секундная стрелка на твоих часах. Если ты знаешь, что в ранней позиции и при наличии на руках старшей пары ты должен повышать ставку в 80 % случаев и отвечать в остальных 20 %, то просто посмотри на часы и обрати внимание на положение секундной стрелки. Поскольку 80 % от 60 составляют 48, ты должен повышать ставку, если секундная стрелка находится между делениями от 0 до 48, и только отвечать, если между 48 и 60. Этот метод хорош тем, что даже если бы кто-то точно знал, что ты делаешь, он бы все равно не смог предсказать твоих дальнейших действий![102]

Безусловно, при использовании секундной стрелки часов для реализации смешанной стратегии важно, чтобы ваши часы не были слишком точными, иначе соперник сможет использовать такие же часы и предугадает ваши намерения!

До сих пор мы исходили из предположения, что вы заинтересованы в применении смешанной стратегии, чтобы предотвратить возможное использование соперником ваших действий в своих интересах. Однако если он не придерживается равновесной стратегии, вы можете попытаться воспользоваться его ошибкой. В качестве иллюстрации приведем пример из эпизода мультсериала «Симпсоны», в котором Барт и Лиза играют друг с другом в игру «камень, ножницы, бумага». (В упражнении S10 дано полное описание этой игры три на три; вам предстоит вычислить равновесную комбинацию стратегий каждого игрока.) Перед выбором стратегий Барт думает: «Конечно, камень. Он самый сильный». В то же время Лиза думает: «Бедный предсказуемый Барт. Он всегда выбирает камень». Как и следовало ожидать, наилучший ответ Лизы — стратегия «бумага» против своего незадачливого соперника; ей нет необходимости применять равновесную комбинацию стратегий.

Более тонкий пример использования действий соперника в своих интересах можно наблюдать в разыгрываемой парами студентов версии игры в теннис под названием «лучший из 100». Как и профессиональные теннисисты, наши студенты слишком часто переключаются с одной стратегии на другую, по всей видимости, считая, что выбор ПЛ пять раз подряд выглядит не таким уж «случайным». Для того чтобы извлечь из этого поведения выгоду для себя, игрок в роли Навратиловой смог предвидеть, что после выбора стратегии ПЛ три раза подряд игрок в роли Эверт, по всей вероятности, перейдет к стратегии ПД, и это можно обернуть себе на пользу, также переключившись на стратегию ПД. Этому игроку следовало бы поступать так чаще, чем в случае рандомизации каждого раунда игры в отдельности, но в идеале не так часто для того, чтобы игрок в роли Эверт заметил это и не научился повторять одну и ту же стратегию большее количество раз.

И наконец, игроки должны понять и принять тот факт, что применение смешанных стратегий защищает вас от использования соперником ваших действий в своих интересах и обеспечивает вам максимально возможный ожидаемый выигрыш в игре с соперником, который делает свой лучший выбор, но это не более чем математическое ожидание. В особых случаях игра может закончиться для вас неблагоприятным исходом. Например, длинный пас на третьем дауне с одним оставшимся ярдом, сделанный, чтобы держать защиту в напряжении, может завершиться неудачей в любом конкретном случае. Если вы выбираете смешанную стратегию в ситуации, за которою несете ответственность перед руководством, вы должны предусмотреть такой вариант. Вам следует заранее объяснить целесообразность использования вашей стратегии, скажем, своему тренеру или боссу. Они должны понять, почему вы ее выбрали и почему считаете, что она обеспечит вам наилучший выигрыш в среднем, хотя иногда и чревата достаточно низким выигрышем. Однако даже такое заблаговременное планирование не всегда способно защитить вашу «репутацию», поэтому вы должны быть готовы к критике при нежелательном исходе игры.

9. Эмпирические данные о смешивании стратегий

А. Игры с нулевой суммой

Первые исследователи, проводившие лабораторные эксперименты в области теории игр, как правило, пренебрегали смешанными стратегиями. Дуглас Дэвис и Чарльз Холт сказали по этому поводу следующее: «Участников экспериментов редко (если вообще когда-либо) можно было увидеть за подбрасыванием монеты, а когда впоследствии им говорили, что равновесие подразумевает рандомизацию, это вызывало у них удивление и скептицизм»[103]. Когда ожидаемое равновесие подразумевает смешивание двух или более чистых стратегий, результаты экспериментов показывают, что некоторые участники группы придерживаются одной чистой стратегии, тогда как остальные — другой, но это не истинное смешивание стратегий одним игроком. При многократной игре участников эксперимента в игры с нулевой суммой отдельные игроки часто со временем выбирают другие чистые стратегии. Тем не менее создается впечатление, что они ошибочно принимают чередование за случайный выбор, то есть переключаются между стратегиями чаще, чем того требует истинная рандомизация.

В ходе последующих исследований были получены несколько более достоверные данные в пользу смешивания в играх с нулевой суммой. Когда участники лабораторных экспериментов имеют возможность накопить большой опыт, они действительно осваивают навыки смешивания стратегий в играх с нулевой суммой. Тем не менее отклонения от равновесных прогнозов остаются весьма существенными. Усредненные по всем участникам эксперимента эмпирические вероятности, как правило, достаточно близки к вероятностям, рассчитанным посредством равновесия, но многие игроки все же выбирают стратегии в пропорциях, далеких от предсказанных равновесием. Колин Камерер сказал об этом следующее: «Общая картина такова, что смешанные равновесия в среднем не приводят к неверным догадкам в отношении поведения людей»[104].

Один случай практического применения рандомизации произошел в Малайе в конце 1940-х годов[105]. Британская армия сопровождала продовольственные конвои, чтобы защитить их от нападений коммунистов-террористов. Последние могли либо организовать масштабное нападение, либо провести мелкий снайперский обстрел, чтобы напугать водителей грузовиков, дабы те отказались от выполнения такой работы в следующий раз. Британское сопровождение могло либо группироваться в одном месте, либо рассредоточиться по всему конвою. Для армии сосредоточение позволяло эффективнее противостоять масштабной атаке, а рассредоточение было действенно против снайперов. Для террористов масштабное нападение было лучше при рассредоточенном сопровождении, а снайперский обстрел — при концентрации военных. В этой игре с нулевой суммой есть только одно равновесие в смешанных стратегиях. Командир отряда сопровождения, даже не слышавший о теории игр, решил проблему следующим образом. Каждое утро во время формирования конвоя он брал травинку в одну из рук и прятал руки за спиной, предлагая солдатам угадать, в какой руке травинка. В зависимости от ответа солдата командир выбирал тот или иной тип сопровождения конвоя. Хотя о точных показателях выигрышей в этой игре судить трудно, поэтому мы не можем сказать, было ли верным смешивание стратегий в соотношении 50 на 50, этот офицер правильно оценил необходимость рандомизации и важности использования новой процедуры рандомизации каждый день, чтобы избежать формирования закономерности или слишком частого чередования вариантов выбора.

Самые убедительные данные в поддержку смешанных стратегий в играх с нулевой суммой связаны со спортом, особенно его профессиональными видами, в которых игроки накапливают большой опыт, а присущее им стремление к победе подкрепляет крупное материальное вознаграждение при ее достижении.

Марк Уокер и Джон Вудерс проанализировали игру «подача — возврат подачи» между теннисистами высшего уровня во время матчей Уимблдонского турнира[106] и представили это взаимодействие как игру с двумя участниками (подающим и принимающим), в которой каждый игрок имеет две чистые стратегии. Подающий может делать подачу под правую или левую руку принимающего, а принимающий может делать предположения о том, в какую сторону отправит подачу подающий, и двигаться именно туда. Поскольку во время турниров высшего уровня в мужском одиночном разряде подачи выполняются очень быстро, принимающий не может предпринять ответное действие после того, как увидит фактическое направление подачи, поэтому ему приходится двигаться в соответствии со своей оценкой возможного направления. Таким образом, это игра с одновременными ходами. Кроме того, так как принимающий стремится правильно угадать действия подающего, а подающий старается ввести в заблуждение принимающего, в этой игре мы видим равновесие в смешанных стратегиях. Отследить стратегию принимающего на видеозаписи невозможно (разве можно увидеть, на какую ногу он переносит вес?), поэтому полную матрицу выигрышей для проверки, смешивают ли игроки свои чистые стратегии в соответствии с равновесными прогнозами, воссоздать нельзя. Тем не менее правильность важного теоретического прогноза можно проверить, рассчитав частоту, с которой подающий выигрывает очко в случае каждой из имеющихся в его распоряжении стратегий подачи.

Если теннисисты используют равновесные комбинации стратегий в игре «подача — возврат подачи», подающий должен выигрывать очко с одинаковой вероятностью независимо от того, делает ли он подачу под правую или под левую руку принимающего. В реальном теннисном матче два игрока разыгрывают не менее сотни очков; следовательно, это предоставляет достаточно данных, чтобы проверить, выполняется ли это условие в каждом матче. Уокер и Вудерс составили таблицу результатов подач в 10 матчах. В каждом матче используются четыре типа комбинаций «подача — возврат подачи»: игрок А делает подачу игроку Б и наоборот в сочетании с подачей с правой или с левой стороны корта. Таким образом, Уокер и Вудерс проанализировали данные о 40 ситуациях с розыгрышем подачи и обнаружили, что в 39 из них показатели результативности подающего в случае подачи под правую и под левую руку попадали в допустимые пределы статистической погрешности.

По всей вероятности, теннисисты высшего уровня накопили достаточно большой общий опыт игры в теннис и ее ведения против различных соперников, для того чтобы усвоить общий принцип смешивания стратегий в правильном соотношении в игре против конкретных противников. Тем не менее, чтобы добиться необходимого уровня непредсказуемости, в любой последовательности подач не должно быть никакой закономерности: выбор стороны при каждой подаче не должен зависеть от предыдущего выбора. Как уже отмечалось в контексте применения смешанных стратегий на практике, игроки могут слишком часто чередовать чистые стратегии, не осознавая того, что чередование — такая же закономерность, как и неоднократное повторение одного и того же действия. И данные действительно подтверждают тот факт, что подающие чередовали свои стратегии слишком часто. Однако, согласно тем же данным, такое отклонение от истинного смешивания стратегий оказалось не настолько большим, чтобы соперники его заметили и использовали с выгодой для себя.

Как было показано в разделе 8, пенальти в футболе — еще один подходящий контекст для изучения смешанных стратегий. Преимущество анализа штрафных ударов состоит в том, что это действительно позволяет отслеживать стратегии, используемые как игроком, выполняющим пенальти, так и вратарем, то есть видеть не только, куда бьющий игрок собирается послать мяч, но и в какую сторону бросается вратарь. Это означает, что мы можем вычислить фактические вероятности смешивания стратегий и сравнить их с теоретическими прогнозами. Недостаток этого контекста по сравнению с теннисом состоит в том, что два игрока сталкиваются друг с другом не более чем несколько раз за сезон. Для того чтобы собрать достаточно данных, вместо анализа конкретных случаев противоборства между игроками необходимо проанализировать показатели всех вратарей и игроков, выполняющих пенальти. По результатам двух исследований, основанных именно на таких данных, было получено убедительное подтверждение теоретических прогнозов.

Проанализировав большой объем данных, предоставленных профессиональными футбольными лигами Европы, Игнасио Уэрта составил таблицу выигрышей, соответствующих средней вероятности успешных ударов бьющего игрока (рис. 7.12)[107]. Поскольку в эти данные включены показатели бьющих игроков как с правой, так и с левой ноги, а значит, у них разное естественное направление удара, здесь естественной считается стратегия «направо». (Игроки, выполняющие пенальти, обычно бьют по мячу внутренней стороной стопы. Для игрока, бьющего с правой ноги, естественным является удар направо от вратаря, а с левой — удар налево от вратаря.) Каждый игрок располагает двумя вариантами стратегий — «налево» и «направо». Когда вратарь выбирает стратегию «направо», это означает, что он будет прикрывать естественное направление удара бьющего игрока.

Рис. 7.12. Вероятности успешного выполнения пенальти в европейских высших лигах

Воспользовавшись свойством безразличия соперника, можно легко определить, что бьющий игрок должен выбирать стратегию «налево» в 38,3 % случаев, а стратегию «направо» в 61,7 % случаев. Такая комбинация стратегий обеспечивает показатель результативности ударов 79,6 % независимо от того, какую стратегию выберет вратарь. Вратарь, со своей стороны, должен выбирать стратегии «налево» и «направо» в 41,7 и 58,3 процентах случаев соответственно; эта комбинация стратегий позволит ему удержать показатель результативности ударов бьющего игрока на уровне 79,6 %.

Что же происходит на самом деле? Игроки, выполняющие пенальти, применяли стратегию «налево» в 40,0 % случаев, а вратари — в 41,3 % случаев. Эти показатели максимально близки к теоретическим прогнозам. Выбранные комбинации стратегий почти полностью защищены от использования соперником в своих интересах. Смешанная стратегия бьющего игрока обеспечивает показатель результативности ударов 79 % против стратегии вратаря «налево» и 80 % против стратегии вратаря «направо». Смешанная стратегия вратаря удерживает показатель результативности бьющих игроков на уровне 79,3 % при выборе ими стратегии «налево», а при тратегии «направо» в 79,7 % случаев.

В ранее опубликованной работе Пьер-Андре Кьяппори, Тимоти Гроусклоуз и Стивен Левитт использовали аналогичные данные и получили аналогичные результаты[108]. Кроме того, они проанализировали всю последовательность выбора стратегий каждым игроком, бьющим пенальти, и каждым вратарем и не нашли случаев чрезмерного чередования. Это можно объяснить тем, что большинство одиннадцатиметровых штрафных ударов представляют собой единичные события, происходящие на протяжении многих матчей, в отличие от многократно повторяющихся розыгрышей очка в теннисе, поэтому в случае пенальти игроки чаще не учитывают то, что происходило во время предыдущих пенальти. Тем не менее все эти данные говорят о том, что действия игроков во время выполнения пенальти в футболе даже ближе к истинному смешиванию стратегий, чем в игре «подача — возврат подачи» в теннисе.

При столь убедительном эмпирическом подтверждении теории было бы резонно спросить, эффективны ли навыки смешивания стратегий, приобретенные игроками в футболе, в других игровых контекстах. Результаты одного исследования подтвердили, что да (испанские профессиональные футболисты играли в точном соответствии с равновесными прогнозами во время лабораторных экспериментов в матричных играх с нулевой суммой два на два и четыре на четыре). Тем не менее в ходе другого исследования воспроизвести эти результаты не удалось. В его рамках анализировались показатели игроков американской Высшей лиги футбола, а также участников Мировой серии покера (у которых, как говорилось в разделе 8, также есть профессиональные причины для предотвращения использования их действий соперниками с выгодой для себя посредством смешивания стратегий) и было установлено, что поведение профессиональных игроков во время абстрактных матричных игр так же далеко от равновесия, как и поведение студентов. Как и в случае исследований с участием профессиональных шахматистов, о которых шла речь в главе 3, при наличии опыта профессиональные игроки смешивают стратегии в соответствии с теорией равновесия в своей профессиональной сфере, но этот опыт не приводит их автоматически к равновесию в новых и незнакомых играх[109].

Б. Игры с ненулевой суммой

Лабораторные эксперименты со смешиванием стратегий в играх с ненулевой суммой дают еще более отрицательные результаты, чем аналогичные эксперименты в играх с нулевой суммой. И это неудивительно. Как мы уже убедились, в таких играх свойство, в соответствии с которым равновесная комбинация стратегий каждого игрока становится причиной безразличия соперника в отношении выбора между чистыми стратегиями, — логическое свойство самого равновесия. В отличие от игр с нулевой суммой, у каждого участника игры с ненулевой суммой зачастую нет положительных или целевых причин добиваться безразличия других игроков. В таком случае игрокам труднее понять и освоить логику рассуждений, лежащую в основе вычисления вероятностей применения чистых стратегий в смешанной стратегии, что проявляется в их поведении.

В группе участников эксперимента, играющих в игру с ненулевой суммой, можно увидеть, как одни игроки придерживаются одной чистой стратегии, тогда как другие — другой. Этот тип смешивания в группе не согласуется с теорией равновесий в смешанных стратегиях, хотя у такого смешивания есть интересная эволюционная интерпретация, которую мы проанализируем в главе 12.

Как мы говорили выше в разделе 5.Б, вероятности применения чистых стратегий в смешанной стратегии каждого игрока не должны меняться при изменении его выигрышей. Однако на самом деле именно это и происходит: как правило, игроки выбирают то или иное действие чаще, если их собственный выигрыш от этого увеличивается[110]. Игроки действительно меняют свои действия в ходе повторных раундов игры с разными партнерами, но не в соответствии с равновесными прогнозами.

Общий вывод таков: в играх с ненулевой суммой следует интерпретировать и применять равновесия в смешанных стратегиях как минимум с большой осторожностью.

Резюме

Игры с нулевой суммой, в которых один игрок предпочитает совмещение действий, а другой наоборот, зачастую не имеют равновесия Нэша в чистых стратегиях. В таких играх каждый игрок стремится действовать непредсказуемо и поэтому использует смешанную стратегию с определенным распределением вероятностей на своем множестве чистых стратегий. Вероятности применения чистых стратегий в смешанной стратегии каждого игрока вычисляются с помощью свойства безразличия соперника, которое гласит, что в игре против равновесной смешанной стратегии данного игрока соперник должен получать равные ожидаемые выигрыши от всех своих чистых стратегий. Графики кривых наилучших ответов можно использовать для отображения всех равновесий в смешанных стратегиях (а также в чистых стратегиях) той или иной игры.

В играх с ненулевой суммой также могут присутствовать равновесия в смешанных стратегиях, которые можно рассчитать на основании свойства безразличия соперника и проиллюстрировать с помощью кривых наилучших ответов. Но мотивация к поддержанию безразличия соперника в этих играх слабее или отсутствует вообще, поэтому такие равновесия менее привлекательны для игроков и обычно неустойчивы.

Смешанные стратегии — это частный случай непрерывных стратегий, но им свойственны дополнительные аспекты, заслуживающие специального изучения. Равновесия в смешанных стратегиях можно интерпретировать как исходы игры, в которых каждый игрок имеет правильные убеждения в отношении вероятностей, с которыми другой игрок выбирает среди своих базовых чистых стратегий. Кроме того, при изменении выигрышей игроков равновесия в смешанных стратегиях могут иметь ряд свойств, противоречащих здравому смыслу.

Если в распоряжении одного игрока три стратегии, а другого — только две, первый, как правило, использует в равновесной смешанной стратегии всего две чистые стратегии. Если у обоих игроков по три (или более) чистые стратегии, в равновесных комбинациях стратегий может быть указана положительная вероятность применения их всех или только их подмножества. Все стратегии, активно используемые в смешанной стратегии, обеспечивают игроку равный ожидаемый выигрыш в игре против равновесной смешанной стратегии соперника; все неиспользованные стратегии гарантируют более низкий ожидаемый выигрыш. В крупных играх такого рода бывают случаи, когда равновесная комбинация стратегий остается неопределенной.

При применении смешанных стратегий игрокам нельзя забывать, что их система рандомизации ни в коем случае не должна быть предсказуемой. Крайне важно избегать чрезмерного чередования действий. Лабораторные эксперименты обеспечивают только слабую поддержку применения смешанных стратегий. Тем не менее равновесия в смешанных стратегиях позволяют получить достоверные прогнозы во многих играх с нулевой суммой с участием опытных профессиональных спортсменов.

Ключевые термины

Ожидаемый выигрыш

Свойство безразличия соперника

Упражнения с решениями

S1. Рассмотрим следующую игру:

a) Какую игру она больше всего напоминает: розыгрыш очка в теннисе, игру в доверие или игру в труса?

b) Найдите все равновесия Нэша в этой игре.

S2. В следующей таблице представлены выраженные в денежных суммах выигрыши в игре с одновременными ходами с двумя участниками:

a) Найдите равновесие Нэша в смешанных стратегиях в этой игре.

b) Определите ожидаемые выигрыши игроков в этом равновесии.

c) Ровена и Колин вместе получают максимальную сумму денег, когда Ровена выбирает «вниз». Тем не менее в равновесии она не всегда применяет эту стратегию. Почему? Можете ли вы придумать способы получения более согласованного исхода игры?

S3. Вспомните упражнение S7 из главы 4, где говорилось о пожилой даме, которой нужно было перейти улицу, а два игрока одновременно решали, предлагать ли ей помощь. Если вы выполнили это упражнение, значит, нашли все равновесия Нэша в чистых стратегиях. Теперь найдите равновесие в смешанных стратегиях.

S4. Просмотрите описание игры в теннис в разделе 2.А данной главы. Вспомните, что, согласно равновесию Нэша в смешанных стратегиях, найденному в этом разделе, Эверт выбирает стратегию ПЛ с вероятностью 0,7, а Навратилова с вероятностью 0,6. Предположим, что чуть позже во время матча Эверт получает травму, из-за чего ее удары по линии становятся гораздо медленнее, а значит, Навратиловой их легче отражать. Выигрыши в этой игре представлены в следующей таблице.

a) По сравнению с игрой до получения травмы (см. рис. 7.1) стратегия ПЛ кажется теперь менее привлекательной для Эверт. Как думаете, в новом равновесии в смешанных стратегиях Эверт будет выбирать ее чаще, реже или так же, как раньше? Обоснуйте свой вывод.

b) Найдите равновесную комбинацию стратегий каждой участницы игры. Какова ожидаемая ценность данной игры для Эверт?

c) Чем отличаются равновесные комбинации, найденные в пункте b, от равновесных комбинаций в исходной игре и от вашего ответа на вопрос в пункте а? Объясните, почему изменилась или не изменилась каждая комбинация.

S5. В упражнении S7 главы 6 представлена упрощенная версия игры в бейсбол, а в пункте с указано, что в этой игре с одновременными ходами отсутствует равновесие Нэша в чистых стратегиях. Это объясняется тем, что у питчеров и бэттеров противоположные цели: питчеру нужно бросить мяч мимо бэттера, а бэттеру необходимо отбить этот мяч. Таблица игры выглядит так:

a) Найдите равновесие Нэша в смешанных стратегиях в этой упрощенной версии игры в бейсбол.

b) Определите ожидаемые выигрыши каждого игрока в этом равновесии.

c) Предположим, питчер попытается улучшить ожидаемый выигрыш в равновесии в смешанных стратегиях, замедлив свой фастбол таким образом, что это делает его похожим на керв. В итоге выигрыш бэттера в ячейке «ожидать фастбол — бросить фастбол» изменится с 0,30 до 0,25, а выигрыш питчера скорректируется соответственно. Может ли такое изменение улучшить ожидаемый выигрыш питчера? Тщательно обоснуйте свой ответ. Кроме того, объясните, почему замедление фастбола может (или не может) улучшить ожидаемый выигрыш питчера в этой игре.

S6. Несмотря на опасность игры в труса (см. раздел 4.Б), Джеймс и Дин решают повысить ее эмоциональный накал (и ставки), стартуя на автомобилях с большего расстояния друг от друга. Так они смогут дольше держать зрителей в напряжении и сильнее разогнаться, прежде чем дело дойдет (или не дойдет) до серьезного столкновения. В связи с этим в новой таблице игры указан более высокий штраф за столкновение.

a) Найдите равновесие Нэша в смешанных стратегиях для этой более опасной версии игры в труса. Джеймс и Дин выбирают стратегию «ехать прямо» чаще или реже по сравнению с игрой, таблица которой представлена на рис. 7.4?

b) Определите ожидаемый выигрыш каждого игрока в случае равновесия в смешанных стратегиях, найденного в пункте a.

c) Джеймс и Дин решают разыгрывать игру в труса многократно (например, в присутствии разных групп зрителей из числа безрассудной молодежи). Более того, дабы избежать столкновения, они вступают в сговор и чередуют два равновесия в чистых стратегиях. Каким будет средний выигрыш ткаждого из них в случае такого сговора, если они сыграют четное количество игр? Он лучше или хуже выигрыша, на который они могут рассчитывать при равновесии в смешанных стратегиях? Почему?

d) После того как Джеймс и Дин несколько недель не играли в вариант игры в труса, описанный в пункте с, они договариваются сыграть снова. Однако к этому времени оба совершенно забывают, какое равновесие Нэша в чистых стратегиях разыгрывали в последний раз, и ни один из них этого не осознает, пока не взревут двигатели автомобилей перед самым началом игры. Вместо того чтобы играть в соответствии с равновесием Нэша в чистых стратегиях, каждый из них подбрасывает монету, чтобы решить, какую стратегию выбрать. Чему равен ожидаемый выигрыш Джеймса и Дина, если каждый из них смешивает стратегии в пропорции 50 на 50 таким способом? Как он соотносится с ожидаемыми выигрышами в случае равновесной комбинации стратегий? Объясните, почему эти выигрыши остаются неизменными или отличаются от выигрышей, вычисленных в пункте с.

S7. В разделе 2.Б продемонстрировано, как построить график кривых наилучших ответов в игре с розыгрышем очка в теннисе. В разделе 4.Б отмечено, что при наличии множества равновесий их можно определить по пересечениям кривых наилучших ответов. Для игры «битва полов», представленной на рис. 4.12 в главе 4, постройте графики наилучших ответов Гарри и Салли на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша.

S8. Рассмотрите следующую игру:

a) При каких значениях x в этой игре есть единственное равновесие Нэша? Найдите его.

b) При каких значениях x в этой игре есть равновесие Нэша в смешанных стратегиях? С какой вероятностью, выраженной через x, каждый игрок будет выбирать стратегию «да» в равновесии в смешанных стратегиях?

c) Можно ли назвать эту игру при значениях x, найденных в пункте а, примером игры в доверие, игры в труса или игры наподобие тенниса? Обоснуйте свой ответ.

d) Пусть x = 3. Постройте график кривых наилучших ответов Ровены и Колина на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша в чистых и смешанных стратегиях.

e) Пусть x = 1. Постройте график кривых наилучших ответов Ровены и Колина на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша в чистых и смешанных стратегиях.

S9. Рассмотрите следующую игру:

a) Постройте график ожидаемых выигрышей от каждой из стратегий профессора Плама как функции р-комбинации миссис Пикок.

b) При каком диапазоне значений p стратегия «револьвер» обеспечивает профессору Пламу более высокий ожидаемый выигрыш, чем стратегия «нож»?

c) При каком диапазоне значений p стратегия «револьвер» обеспечивает ему более высокий ожидаемый выигрыш, чем стратегия «гаечный ключ»?

d) Какие чистые стратегии профессор Плам использует в своей равновесной комбинации? Почему?

e) Найдите равновесие Нэша в смешанных стратегиях в этой игре.

S10. Многие из вас наверняка знакомы с детской игрой «камень, ножницы, бумага». В ней два игрока одновременно выбирают свой «камень», «ножницы» или «бумагу», складывая ладони так, чтобы их форма напоминала один из этих вариантов. Счет в игре ведется следующим образом. Игрок, выбравший «ножницы», побеждает игрока, выбравшего «бумагу» (потому что ножницы режут бумагу). Игрок, выбравший «бумагу», побеждает игрока, выбравшего «камень» (поскольку бумага обертывает камень). Игрок, выбравший «камень», побеждает игрока, выбравшего «ножницы» (потому что камень разбивает ножницы). Допустим, в каждом отдельном розыгрыше игры на кону стоят 10 очков. Возможные исходы игры представлены в следующей таблице выигрышей:

a) Найдите равновесие в смешанных стратегиях в этой игре.

b) Предположим, Лиза объявила, что применит комбинацию стратегий, в которой вероятность выбора стратегии «камень» составляет 40 %, «ножницы» — 30 % и «бумага» — 30 %. Определите наилучший ответ Барта на такой выбор стратегий. Объясните, почему ваш ответ резонный, основываясь на ваших знаниях о смешанных стратегиях.

S11. Вспомните игру между торговцами мороженым на пляже из упражнения U6 в главе 6. В ней мы нашли два асимметричных равновесия в чистых стратегиях. В данной игре есть также симметричное равновесие в смешанных стратегиях.

a) Составьте таблицу этой игры пять на пять.

b) Исключите доминируемые стратегии и объясните, почему их не следует применять в равновесии.

c) Используйте ответ, полученный в части (b), чтобы найти равновесие в смешанных стратегиях в этой игре.

S12. Допустим, в игре в пенальти из раздела 7.А данной главы в распоряжении бьющего игрока шесть стратегий: бить высоко и налево (ВЛ), низко и налево (НЛ), высоко и в центр (ВЦ), низко и в центр (НЦ), высоко и направо (ВП), а также низко и направо (НП). Вратарь по-прежнему располагает тремя стратегиями: двигаться налево от бьющего игрока (Л), двигаться направо (П) и оставаться в центре (Ц). Проценты успешных действий игроков приведены в следующей таблице:

Ваша задача — подтвердить, что в равновесии в смешанных стратегиях данной игры вратарь использует каждую из стратегий Л и П в 42,2 % случаев, а стратегию Ц в 15,6 % случаев, тогда как бьющий игрок применяет каждую из стратегий НЛ и НП в 37,8 % случаев, а стратегию ВЦ в 24,4 % случаев.

a) С учетом предложенной смешанной стратегии вратаря вычислите ожидаемый выигрыш бьющего игрока от каждой из его шести чистых стратегий и с учетом предложенной смешанной стратегии бьющего игрока ожидаемый выигрыш вратаря от каждой из его трех стратегий. (Для простоты используйте только три значащие цифры.)

b) На основании ответа, полученного в пункте а, объясните, почему смешанная стратегия вратаря — наилучший ответ на предложенную смешанную стратегию бьющего игрока и наоборот.

c) Воспользовавшись полученными выше ответами, объясните, почему предложенные стратегии образуют равновесие Нэша.

d) Вычислите равновесный выигрыш игрока, выполняющего пенальти.

S13 (дополнительное упражнение). В разделе 5.Б в контексте игры в доверие мы показали, что изменение выигрышей Салли не меняет пропорций, в которых она смешивает чистые стратегии в равновесии, — ее равновесная комбинация зависит только от выигрышей Гарри. В данном упражнении вам предстоит доказать, что это общий результат для всех равновесий в смешанных стратегиях в играх два на два. Рассмотрим общий случай игры с ненулевой суммой два на два, таблица выигрышей которой представлена ниже.

a) Предположим, в этой игре есть равновесие в смешанных стратегиях. Определите вероятность того, что Ровена выберет в равновесии стратегию «вверх» как функцию приведенных в таблице выигрышей.

b) Определите вероятность того, что Колин выберет стратегию «налево» в равновесии.

c) Объясните, как полученные вами результаты показывают, что равновесные комбинации каждого игрока зависят только от выигрышей другого игрока.

d) Каким условиям должны удовлетворять выигрыши, чтобы в данной игре действительно присутствовало равновесие в смешанных стратегиях?

S14 (дополнительное упражнение). Вспомните упражнение S13 из главы 4, основанное на сцене в баре из фильма «Игры разума». Здесь мы проанализируем равновесия в смешанных стратегиях в этой игре, когда в нее играют n > 2 молодых людей.

a) Начните с рассмотрения симметричного случая, когда каждый из n молодых людей самостоятельно пытается привлечь внимание одинокой блондинки с вероятностью P, зависящей от условия, согласно которому каждому молодому человеку должно быть безразлично, какую из двух чистых стратегий выбрать — «блондинка» или «брюнетка», с учетом того, что все остальные игроки смешивают стратегии. Какое условие гарантирует безразличие каждого игрока? Найдите равновесное значение P в этой игре.

b) В данной игре есть также ряд асимметричных равновесий в смешанных стратегиях. В них каждый из m < n молодых людей пытается привлечь внимание блондинки с вероятностью Q, а остальные n — m игроков добиваются расположения брюнеток. Какое условие гарантирует безразличие m молодых людей с учетом действий остальных игроков? Какое условие должно выполняться, чтобы оставшиеся n — m игроков не отказались от применения чистой стратегии выбора брюнетки? Чему равно равновесное значение Q в случае асимметричного равновесия?

Упражнения без решений

U1. В американском футболе команда нападения может либо совершать пробежку с мячом, либо делать пас, тогда как команда защиты может ожидать (и подготовиться) либо пробежку, либо пас. Предположим, ожидаемые выигрыши обеих команд (в ярдах) за каждый отдельно взятый даун составляют:

a) Докажите, что в этой игре нет равновесия Нэша в чистых стратегиях.

b) Найдите в ней единственное равновесие Нэша в смешанных стратегиях.

c) Объясните, почему комбинация стратегий команды нападения отличается от комбинации стратегий команды защиты.

d) Сколько ярдов предположительно может набрать команда нападения в случае равновесия?

U2. Накануне крайнего срока сдачи работ профессор получает электронное письмо от одного из студентов, который утверждает, что застрял с решением одной из задач, просидев над ней больше часа. Профессор не против помочь студенту, если тот действительно работает, но отказал бы в помощи, зная, что тот просто пытается выудить подсказку. Учитывая время получения письма, профессор мог бы просто сделать вид, что прочитал его значительно позже. Очевидно, что студент предпочел бы получить помощь независимо от того, решал он задачу или нет. Но если так ее и не дождется, то предпочтет не усугублять проблему и приступит к работе, поскольку задачи необходимо сдать завтра. Предположим, участники этой игры получат следующие выигрыши:

a) Найдите равновесие Нэша в смешанных стратегиях в этой игре.

b) Вычислите ожидаемый выигрыш каждого из игроков.

U3. В упражнении S12 в главе 4 описывается игра «чет или нечет», в которой нет равновесия Нэша в чистых стратегиях. Однако в ней есть равновесие в смешанных стратегиях.

a) Если Анна выберет 1 (выбросит один палец) с вероятностью p, каков ожидаемый выигрыш Брюса от выбора 1, выраженный через p? Чему равен его ожидаемый выигрыш от выбора 2?

b) При каком уровне p Брюсу будет безразлично, какую стратегию выбрать — 1 или 2?

c) Если Брюс сыграет 1 с вероятностью q, при каком уровне q Анне будет безразлично, какую стратегию выбрать — 1 или 2?

d) Запишите равновесие в смешанных стратегиях этой игры. Чему равен в ней ожидаемый выигрыш каждого игрока?

U4. Вернемся снова к соперничеству между теннисистками Эверт и Навратиловой, о котором шла речь в разделе 2.А. Через много месяцев они опять встречаются на очередном турнире. Эверт восстановилась после травмы (см. упражнение S4), а Навратилова в это же время усердно улучшала навыки защиты против подач по линии. Ниже представлена таблица выигрышей в этой игре.

a) Найдите равновесную комбинацию каждого игрока в этой игре.

b) Что произошло с р-комбинацией Эверт по сравнению с игрой, представленной в разделе 2.А? Почему?

c) Какова ожидаемая ценность данной игры для Эверт? Почему она отличается от ожидаемой ценности первоначальной игры, рассматриваемой в разделе 2.А?

U5. В разделе 4.А данной главы шла речь о смешивании стратегий в контексте «битвы полов» между Гарри и Салли.

a) Как думаете, что произойдет с равновесными значениями p и q, вычисленными в этой главе, если Салли решит, что Local Latte ей действительно нравится гораздо больше, чем Starbucks, поэтому теперь в ячейке Local Latte, Local Latte указаны выигрыши 1, 3? Объясните логику своих рассуждений.

b) Найдите новые равновесные значения p и q. Чем они отличаются от равновесных значений p и q в исходной игре?

c) Определите ожидаемый выигрыш каждого игрока в случае нового равновесия в смешанных стратегиях.

d) Как вы считаете, могли бы Гарри и Салли разыграть равновесие в смешанных стратегиях в новой версии игры? Обоснуйте свой ответ.

U6. Рассмотрим следующий вариант игры в труса, в котором выигрыш Джеймса от стратегии «ехать прямо» при условии, что Дин выбирает стратегию «свернуть», равен 2, а не 1.

a) Найдите равновесие в смешанных стратегиях в этой игре, в том числе ожидаемые выигрыши игроков.

b) Сравните полученные результаты с результатами в исходной игре в разделе 4.Б данной главы. Вероятность того, что Дин выберет «ехать прямо», повысилась? А как насчет вероятности того, что Джеймс «поедет прямо»?

c) Что произошло с ожидаемыми выигрышами двух игроков? Эти различия между равновесными исходами парадоксальны с точки зрения новой структуры выигрышей? Объясните, как можно трактовать ваши выводы в контексте принципа безразличия соперника.

U7. Постройте графики наилучших ответов Джеймса и Дина для игры в труса, представленной на рис. 4.13 в главе 4, на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша.

U8. a) Найдите все равновесия Нэша в чистых стратегиях в следующей игре:

b) Найдите равновесие в смешанных стратегиях в этой игре. Чему равны ожидаемые выигрыши игроков в этом равновесии?

U9. Рассмотрите измененную версию игры из упражнения S9.

a) Постройте график ожидаемых выигрышей от каждой из стратегий профессора Плама как функции р-комбинации миссис Пикок.

b) Какие чистые стратегии использует профессор Плам в своей равновесной комбинации? Почему?

c) Найдите равновесие Нэша в смешанных стратегиях в этой игре.

d) Обратите внимание, что данная версия игры незначительно отличается от игры, представленной в упражнении S9. В чем различие между этими двумя играми? Объясните, почему интуиция подсказывает вам, что равновесный исход игры изменился по сравнению с исходом игры в упражнении S9.

U10. Рассмотрите измененную версию игры «камень, ножницы, бумага», в которой Барт получает приз, когда выигрывает, применив стратегию «камень». Если Барт выберет «камень», а Лиза — «ножницы», он получит в два раза больше очков по сравнению с тем, что оба получили бы при любом ином подходе. Новая матрица выигрышей выглядит так:

a) Найдите равновесие в смешанных стратегиях в этой версии игры.

b) Сравните полученный результат с равновесием в смешанных стратегиях из упражнения S10. Как вы можете объяснить различия между ними?

U11. Рассмотрите следующую игру.

a) Есть ли в ней равновесие в чистых стратегиях? Если да, то какое?

b) Найдите равновесие в смешанных стратегиях в этой игре.

c) В действительности в этой игре два равновесия в смешанных стратегиях. Найдите то, которое вы не нашли в пункте b. (Подсказка: в одном из этих равновесий один из игроков выбирает смешанную стратегию, тогда как другой — чистую.)

U12. Упрямые Джеймс и Дин снова играют в более опасный вариант игры в труса (см. упражнение S6). Они заметили, что их выигрыш («храбрец») зависит от количества зрителей. Чем их больше, тем больше славы и похвал получает тот, кто едет прямо. Безусловно, в случае меньшего количества зрителей наблюдается противоположный эффект. Пусть k > 0 — это выигрыш игрока, который показал себя «храбрецом». Теперь эту игру можно представить так:

a) С какой вероятностью, выраженной через k, каждый водитель выбирает стратегию «свернуть» в равновесии Нэша в смешанных стратегиях? Применяют ли Джеймс и Дин эту стратегию чаще или реже по мере увеличения значения k?

b) Чему равна ожидаемая ценность игры для каждого игрока, выраженная через k, в равновесии Нэша в смешанных стратегиях, найденном в пункте а?

c) При каком значении k и Джемс, и Дин смешивают в данном равновесии стратегии в соотношении 50 на 50?

d) Насколько большим должно быть значение k, чтобы средний выигрыш был положительным при схеме чередования, о которой шла речь в пункте с упражнения S6?

U13 (дополнительное упражнение). Вспомните игру из упражнения S11 в главе 4, где Ларри, Мо и Керли могут покупать билеты с возможностью получить приз в размере 30 долларов. Мы нашли в ней шесть равновесий Нэша в чистых стратегиях. В данном упражнении вам предстоит найти симметричное равновесие в смешанных стратегиях.

a) Исключите слабо доминируемую стратегию каждого игрока. Объясните, почему игрок никогда не использовал бы ее в своей равновесной комбинации стратегий.

b) Найдите равновесие в смешанных стратегиях.

U14 (дополнительное упражнение). В упражнении S4 и упражнении U4 показано, что в играх с нулевой суммой, таких как соперничество Эверт и Навратиловой в теннисе, изменение выигрышей одного игрока иногда приводит к неожиданным или парадоксальным изменениям в равновесной комбинации стратегий. Но что происходит при этом с ожидаемой ценностью игры? Рассмотрим следующую общую форму игры с нулевой суммой с участием двух игроков:

Предположим, в этой игре нет равновесия Нэша в чистых стратегиях, а значения a, b, c и d больше или равны 0. Может ли увеличение значения одной из переменных a, b, c и d обусловить снижение ценности игры для Ровены? Если нет, докажите это. Если да, приведите пример.

Приложение. Вероятность и ожидаемая полезность

При вычислении ожидаемых выигрышей и равновесий в смешанных стратегиях в данной главе мы должны были выполнить ряд простых действий с вероятностями. Для этого существует несколько несложных правил. Возможно, многие из вас с ними знакомы, но мы дадим здесь краткое описание и объяснение основных понятий, чтобы вы могли в случае необходимости восстановить или восполнить свои знания. Кроме того, мы также покажем, как вычислить математическое ожидание случайных числовых величин.

Основные алгебраические действия с вероятностями

Базовое интуитивное представление вероятности наступления того или иного события формируется в процессе размышлений о частоте, с которой оно происходит случайно в рамках более крупного множества возможных событий. Как правило, любой элемент более крупного множества столь же вероятен, как и любой другой элемент. Следовательно, поиск вероятности интересующего нас события сводится к подсчету числа элементов, соответствующих этому событию, и их делению на общее количество элементов в крупном множестве[111].

Например, в любой стандартной колоде из 52 игральных карт четыре масти (трефы, бубны, червы и пики), по 13 карт разного достоинства в каждой: сначала туз, затем номерные карты от 2 до 10 и фигурные карты — валет, дама, король. Мы можем задать массу разных вопросов о том, с какой вероятностью из данной колоды карт можно извлечь карту определенной масти или достоинства (или масти и достоинства): с какой вероятностью можно вытащить карту пиковой масти? А черную карту? А десятку? А даму пик? И так далее. Чтобы ответить на эти вопросы, необходимо обладать определенными знаниями о вычислении вероятностей и о действиях с ними. Если бы у нас было две колоды карт (одна с синими рубашками, а другая с зелеными), мы могли бы задать еще более сложные вопросы («С какой вероятностью можно вытащить по одной карте из каждой колоды так, чтобы обе карты оказались валетом бубен?»), но для получения ответа на них по-прежнему использовали бы все те же алгебраические действия с вероятностями.

В широком смысле вероятность — это степень возможности наступления определенного события или совокупности событий. Возможность того, что вы извлечете карту пиковой масти из колоды карт, — просто вероятность наступления события «вытащить пику». В данном случае крупное множество содержит 52 элемента (общее количество в равной степени вероятных возможностей), а событие «вытащить пику» соответствует подмножеству, состоящему из 13 конкретных элементов. Таким образом, у вас есть 13 шансов из 52 вытащить пику, а значит, вероятность сделать это за один раз равна 13/52 = 1/4 = 25 %. Данную ситуацию можно представить себе иначе: у вас есть четыре масти по 13 карт в каждой, следовательно, ваш шанс извлечь карту определенной масти составляет один к четырем, или 25 %. Если бы вы тащили карту несколько раз (каждый раз из полной колоды карт), то из 52 попыток вы не всегда вытаскивали бы пику в точности 13 раз; по воле случая вы порой вытаскивали бы на несколько больше, а иногда на несколько меньше пик. Однако когда извлечение карт из колоды выполняется многократно, существуют разные множества из 52 попыток и этот шанс усредняется. В таком случае вероятность 25 % представляет собой среднее значение частоты вытаскивания карты пиковой масти в большом количестве наблюдений[112].

В алгебре вероятностей все эти идеи сформулированы в общих терминах и выражены формулами, которые вы сможете использовать автоматически вместо того, чтобы каждый раз анализировать все с нуля. Мы обсудим эти формулы вычисления вероятностей в контексте вопросов, которые можно задать в случае вытаскивания карт из стандартной колоды (или из двух колод — с синими и зелеными рубашками)[113]. Этот метод позволит нам предоставить вам как конкретные, так и общие формулы, которые вы сможете применить в будущем. Аналогия с извлечением карт поможет вам проанализировать другие вопросы, касающиеся вероятностей, возникающие в иных контекстах. Обратите внимание на следующее: в обычном языке принято выражать вероятности в процентах, но в алгебраических формулах их следует записывать в виде простых или десятичных дробей, то есть вместо 25 % должно быть 13/52, или 0,25. Мы будем использовать разные способы представления вероятностей в зависимости от ситуации, но вы должны отдавать себе отчет, что во всех этих случаях смысл один и тот же.

А. Правило сложения вероятностей

Первый наш вопрос будет звучать так: если бы нам понадобилось вытянуть одну карту из синей колоды, с какой вероятностью мы извлекли бы карту пиковой масти? И какова вероятность того, что она была бы не пикой? Мы уже знаем, что вероятность вытащить пику составляет 25 % (мы определили это ранее). Но какова вероятность вытащить не пику? Она равна вероятности извлечь трефу, черву или бубну вместо пики. Очевидно, что интересующая нас вероятность должна быть больше любой из отдельных вероятностей, из которых она состоит; на самом деле эта вероятность равна 13/52 (трефы) + 13/52 (бубны) + 13/52 (червы) = 0,75. Слово «или» в нашей вербальной формулировке ответа на вопрос указывает на то, что эти вероятности необходимо суммировать, поскольку мы хотим знать шансы вытащить карту из всех этих трех мастей.

Существует и более простой способ ответить на второй вопрос: отметить, что вытаскивание карты не пиковой масти происходит в оставшихся 75 % случаев. Таким образом, вероятность вытащить не пику составляет 75 % (100 % минус 25 %) или, в более формальном виде, 1  0,25 = 0,75. Как часто бывает при вычислении вероятностей, в данном примере один и тот же результат можно получить двумя разными путями, требующими разных размышлений о событии, вероятность которого мы пытаемся найти. Чуть ниже в данном приложении мы увидим и другие примеры, показывающие, что разные методы вычисления вероятностей порой требуют совершенного разного количества усилий. По мере накопления опыта вы откроете для себя и запомните легкие способы или более короткие пути. А пока утешайте себя тем, что каждый из этих путей, если ему неукоснительно следовать, ведет к получению одного и того же конечного результата.

Обобщим наши предыдущие вычисления. Если разделить множество событий Х на ряд подмножеств Y, Z, …, которые не перекрываются (на языке математики они называются непересекающимися), то сумма вероятностей наступления каждого подмножества равна вероятности полного множества событий; если полное множество событий включает в себя все возможные исходы, то его вероятность равна 1. Иными словами, если наступление события Х требует наступления каждого из нескольких непересекающихся событий, то вероятность Х равна сумме вероятностей отдельных событий Y, Z, …. Обозначив вероятность наступления Х как Prob(X) и запомнив предостережения в отношении Х (это событие требует наступления каждого из событий), а также в отношении Y, Z, … (эти события должны быть непересекающимися), можем записать правило сложения вероятностей в математических обозначениях как Prob(X) = Prob(Y) + Prob(Z) + ….

Упражнение. С помощью правила сложения вероятностей найдите вероятность вытаскивания двух одинаковых карт из двух колод (по одной из каждой колоды).

Б. Правило умножения вероятностей

Теперь давайте поставим вопрос так: какова вероятность того, что две извлеченные (по одной из каждой колоды) нами карты окажутся пиковой масти? Это событие наступит в случае, если мы вытащим пику из синей колоды и пику из зеленой. Переход от «или» к «и» в формулировке ответа на вопрос указывает на переход от математической операции сложения к умножению. Таким образом, вероятность вытащить две пики (по одной из каждой колоды) равна произведению вероятностей вытягивания одной пики из каждой колоды, или (13/52)  (13/52) = 1/16 = 0,0625, или 6,25 %. Как и следовало ожидать, мы получим две пики с гораздо меньшей вероятностью, чем одну пику в предыдущем разделе. (Всегда проверяйте, соответствуют ли ваши расчеты интуитивной оценке исхода игры.)

Страницы: «« 4567891011 ... »»

Читать бесплатно другие книги:

В данный том вошли лучшие романы Грандмастера НФ Роберта Хайнлайна 50-х годов XX века.«Звездный деса...
Страшные драконы, несущие разрушения, остались в далеком прошлом? Так думали маги, до того как в гор...
Книга о стратегическом менеджменте. Обо всем, что вам действительно нужно знать, чтобы выжить в усло...
2084 – год действия нового романа Алекса Белла, автора «Мирового правительства».Красочный, полный уд...
В книгу вошли краткие обзорные статьи с отрывками из литературных, исторических, философских памятни...
Как известно, человека, пережившего удар молнии, она одаривает, вскрывая доселе скрытые возможности....