Главная
Диксит Авинаш
Стратегические игры. Доступный учебник по теории игр
Читать онлайн бесплатно

Стратегические игры. Доступный учебник по теории игр Диксит Авинаш

Такое соответствие между равновесием Нэша в рациональной игре и устойчивыми исходами игры с аналогичной структурой выигрышей в игре по эволюционным правилам — общая норма; мы увидим ее общий характер ниже в разделе 6. В действительности эволюционная устойчивость обеспечивает дополнительное обоснование для выбора одного из множества равновесий Нэша в играх, основанных на концепции рационального поведения игроков.

При анализе игры в труса с рациональной точки зрения равновесие в смешанных стратегиях казалось несколько озадачивающим. Оно оставляло лазейку для ошибок, которые могли обойтись очень дорого. Каждый игрок ехал прямо в одном случае из двух, а значит, в одном случае из четырех автомобили сталкивались. Равновесие в чистых стратегиях позволяло избежать таких столкновений. В то время это могло навести вас на мысль, что в равновесии в смешанных стратегиях есть нечто нежелательное; может, вы даже задавались вопросом, зачем вообще мы тратим на него время. Теперь вы понимаете причину. На первый взгляд странное равновесие возникает как устойчивый результат естественного динамического процесса, в ходе которого каждый игрок пытается улучшить свой выигрыш в популяции, которой он противостоит.

4. Игра в доверие

Из всех широких классов стратегических игр, представленных в главе 4, мы с эволюционной точки зрения рассмотрели дилемму заключенных и игру в труса. Осталась только игра в доверие. В главе 4 мы проиллюстрировали этот тип игры на примере двух студентов, Гарри и Салли, которые решают, где встретиться, чтобы выпить кофе. В эволюционном контексте каждому игроку свойственна врожденная симпатия либо к Starbucks, либо к Local Latte, а в состав популяции входит определенное число игроков каждого типа. Мы будем исходить из того, что пары игроков, которые мы разделяем на генетические категории мужчин и женщин, каждый день выбираются случайным образом для участия в данной игре. Обозначим стратегии как S (Starbucks) и L (Local Latte). На рис. 12.8 представлена таблица выигрышей при случайном отборе пар игроков; выигрыши те же, что и в таблице на рис. 4.11.

Рис. 12.8. Таблица выигрышей игры в доверие

Если бы это была игра с участием игроков, делающих рациональный выбор, в ней было бы два равновесия в чистых стратегиях: (S, S) и (L, L), причем второе лучше для обоих игроков. Если игроки общаются и координируют свои действия в явной форме, им не составит труда достичь этого равновесия. Однако если они делают выбор независимо друг от друга, им необходимо скоординировать действия посредством сходимости ожиданий, другими словами, отыскав фокальную точку.

В рациональной игре есть третье равновесие — в смешанных стратегиях, которое мы нашли в главе . В нем каждый игрок выбирает Starbucks с вероятностью 2/3 и Local Latte с вероятностью 1/3; ожидаемый выигрыш каждого игрока составляет 2/3. Как было показано в главе 7, этот выигрыш хуже выигрыша в случае менее привлекательного равновесия в чистых стратегиях (S, S), поскольку независимое смешивание стратегий зачастую приводит игроков к противоречивому или плохому выбору. Здесь же вероятность неблагоприятного исхода (выигрыш 0) равна 4/9: два игрока отправляются в разные места почти в половине случаев.

Что происходит в эволюционной игре? Каждый член большой популяции запрограммирован на выбор либо S, либо L. Произвольно отобранным парам таких игроков дается задание попытаться встретиться. Предположим, x — это доля в популяции игроков типа S, а (1 — x) — доля игроков типа L. Тогда уровень приспособленности определенного игрока типа S (его ожидаемый выигрыш от случайной встречи такого рода) составляет x 1 + (1 — x) 0 = x. Аналогично, уровень приспособленности каждого игрока типа L равен x 0 + (1 — x) 2 = 2(1 — x). Следовательно, уровень приспособленности типа S выше при х > 2(1 — x) или x > 2/3, а типа L — при x < 2/3. В равновесной точке x = 2/3 оба типа в равной степени приспособлены.

Как и в игре в труса, те же значения вероятности, которые относятся к равновесию в смешанных стратегиях, полученному в результате рационального выбора, появляются и при ведении игры по эволюционным правилам в виде соотношения типов в популяции при полиморфном равновесии. Однако теперь это смешанное равновесие неустойчиво. Малейшее случайное отклонение доли х от равновесной точки 2/3 запустит кумулятивный процесс, который сместит комбинацию типов в популяции далеко от равновесной точки. Если значение x превысит 2/3, уровень приспособленности игроков типа S повысится и он станет еще быстрее расти количественно, еще больше увеличивая значение x. Если значение x окажется меньше 2/3, уровень приспособленности игроков типа L повысится и он станет еще быстрее расти количественно, еще больше снижая значение x. В итоге значение x либо повысится до 1, либо упадет до 0, в зависимости от вида отклонения. Особенность ситуации состоит в том, что в игре в труса каждый тип был более приспособленным при меньшей доле в популяции, поэтому соотношение типов в ней стремилось от экстремальных значений в равновесной точке, попадающей в средний диапазон. Напротив, в игре в доверие уровень приспособленности каждого типа выше при большем количестве членов соответствующего типа в популяции; риск не встретиться с другим игроком снижается по мере увеличения доли игроков того же типа, поэтому соотношение типов в популяции стремится к экстремальным значениям.

На рис. 12.9, очень похожем на рис. 12.7, представлены графики уровня приспособленности и равновесия в игре в доверие. Две линии отображают приспособленность двух типов в зависимости от их соотношения в популяции. Пересечение линий образует равновесную точку. Единственное отличие — при удалении от равновесной точки более многочисленный тип становится более приспособленным, тогда как на рис. 12.7 это был менее многочисленный тип.

Рис. 12.9. Графики уровня приспособленности, а также равновесия в игре в доверие

Поскольку каждый тип менее приспособлен при небольшой численности, только две крайние мономорфные конфигурации популяции могут находиться в эволюционно устойчивом состоянии. Легко убедиться, что оба исхода — это эволюционно устойчивые стратегии согласно статическому критерию: захват другого типа небольшой популяцией мутантов сойдет на нет, потому что у немногочисленных мутантов более низкий уровень приспособленности. Таким образом, в играх в доверие, или координационных играх, в отличие от игры в труса, эволюционный процесс не сохраняет неблагоприятное равновесие, при котором существует положительная вероятность выбора игроками конфликтующих стратегий. Тем не менее эта динамика не гарантирует сходимости к более благоприятному из двух равновесий, если игра начинается с произвольной исходной комбинации фенотипов, — к чему придет популяция, зависит от того, с чего она начнет.

5. Три фенотипа в популяции

При существовании только двух возможных фенотипов (стратегий) мы можем выполнить проверку на наличие эволюционно устойчивой стратегии путем их сравнения с мутантом одного типа. Динамику популяции в эволюционной игре можно проиллюстрировать с помощью графиков, аналогичных представленным на рис. 12.4, рис. 12.7 и рис. 12.9. Мы покажем, как эти идеи и метод могут быть использованы, когда есть три (или более) возможных фенотипа, а также посмотрим, какие новые особенности при этом возникают.

А. Проверка стратегий на эволюционную устойчивость

Давайте еще раз проанализируем трижды повторяющуюся дилемму заключенных из раздела 12.2.А.II и рис. 12.3 посредством включения третьего возможного фенотипа. Эта стратегия, обозначенная как Н, означает «никогда не отказываться от сотрудничества». На рис. 12.10 приведена таблица приспособленности с тремя стратегиями: В («всегда отказ от сотрудничества»), О («око за око») и Н («никогда не отказываться от сотрудничества»).

Рис. 12.10. Трижды повторяющаяся дилемма заключенных с тремя типами (выигрыши исчисляются в сотнях долларов)

Для того чтобы проверить, будет ли одна из этих стратегий эволюционно устойчивой, проанализируем, могут ли популяцию, состоящую из игроков только одного типа, захватить мутанты одного из двух других типов. Например, популяцию из игроков типа В не могут захватить мутанты типа Н или О, а значит, тип В — это эволюционно устойчивая стратегия. Но популяцию из игроков типа Н мутанты типа В захватить могут; при этом тип Н позволяет одурачить себя трижды (какой позор!). Следовательно, Н не может быть эволюционно устойчивой стратегией.

А как насчет типа О? Популяция только из игроков типа О не может быть захвачена типом В. Однако в противостоянии с мутантами типа Н тип О может оказаться на равных: обратите внимание, что в четырех ячейках таблицы у типов О и Н одинаковые выигрыши. В такой ситуации мутанты типа Н не будут размножаться, но и не вымрут. Небольшая доля мутантов может сосуществовать с популяцией, почти полностью состоящей из игроков типа О. Таким образом, тип О не удовлетворяет ни одному из критериев эволюционно устойчивых стратегий, но демонстрирует некоторую способность сопротивляться захвату.

Мы учитываем способность к адаптации, демонстрируемую типом О в нашем примере, и вводим концепцию нейтральной эволюционно устойчивой стратегии[217]. В отличие от стандартной эволюционно устойчивой стратегии, в которой член основной популяции должен однозначно быть более приспособленным, чем мутант, в популяции с небольшой долей мутантов нейтральная устойчивость требует, чтобы член основной популяции имел как минимум такой же уровень приспособленности, как и мутант. Тогда доля мутантов не увеличивается, а может оставаться на исходном низком уровне. Это и есть случай, когда популяцию только из игроков типа О захватывает небольшое количество мутантов типа Н. В игре на рис. 12.10 присутствует одна стандартная эволюционно устойчивая стратегия (стратегия В) и одна нейтральная эволюционно устойчивая стратегия (стратегия О).

Далее проанализируем ситуацию, в которой популяцию из игроков типа О захватывают мутанты типа Н. Если доля мутантов достаточно мала, оба типа могут благополучно сосуществовать. Однако если количество мутантов составляет слишком большой процент в общей популяции, ее могт захватить мутанты В-типа: игроки типа В добиваются высоких результатов в противостоянии с типом Н, но плохо справляются с типом О. Для большей точности рассмотрим популяцию с долей x игроков типа Н и долей (1 — x) игроков типа О. Уровень приспособленности каждого из этих типов составляет 972. Уровень приспособленности мутанта типа В в этой популяции равен 936(1 — x) + 1080x = 144x + 936. Это больше 972, если 144x > 972–936 = 36, или x > 1/4. Таким образом, тип О может быть нейтральной эволюционно устойчивой стратегией, сосуществующей с небольшой долей мутантов типа Н, но только до тех пор, пока их доля меньше 25 %.

Б. Динамика

Для того чтобы наглядно объяснить динамику в играх с тремя возможными фенотипами, обратимся к еще одной хорошо известной игре «камень, ножницы, бумага» (КНБ). В версии этой игры, основанной на концепции рационального поведения игрока, все участники одновременно выбирают одно из трех возможных действий: камень (сложить кулак), бумага (расправить ладонь) или ножницы (сделать движение двумя пальцами, напоминающее ножницы). Правила игры гласят, что камень побеждает («разбивает») ножницы, ножницы побеждают («режут») бумагу, бумага побеждает («обертывает») камень; при одинаковых движениях будет ничья. Если игроки выбирают разные действия, победитель получает выигрыш 1, а проигравший выигрыш 1; в случае ничьей выигрыш обоих игроков составляет 0.

В качестве примера эволюционной игры рассмотрим ситуацию, с которой сталкиваются пятнистобокие игуаны, обитающие на побережье Калифорнии. Для этого вида характерны три типа поведения самцов при спаривании, причем каждый тип поведения ассоциируется с окраской горла самца. Синегорлые самцы (стражи) охраняют небольшое количество самок и отражают попытки желтогорлых самцов (тихони) прокрасться и спариться с самкой, оставшейся без защиты. Такая стратегия желтогорлого самца эффективна против оранжевогорлых самцов (агрессоров), которые держат большие гаремы и часто преследуют других самцов, как правило, синегорлых, которых оранжевогорлые самцы могут одолеть благодаря своей агрессивности[218]. Взаимодействие между тремя типами самцов можно смоделировать посредством структуры выигрышей игры КНБ, представленной на рис. 12.11, где показаны только выигрыши игрока, которому соответствуют строки. Мы включаем в таблицу столбец для q-комбинации, что позволит нам проанализировать эволюционный эквивалент равновесия в смешанных стратегиях в этой игре, то есть комбинацию типов в популяции[219].

Рис. 12.11. Выигрыши в эволюционной игре с тремя фенотипами

Допустим, q₁ — доля желтогорлых игуан в популяции, q₂ — доля синегорлых игуан, а (1 — q₁ — q₂) — доля оранжевогорлых игуан. В правом столбце таблицы показаны выигрыши каждого игрока строки в противостоянии с такой комбинацией фенотипов, то есть это уровень приспособленности игроков, которым соответствуют строки. Предположим, что в популяции пятнистобоких игуан доля каждого типа увеличивается, когда его приспособленность имеет положительное значение, и уменьшается в случае отрицательного значения[220]. Тогда q₁ повышается только при выполнении условия

— q₂ + (1 — q₁ — q₂) > 0,
q₁ + 2q₂ < 1.

Доля желтогорлых игуан в популяции увеличивается, когда q₂ (доля синегорлых игуан) небольшая или (1 — q₁ — q₂) (доля оранжевогорлых игуан) большая. Это имеет смысл: желтогорлые самцы не особо успешны в противостоянии с синегорлыми, но весьма хороши в противоборстве с оранжевогорлыми самцами. Аналогичным образом q₂ повышается только при выполнении условия

q₁ — (1 — q₁ — q₂) > 0,
2q₁ + q₂ > 1.

Синегорлые самцы добиваются лучших результатов, когда доля желтогорлых соперников большая или оранжевогорлых малая.

Графики на рис. 12.12 наглядно демонстрируют динамику популяции и полученных в итоге равновесий в этой игре. Треугольный сегмент, ограниченный осями координат и линией q₁ + q₂ = 1, содержит все возможные равновесные комбинации q₁ и q₂. В нем есть также две прямые линии. Первая линия (более пологая) — это q₁ + 2q₂ = 1, равновесная линия для q₁; если комбинация q₁ и q₂ ниже этой линии, q₁ (доля желтогорлых самцов) возрастает; если комбинация q₁ и q₂ выше этой линии, q₁ сокращается. Вторая линия (линия с большим наклоном) — это линия 2q₁ + q₂ = 1, равновесная линия для q₂. Справа от нее (когда 2q₁ + q₂ > 1) q₂ возрастает; слева (когда 2q₁ + q₂ < 1) q₂ сокращается. Стрелками обозначены направления изменения соотношений типов в популяциях; серые линии соответствуют типичным динамическим путям. Общая идея та же, что и на рис. 12.10.

Рис. 12.12. Динамика популяции в эволюционной версии игры КНБ

На каждой из двух серых линий один из показателей q₁ и q₂ не возрастает и не уменьшается. Следовательно, их пересечение образует точку, в которой q₁, q₂, а значит, и (1 — q₁ — q₂) — постоянные. Это означает, что эта точка соответствует полиморфному равновесию. Несложно проверить, что в данном случае q₁ = q₂ = 1 — q₁ — q₂ = 1/3. Эти доли типов в популяции эквивалентны вероятностям стратегий в равновесии со смешанными стратегиями в рациональной версии игры КНБ.

Устойчив ли этот полиморфный исход? В общем мы не можем дать однозначного ответа. Динамика указывает на наличие путей (обозначенных на рис. 12.12 в виде эллипса), которые формируются вокруг данного исхода. Разворачиваются ли они по убывающей спирали по направлению к точке пересечения (в таком случае можно говорить об устойчивости) или по расходящейся спирали (что указывает на неустойчивость), зависит от конкретной реакции соотношения типов в популяции на изменение уровня приспособленности. Эти пути могут даже проходить по траектории, изображенной на рис. 12.12, не приближаясь и не отдаляясь от равновесия.

Фактические данные говорят о том, что популяция пятнистобоких игуан вращается вокруг точки полиморфного равновесия с равным соотношением типов; при этом один тип на какой-то период становится более распространенным, но затем более сильный соперник берет над ним верх. Вопрос о том, приближается ли этот цикл к устойчивому равновесию, остается темой дальнейшего изучения. Как минимум один пример такого же взаимодействия, как и в случае КНБ, относится к трем штаммам кишечной палочки, вызывающей пищевые отравления. Каждый штамм бактерии вытесняет любой другой, но вытесняется третьим, как и в игре с тремя типами, о которой шла речь выше. Ученые, изучающие соперничество между тремя штаммами кишечной палочки, доказали, что полиморфное равновесие может быть устойчивым, если взаимодействие между парами остается локальным, а небольшие колонии каждого тамма постоянно перемещаются[221].

6. Игра «ястреб — голубь»

Игра «ястреб — голубь» стала первой изученной биологами в процессе разработки теории эволюционных игр. В ней есть полезные параллели с дилеммой заключенных и игрой в труса, поэтому мы описываем ее здесь, чтобы закрепить и углубить ваше понимание соответствующих концепций.

В игре участвуют не птицы этих двух видов, а двое животных одного и того же вида, а «ястреб» и «голубь» — просто названия их стратегий. Суть игры — соперничество за ресурс. Стратегия «ястреб» агрессивна и направлена на получение всего ресурса стоимостью V. Стратегия «голубь» компромиссна и сводится к готовности разделить ресурс и избежать драки. Когда два игрока типа «ястреб» противостоят друг другу, они вступают в драку. Каждое животное с одинаковой вероятностью (равной 1/2) может либо победить и получить V, либо проиграть, получить травмы и — C. Следовательно, ожидаемый выигрыш каждого игрока равен (V–C)/2. Когда в игру вступают два «голубя», они без драки делят между собой ресурс, поэтому выигрыш каждого из них составляет V/2. Когда игрок типа «ястреб» вступает в противостояние с игроком типа «голубь», последний спасается бегством и получает выигрыш 0, тогда как первый — выигрыш V. На рис. 12.13 представлена таблица выигрышей в этой игре.

Рис. 12.13. Таблица выигрышей для игры «ястреб — голубь»

Анализ этой игры аналогичен анализу дилеммы заключенных и игры в труса, только в ней числовые выигрыши заменены алгебраическими символами. Мы сопоставим равновесия в этой игре, когда игроки рационально выбирают стратегию «ястреб» или «голубь», после чего сравним исходы игры, когда игроки действуют автоматически, а успех вознаграждается более быстрым воспроизводством.

А. Рациональный стратегический выбор и равновесие

1. Если V > C, то это дилемма заключенных, в которой стратегия «ястреб» соответствует стратегии «отказ от сотрудничества», а стратегия «голубь» — стратегии «сотрудничать». Стратегия «ястреб» — доминирующая для каждого игрока, но комбинация стратегий «голубь»/«голубь» — более благоприятный исход для обоих игроков.

2. Если V < C, тогда это игра в труса. Теперь (V–C)/2 < 0, а значит, «ястреб» больше не доминирующая стратегия. В игре два равновесия Нэша в чистых стратегиях: «ястреб»/«голубь» и «голубь»/«ястреб». В игре также есть равновесие в смешанных стратегиях, при котором вероятность p выбора игроком Б стратегии «ястреб» имеет такое значение, которое поддерживает безразличие игрока А в отношении выбора стратегий:

Б. Эволюционная устойчивость при V > C

Начнем с популяции, состоящей преимущественно из «ястребов», и проверим, могут ли ее захватить мутанты типа «голубь». Придерживаясь условных обозначений для подобных игр, мы могли бы выразить долю мутантного фенотипа в популяции как m (от слова «mutant»), но для ясности будем использовать для мутанта типа «голубь» обозначение d (от «dove»). Таким образом, доля «ястребов» в популяции составляет (1 — d). Тогда в противостоянии со случайно выбранным соперником «ястреб» будет встречаться с «голубем» в d случаях и получит V в каждом из них, а также встретится с другим «ястребом» в (1 — d) случаях и получит (V–C)/2 в каждом. Следовательно, уровень приспособленности «ястреба» равен [dV + (1 — d)(V–C)/2]. Аналогичным образом уровень приспособленности одного из мутантов типа «голубь» составляет [d(V/2) + (1 — d)0]. Поскольку V > C, отсюда следует, что (V–C)/2 > 0. Кроме того, V > 0 подразумевает, что V > V/2. В таком случае при любом значении d от 0 до 1 имеем

Стало быть, у «ястреба» более высокий уровень приспособленности, поэтому мутанты типа «голубь» не могут захватить популяцию. Стратегия «ястреб» эволюционно устойчива, а популяция мономорфна (все «ястребы»).

То же самое верно и для любой доли «голубей» в популяции при всех значениях d. Следовательно, какой бы ни была исходная комбинация типов, доля «ястребов» будет расти и они будут доминировать. Кроме того, если исходная популяция состоит только из «голубей», мутанты типа «ястреб» могут ее захватить. Таким образом, эта динамика говорит о том, что «ястреб» — единственная эволюционно устойчивая стратегия. Данный алгебраический анализ подтверждает и обобщает сделанный ранее вывод в числовом примере дилеммы заключенных в контексте игры в ценообразование (см. рис. 12.1).

Стратегические игры. Доступный учебник по теории игр Диксит Авинаш

4. Игра в доверие

5. Три фенотипа в популяции

6. Игра «ястреб — голубь»

7. Взаимодействие всех членов популяции и между разными видами

8. Эволюция сотрудничества и альтруизма

Резюме

Ключевые термины

Упражнения с решениями

Упражнения без решений

Читать бесплатно другие книги: