Главная
Диксит Авинаш
Стратегические игры. Доступный учебник по теории игр
Читать онлайн бесплатно

Стратегические игры. Доступный учебник по теории игр Диксит Авинаш

Тем не менее у разных людей может быть разная степень принятия просоциальных предпочтений, и этого может оказаться недостаточно для решения проблем коллективного действия. Многие люди имеют весьма широкое представление о том, что такое социально кооперативное действие в большинстве ситуаций, однако отдельные люди подвержены соблазну пойти на обман. Следовательно, для обеспечения кооперативных действий необходима система внешних санкций или мер наказания. Мы называем правила поведения, которые находят широкое понимание, но не выполняются автоматически, принудительными нормами.

В главе 10 мы подробно описали несколько методов достижения кооперативного исхода в играх категории «дилемма заключенных», в том числе повторение, взыскание (или вознаграждение) и лидерство. Тогда нас главным образом интересовали примеры дилеммы заключенных с двумя участниками. Эти методы (с некоторыми коррективами) применимы и для принудительного выполнения норм в случае проблем коллективного действия в больших группах.

Как мы подчеркивали в главе 10, повторение — самый важный из методов, поэтому мы уделим ему повышенное внимание. Повторение позволяет достичь кооперативного исхода в качестве равновесия действий отдельных игроков в повторяющейся дилемме заключенных посредством создания перспективы того, что обман приведет к прекращению сотрудничества. В более общем плане все, что необходимо для поддержания сотрудничества, — это осознание каждым игроком того, что его личные выигрыши от обмана преходящи и что их место быстро займет более низкий выигрыш по сравнению с тем, что игрок мог бы получить в случае кооперативного поведения. Для того чтобы игроки понимали, что обман им невыгоден в долгосрочной перспективе, он должен быть быстро обнаружен, а последующее наказание (уменьшение будущих выигрышей) — эффективно, неминуемо и болезненно.

В этом отношении у группы есть одно важное преимущество перед парой отдельных людей. У двух человек может и не быть повода часто общаться, но каждый из них, по всей вероятности, будет постоянно взаимодействовать с кем-то из группы. Следовательно, искушение игрока Б обмануть игрока А может подавить страх того, что другие игроки, например В, Г и т. д., с которыми он встретится в будущем, накажут его за это. Экстремальную ситуацию, в которой двустороннее взаимодействие не повторяется, а наказание должна осуществить от чьего-то имени третья сторона, можно описать словами Йоги Берра: «Всегда ходите на похороны других, иначе они не придут на ваши».

Однако у группы, когда речь заходит о поддержании хорошего поведения в ходе повторяющегося взаимодействия, есть ряд недостатков по сравнению с прямым двусторонним контактом. Требуемая скорость и безошибочность обнаружения обмана и наказания мошенников снижается по мере увеличения численности группы. В небольших деревенских общинах можно наблюдать массу примеров успешного сотрудничества, которое было бы немыслимым в большом городе или в штате.

Для начала поговорим о выявлении обмана, что всегда непросто. В большинстве реальных ситуаций выигрыши зависят не только от действий игроков, но и от тех или иных случайных флуктуаций. Даже в игре с двумя участниками один игрок, получив низкий выигрыш, не может быть уверен, что другой его обманул: это могло быть следствием какого-либо случайного события. По мере увеличения количества игроков возникает дополнительный вопрос: если кто-то и обманул, то кто именно? Наказывать кого-то без веских оснований и уверенности в том, что этот человек действительно виновен, не только аморально, но и контрпродуктивно. Мотивация к сотрудничеству ослабевает, если даже кооперативные действия могут по ошибке повлечь за собой наказание.

Кроме того, в играх с большим количеством участников, даже если обман обнаружен и известно, кто на него пошел, об этом необходимо быстро и точно сообщить другим игрокам. Для этого группа должна быть достаточно маленькой либо иметь эффективную сеть коммуникации или распространения слухов. К тому же у игроков не должно быть причин выдвигать против кого-то ложные обвинения.

И наконец, даже после выявления обмана и информирования об этом всех членов группы необходимо как-то наказать обманщика (принудительное выполнение социальной нормы). Зачастую третьей стороне приходится нести определенные личные издержки в связи с осуществлением наказания. Например, если игроку В поручено наказать игрока Б, обманувшего игрока А, то игроку В, возможно, придется пожертвовать прибыльной сделкой, которую он планировал заключить с игроком Б. В таком случае применение наказания само по себе становится игрой с коллективным действием и наличием искушения «уклониться» от исполнения наказания. Общество могло бы организовать второй круг наказаний за уклонение, но это, в свою очередь, обусловит еще одну проблему коллективного действия! Тем не менее создается впечатление, что у людей сформировался инстинкт, благодаря которому они получают личное удовлетворение от наказания обманщиков, даже если сами не являются их жертвами[195]. Интересно, что принцип «даже несмотря на высокие личные издержки, необходимо ввести санкции по отношению к нарушителям принудительных социальных норм», по всей вероятности, сам стал общепринятой нормой[196].

Действие норм усиливается, когда подавляющее большинство членов общества их придерживается, и теряет силу, если они часто нарушаются. До появления государства всеобщего благосостояния, когда люди, столкнувшись со сложными экономическими временами, вынуждены были полагаться исключительно на помощь семьи, друзей и ближайших членов малой социальной группы, трудовая этика представляла собой норму, сдерживающую соблазн ослабить собственные усилия и незаслуженно пользоваться поддержкой окружающих. Но как только государство взяло на себя обязательства по обеспечению поддержки и выплаты пособий по безработице, то есть когда предоставление социальной помощи стало обязательным, эта норма трудовой этики утратила силу. После резкого повышения уровня безработицы в Европе в конце 1980-х — начале 1990-х годов значительная доля населения воспользовалась официальной системой социальной поддержки, после чего эта норма ослабла еще больше[197].

В разных обществах и культурных группах могут сформироваться разные соглашения и нормы, направленные на достижение одной и той же цели. На бытовом уровне в каждой культуре есть свой набор хороших манер, таких как приветствие незнакомых людей, выражение благодарности за угощение и т. д. При встрече представителей разных культур между ними могут возникнуть недоразумения. Не менее важно, что в каждой компании или офисе придерживаются своих подходов. Хотя различия между традициями и нормами едва уловимы, многие слияния потерпели неудачу именно из-за конфликта корпоративных культур.

Далее рассмотрим коллективные игры в виде игры в труса. Здесь характер способа решения проблемы коллективного действия зависит от того, будет ли получен максимальный социальный выигрыш, если каждый член группы примет участие в совершении соответствующего действия (в разделе 1.Б эта игра обозначена как версия I игры в труса) или если кто-то сотрудничает, а кому-то можно отказаться от него (версия II игры в труса). В первой версии игры в труса, в которой каждый игрок заинтересован уклониться от выполнения действия, проблема очень напоминает проблему поддержания сотрудничества в дилемме заключенных, поэтому все приведенные выше комментарии в ее отношении применимы и к этой игре. Вторая версия игры в труса отличается: в чем-то она легче, а в чем-то сложнее. После распределения ролей между участниками и уклонистами ни у кого нет личного стимула сменить стратегию: если другому водителю поручена роль «ехать прямо», то вам лучше свернуть, и наоборот. Следовательно, если в силу традиции необходимо достичь равновесия, его можно обеспечить без дальнейшего социального вмешательства, например, в виде санкций. Но при таком равновесии игроки, уклоняющиеся от совершения действия, получают более высокие выигрыши, чем выполняющие его. Подобное неравенство способно создать проблемы в данной игре: серьезные конфликты и противоречия могут поставить под угрозу саму структуру общества. Часто такая проблема решается посредством повторения. Роли тех, кто участвует в совершении действия, и тех, кто уклоняется от них, можно поочередно менять, чтобы уравновесить выигрыши в долгосрочной перспективе.

Иногда проблема дифференцированных выигрышей во второй версии дилеммы заключенных или игры в труса «решается» не путем восстановления равенства, а посредством притеснения или принуждения, когда доминируемая подгруппа общества вынуждена принять более низкий выигрыш, тогда как доминирующая подгруппа получает более высокий выигрыш. На протяжении всей истории человечества во многих обществах работу по разделке туш животных в принудительном порядке поручали определенным подгруппам или кастам. Наглядный пример этой практики — дискриминация расовых и этнических меньшинств или женщин. Как только устанавливается такая система, ни один член притесняемой группы не может ничего сделать, чтобы повлиять на ситуацию. Угнетенные должны объединить усилия и действовать как единая группа, чтобы изменить всю систему, что само по себе представляет еще одну проблему коллективного действия.

И наконец, рассмотрим роль лидерства в решении проблем коллективного действия. В главе 10 мы отмечали, что, если в игре участвуют игроки разного масштаба, дилемма заключенных может исчезнуть сама по себе, поскольку более крупный игрок может быть заинтересован в продолжении сотрудничества и по этой причине примет обман более мелкого игрока. Здесь же мы отдаем должное другому типу величия — величию сердца. Хотя у людей в большинстве групп разные предпочтения, во многих группах есть один или несколько человек, получающих истинное удовлетворение от личного вклада в благополучие всей группы. Если таких людей достаточно для выполнения текущей задачи, то проблема коллективного действия исчезает. Большинство школ, церквей, местных больниц и других важных для общества учреждений полагаются на работу волонтеров. Это решение, как и многие другие, более эффективно в небольших группах, где результаты действий их членов непосредственно видны их благодетелям, которые заинтересованы в умножении добрых дел.

В. Практическое применение

В книге «Управляя общим» Элинор Остром приводит ряд примеров решения проблем общих ресурсов на местном уровне. Большинство из них предполагают использование особенностей конкретной ситуации для создания системы обнаружения проблем и наказания виновных. Например, между членами одной рыбацкой общины на побережье Турции применяется такой метод, как ротация участков для вылова рыбы. Человек, получивший разрешение ловить рыбу на определенном участке, сразу же заметит и сообщит о нарушителе, который попытается рыбачить на том же участке. Многие другие пользователи ресурсов, находящихся в общей собственности, в том числе общинных пастбищ в средневековой Англии, на самом деле ограничивали к ним доступ и боролись с их чрезмерной эксплуатацией, предоставляя сложные, негласные, но вполне понятные права отдельным людям. В каком-то смысле такое решение позволяет обойти проблему общих ресурсов, разделив ресурс на несколько более мелких единиц, находящихся в частной собственности.

Самая поразительная особенность примеров Остром — их огромное разнообразие. Одни дилеммы заключенных, касающиеся использования общих ресурсов, которые изучала Остром, были решены посредством частной инициативы группы людей, вовлеченных в соответствующую дилемму; другие — путем внешнего вмешательства со стороны общественности или правительства. Иногда дилемма не решалась вообще и группа оставалась в ловушке исхода, при котором все ее члены предпочитали уклониться от решения проблемы. Тем не менее, несмотря на кажущееся разнообразие, Остром выделяет ряд общих характеристик, облегчающих проблему решения дилемм заключенных в контексте коллективного действия: 1) обязательно наличие поддающейся идентификации и стабильной группы потенциальных участников; 2) преимущества сотрудничества должны быть достаточно заманчивыми, чтобы это могло покрыть все затраты на мониторинг и принудительное соблюдение правил сотрудничества; 3) важно, чтобы члены группы могли взаимодействовать друг с другом. Последнее условие обеспечивает достижение нескольких целей. Во-первых, такая коммуникация помогает установить четкие нормы: все знают, какого поведения от них ожидают, какой обман недопустим и какие санкции будут применены по отношению к обманщикам. Кроме того, наличие коммуникации позволяет информировать об эффективности обнаружения механизма обмана, что способствует росту доверия между членами группы и устранению любых подозрений любого участника, если он считает, что придерживается установленных правил, тогда как другие их безнаказанно нарушают. И последнее: коммуникация между членами группы позволяет им отслеживать эффективность действующих договоренностей и по мере необходимости улучшать их. Все эти требования поразительно напоминают выводы, сделанные нами в главе 10 на основании теоретического анализа дилеммы заключенных и информации о турнирах Аксельрода.

Изучение Остром жизни рыбацкой деревни также помогло понять, что можно предпринять, если коллективный оптимум требует, чтобы разные люди выполняли разные действия, с учетом того, что при этом одни будут получать более высокий выигрыш, чем другие. В случае повторяющегося взаимодействия можно организовать ротацию более выгодной позиции среди участников, тем самым гарантируя определенное чувство равенства в долгосрочной перспективе.

По мнению Остром, внешняя сторона, обеспечивающая выполнение установленных правил, не в состоянии достаточно четко и оперативно выявить обман и применить наказание. Поэтому типичная точка зрения, согласно которой для решения проблем коллективного действия необходима централизованная или государственная политика, часто оказывается ошибочной. Еще один пример — сельские общины, или «коммуны», в России конца XIX столетия. Этим коммунам удалось решить многие проблемы коллективного действия в сфере ирригации, севооборота, управления использованием лесов и пастбищ, а также строительства и ремонта дорог и мостов. «Деревня… не была раем в плане общинной гармонии. …Просто коллективная деятельность во многих случаях отвечала личным интересам отдельных крестьян». Реформаторы царского правительства начала XX века, так же как и советские революционеры 1920-х годов, потерпели неудачу не только потому, что старая система настолько овладела умами крестьян, что они сопротивлялись всему новому, но еще и потому, что реформаторы не смогли понять роль некоторых широко распространенных практик в решении проблем коллективного действия, а потому и не сумели заменить их равноценными альтернативами[198].

Различия между маленькими и большими группами хорошо проиллюстрировал Авнер Грейф, сравнивший две группы торговцев в странах средиземноморского бассейна в средневековые времена. Магрибские торговцы представляли собой группу еврейских купцов, которые полагались на большую семью и прочные социальные связи. Если один член группы обманывал другого, жертва обмана сообщала об этом остальным, рассылая письма. При наличии веских доказательств вины больше ни один член группы не вел дел с обманщиком. Система была прекрасно налажена и хорошо работала в случае мелкой торговли. Но когда торговля распространилась по всем странам Средиземноморья, система коллективного контроля помешала дальнейшему развитию магрибской торговли: группа не смогла найти достаточно близких или надежных доверенных лиц, чтобы использовать в этих странах новые торговые возможности.

Напротив, генуэзские торговцы создали более официальную правовую систему. Любой контракт необходимо было регистрировать в центральных органах власти в Генуе. Тот, кто становился жертвой обмана или нарушения контракта, должен был направить жалобу в органы власти, которые проводили расследование и взимали с обманщиков надлежащие штрафы. Эту систему, при всех ее проблемах с обнаружением обмана, можно было без труда модифицировать в случае расширения торговли[199]. По мере роста экономики и мировой торговли мы наблюдаем аналогичный переход от сплоченных групп к более отстраненным торговым отношениям и от обеспечения выполнения правил на основании повторяющегося взаимодействия к применению официального законодательства.

Идея о том, что небольшие группы более эффективно решают проблемы коллективного действия, стала основной темой книги Манкура Олсона The Logic of Collective Action («Логика коллективного действия»)[200] и позволила сделать одно важное наблюдение в политологии. В демократическом обществе все избиратели имеют равные политические права, поэтому предпочтения большинства должны доминировать. Однако известно немало случаев, когда этого не происходит. Как правило, та или иная политика имеет положительные последствия для одних групп и отрицательные для других. Для того чтобы добиться принятия предпочтительной для себя политики, группа должна предпринять определенные политические действия, такие как лоббирование, распространение информации, пожертвования на ведение избирательной кампании и т. д. Но для этого группа должна решить проблему коллективного действия, поскольку каждый ее член может попытаться уклониться и извлечь для себя выгоду из действий других членов группы. Если небольшие группы лучше справляются с этой проблемой, то политический курс, проистекающий из политического процесса, будет отображать их предпочтения, даже несмотря на то что другие группы, которым не удалось создать организованную структуру, более многочисленны и терпят убытки, размер которых превышает прибыль успешных групп.

Наиболее яркий пример политических мер, отображающих предпочтения организованной группы, связан с торговой политикой. Действующие в стране ограничения на импорт помогают отечественным производителям, чьи товары конкурируют с импортными, но ущемляют интересы потребителей обеих категорий товаров, поскольку цены на них выше, чем были бы в случае отсутствия ограничений на импорт. Отечественных производителей немного, а потребители — почти все население, и, как правило, общая сумма их убытков гораздо больше общего объема прибыли производителей. Политические соображения, основанные на численности электората, и экономические соображения, такие как прибыли и убытки, позволяют рассчитывать на победу потребителей на этой политической арене или хотя бы на какую-то поддержку идеи о том, что ограничения на импорт следует отменить, однако этого не происходит. Более мелкие и сплоченные ассоциации производителей могут лучше организовать выполнение политического действия, чем многочисленные, но разрозненные потребители.

Более 70 лет назад американский политолог Элмер Шаттшнайдер впервые представил подробное документальное подтверждение и анализ влияния политического давления на торговую политику. Он признал тот факт, что «способность группы к самоорганизации существенно сказывается на ее деятельности», но не разработал системную теорию того, что именно определяет такую способность[201]. Анализ Олсона и других исследователей улучшил наше понимание этого вопроса, однако триумф политического давления над экономикой продолжается в торговой политике до сих пор. Например, в конце 1980-х годов политика США в области производства сахара обошлась каждому из 240 миллионов жителей страны в 11,5 доллара в год, что в общей сложности составило 2,75 миллиарда долларов; при этом доход около 10 000 фермеров, выращивающих сахарную свеклу, увеличился на 500 000 долларов в расчете на одного фермера, или в целом на 1 миллиард долларов. Чистый убыток американской экономики составил 1,75 миллиарда долларов[202]. Каждый неорганизованный потребитель продолжает молча нести свою небольшую долю издержек; многие даже не осознают, что платят за свое пристрастие к сладкому на 11,5 доллара в год больше.

Если наш обзор теории и практики решения проблем коллективного действия кажется вам слишком разноплановым и не содержащим четкого краткого описания сути происходящего, то это потому, что сами проблемы столь же разнообразны и решение каждой из них зависит от ее специфики. Единственный общий вывод, который мы можем сделать, касается понимания того, насколько важно предоставить право самим участникам коллективного действия найти решение, воспользовавшись локальным знанием ситуации, возможностью мониторинга действий других членов общества, направленных на сотрудничество или уклонение от него, а также шансом применить санкции к уклоняющимся посредством различных вариантов непрерывного взаимодействия в рамках данной социальной группы.

В заключение хотелось бы высказать одно предостережение. Возможно, после обсуждения проблем коллективного действия у вас появится ощущение, что личная свобода неизменно приводит к пагубным результатам, которые можно и нужно исправлять с учетом социальных норм и санкций. Но не стоит забывать, что, кроме проблем коллективного действия, общество сталкивается и с другими проблемами, причем некоторые из них лучше решать посредством личной инициативы, а не совместных усилий. Общество может быть слишком консервативным и автократическим, оказавшись в ловушке своих норм и традиций и подавляя инновации, которые зачастую становятся ключом к экономическому росту. Коллективное действие может стать коллективным бездействием[203].

5. «Помогите!»: игра в труса со смешанными стратегиями

В ходе анализа проблем с коллективным действием в контексте игры в труса мы рассматривали только равновесия в чистых стратегиях. Однако из главы 7 мы знаем, что в таких играх есть также равновесия в смешанных стратегиях. В задачах с коллективным действием каждый участник думает: «Мне лучше подождать, пока наберется достаточное количество желающих поучаствовать, тогда я мог бы уклониться от этого; хотя, опять же, они тоже могут отказаться, и тогда мне придется вмешаться». Смешанные стратегии прекрасно отображают характер подобных колебаний. Наша последняя история — весьма драматичный, возможно, даже жуткий пример применения такого равновесия в смешанных стратегиях.

В 1964 году в Нью-Йорке (в районе Кью-Гарденс, Квинс) в результате зверского нападения, длившегося более получаса, была убита женщина по имени Китти Дженовезе. Все это время она кричала, но, несмотря на то что многие слышали ее крики, а три человека даже были свидетелями происходящего, никто не поспешил ей на помощь и даже не вызвал полицию.

История произвела сенсацию, и сразу же нашлось несколько теорий, объясняющих случившееся. Пресса и большая часть общественности увидели в этом случае подтверждение их убежденности в том, что ньюйоркцы (или жители мегаполисов, или американцы, или люди вообще) совершенно безразличны к судьбе ближнего.

Тем не менее даже небольшой самоанализ или наблюдение убедят вас в том, что люди заботятся о благополучии других, даже незнакомых, людей. Социологи предложили иное объяснение произошедшего под названием плюралистическое неведение. В его основе лежит следующая идея: никто не может быть уверен в том, что именно происходит, действительно ли нужна помощь и в каком объеме. Люди смотрят друг на друга в поисках подсказок или советов по таким вопросам и в этом свете пытаются интерпретировать поведение окружающих. Если они видят, что никто ничего не предпринимает, они делают вывод, что помощь, скорее всего, не нужна, и по этой причине тоже самоустраняются. Это объяснение обладает определенной интуитивной привлекательностью, но неубедительно в случае Китти Дженовезе. Можно с высокой степенью уверенности предположить, что кричащей женщине нужна помощь. Что думали при этом очевидцы? Что в их мрачном районе снимают кино? Если да, то где прожекторы, камеры, режиссер и прочие члены съемочной группы?

Более подходящее объяснение сводилось бы к тому, что, хотя каждый очевидец пережил настоящий шок от увиденного и получил бы истинное личное удовольствие, если бы Китти удалось спасти, он должен привести это в соответствие с издержками участия в происходящем. Ведь придется назвать свое имя, позвонив в полицию, затем выступить в суде в качестве свидетеля и т. д. Таким образом, мы видим, что каждый человек может решить, что ему лучше подождать, пока в полицию позвонит кто-то другой, в надежде на то, что сам он получит преимущество «безбилетника» в виде удовлетворенности в связи с успешным спасением жертвы.

У социальных психологов несколько иная версия идеи «безбилетника», которую они обозначают термином диффузия ответственности. Согласно ей все люди, вовлеченные в сложившуюся ситуацию, понимают, что помощь необходима, но поскольку не поддерживают прямых контактов друг с другом, не могут договориться о том, кто именно ее окажет. Каждый человек может считать, что ответственность за оказание помощи лежит на ком-то другом. Чем больше группа, тем выше вероятность того, что каждый человек понадеется, что поможет кто-то другой и это позволит ему оградить себя от возможных проблем и издержек в будущем.

Социальные психологи провели ряд экспериментов для проверки этой гипотезы. Они разыгрывали ситуации, в которых кому-то требовалась помощь разных типов, в разных местах, в присутствии разных групп людей. Среди прочего авторы экспериментов обнаружили, что чем больше толпа, тем меньше вероятность получить помощь.

Концепция диффузии ответственности объясняет этот вывод, но не до конца. Согласно ей, чем больше толпа, тем меньше вероятность того, что один человек поможет. Хотя из большого количества людей нужен всего один человек, который начал бы действовать, вызвал полицию и тем самым оказал помощь. Но чтобы снизилась вероятность того, что хотя бы один человек поможет, нужно, чтобы вероятность того, что любой человек поможет, снижалась достаточно быстро, чтобы компенсировать общее количество потенциальных помощников. Для того чтобы выяснить, действительно ли это так, понадобится анализ на основании теории игр, который мы проведем ниже[204].

Мы рассмотрим только один аспект диффузии ответственности, когда не происходит осознанная координация действий, и оставим в стороне остальные сложности в связи с информацией и выводом. Таким образом, мы будем исходить из следующего предположения: все считают, что помощь необходима и это стоит понесенных издержек.

Допустим, группа насчитывает N человек. Действие приносит каждому из них выгоду B. Для его совершения нужен всего один человек; большее количество будет избыточным. Любой, кто предпримет необходимое действие, понесет при этом издержки C. Мы исходим из того, что B > C, то есть любому члену группы стоит потратить какие-то усилия на совершение действия, даже если больше никто этого не сделает. Таким образом, необходимость выполнить действие абсолютно обоснованна.

Проблема в том, что любой, кто предпримет действие, получит выигрыш B, но понесет издержки C (то есть чистый выигрыш составит B — C), тогда как он получил бы более высокий выигрыш B, если бы это действие совершил кто-то другой. Следовательно, у каждого члена группы есть соблазн переложить задачу на кого-то другого, а самому воспользоваться преимуществами достигнутого в итоге результата. Каким будет равновесие или исход игры, если так рассуждают все N членов группы?

Если N = 1, то это не столько игра, сколько проблема принятия решения одним человеком. Он получит выигрыш B — C > 0, если выполнит необходимое действие, и выигрыш 0, если не сделает этого. Поэтому он решает помочь.

Если N > 1, мы имеем игру в стратегическое взаимодействие с несколькими равновесиями. Давайте начнем с исключения некоторых возможностей. При N > 1 не может быть равновесия Нэша в чистых стратегиях, при котором все члены группы совершают необходимое действие, поскольку тогда любому из них было бы выгоднее стать «безбилетником». Точно так же не может быть равновесия Нэша в чистых стратегиях, когда никто не совершает необходимого действия, так как при условии, что никто ничего не станет делать (вспомните, что, согласно предположению Нэша, каждый игрок воспринимает стратегии других игроков как факт), ни одному человеку нет смысла действовать.

Тем не менее равновесия Нэша, в которых действие предпримет в точности один человек, все же существуют; на самом деле есть ровно N таких равновесий, по одному на каждого члена группы. Однако, когда каждый человек принимает решение в индивидуальном порядке, отдельно от остальных, нет никакого способа договориться о том, кто именно совершит необходимое действие. Даже если бы члены группы предприняли попытку такой координации, они могли бы при обсуждении, кто несет ответственность за совершение действия, не прийти к единому мнению, во всяком случае пока еще остается время для оказания помощи. Следовательно, интерес представляет только анализ симметричных равновесий, в которых у всех членов группы одинаковые стратегии.

Мы уже видели, что не может быть равновесия, при котором все N членов группы придерживались бы одной и той же чистой стратегии. Значит, мы должны выяснить, возможно ли равновесие, при котором все они придерживались бы одной и той же смешанной стратегии. На самом деле смешанные стратегии весьма привлекательны в данном контексте. Члены группы изолированы друг от друга, и каждый пытается угадать, что будут делать другие. Каждый размышляет так: «Может, мне следует позвонить в полицию… но вдруг это сделает кто-то другой… а если никто этого не сделает?» Каждый член группы в какой-то момент прерывает эту цепочку рассуждений и делает последнее, о чем подумал, но у нас нет способа определить, что именно это будет. В смешанной стратегии также присутствует этот принцип цепочки догадок, которая прерывается в произвольный момент времени.

Итак, допустим, что P — это вероятность того, что любой из членов группы не станет предпринимать необходимое действие. Если один человек готов смешать стратегии, ему должно быть безразлично, какую именно из двух чистых стратегий выбрать — действовать или нет. Совершение действия гарантированно обеспечит ему выигрыш (B — C), а отказ — выигрыш 0, если ни один из оставшихся (N — 1) членов группы не станет действовать, и выигрыш B, если хотя бы один человек предпримет необходимое действие. Поскольку вероятность того, что любой из членов группы не станет действовать, равна P, и учитывая, что они принимают решения независимо друг от друга, вероятность того, что никто из оставшихся (N — 1) членов группы не станет действовать, составит P^{N — 1}, а вероятность того, что хотя бы один человек выполнит необходимое действие, равна (1 — P^{N — 1}). Следовательно, ожидаемый выигрыш одного человека в случае, если он не будет действовать, равен

0 P^{N — 1} + B(1 — P^{N — 1}) = B(1 — P^{N — 1}).

И ему безразлично, предпримет он необходимое действие или нет, при таком условии:

Обратите внимание, как условие безразличия одного отдельно взятого игрока определяет вероятность, с которой другие игроки будут смешивать свои стратегии.

Получив вероятность равновесной комбинации стратегий, мы теперь можем проанализировать, как она меняется по мере изменения численности группы N. Помните, что C/B < 1. По мере увеличения N от 2 до бесконечности степень 1/(N — 1) снижается от 1 до 0. В таком случае C/B, взятое в этой степени (то есть P), увеличивается от C/B до 1. Вспоминаем, что P — это вероятность того, что ни один член группы не совершит необходимого действия. Следовательно, вероятность, что кто-нибудь из членов группы предпримет необходимое действие (а именно 1 — P), снижается от 1 — C/B = (B — C)/B до 0[205].

Иными словами, чем больше людей, тем ниже вероятность, что кто-нибудь из них предпримет необходимое действие. На интуитивном уровне это правильно и вполне соответствует концепции диффузии ответственности. Однако это не позволяет нам сделать вывод, что в более многочисленной группе вероятность оказания помощи меньше. Как было сказано выше, помощь требует действий только одного человека. Поскольку увеличивается количество людей, каждый из которых предпримет необходимое действие с убывающей вероятностью, мы не можем прийти к однозначному выводу, что вероятность того, что хотя бы один человек будет действовать, уменьшится. Для того чтобы понять, так ли это, понадобятся дополнительные вычисления.

Учитывая, что N членов группы в случайном порядке, независимо друг от друга, выбирают стратегии в равновесии Нэша, вероятность Q того, что ни один из них не окажет помощи, составляет

Когда N увеличивается от 2 до бесконечности, N/(N — 1) уменьшается от 2 до 1, а значит, Q увеличивается от (C/B)² до C/B. Соответственно, вероятность того, что как минимум один человек поможет (то есть 1 — Q), уменьшится от 1 — (C/B)² до 1 — C/B.

Итак, наши точные расчеты подтверждают гипотезу: чем больше группа, тем меньше вероятность предоставления помощи. Однако вероятность не снижается до нуля даже в очень больших группах, а вместо этого выходит на один уровень, принимая определенное положительное значение, а именно (B — C)/B, зависящее от преимуществ и издержек данного действия для каждого члена группы.

Мы видим, как анализ, основанный на теории игр, подтверждает идеи из области социальной психологии, с которых мы начали. Теория диффузии ответственности позволяет нам пройти часть пути, а именно до вывода о том, что любой человек с меньшей вероятностью совершает необходимое действие, становясь частью более крупной группы. Однако требуемый вывод о том, что более крупные группы с меньшей вероятностью оказывают помощь, нуждается в более точном вычислении вероятности на основании анализа смешивания стратегий каждым отдельно взятым членом группы и полученного в итоге интерактивного равновесия в данной игре.

А теперь хотим спросить: неужели смерть Китти Дженовезе была напрасной? Неужто теории плюралистического неведения и диффузии ответственности, а также игры «безбилетников» по-прежнему проявляются в снижении вероятности действия отдельного человека в постоянно растущих больших городах? Возможно, и нет. Джон Тирни из New York Times публично восхвалял достоинства «городских героев»[206], которые воспитывают в людях цивилизованность посредством немедленного наказания тех, кто демонстрирует неприемлемое поведение — разбрасывает мусор, шумит и вообще относится к категории отбросов общества, заслуживающих порицания. Такие «городские герои», по сути, блюстители выполнения норм сотрудничества в обществе. Анализируя действия известных «героев», Тирни напоминает всем нам: «Необходимо мобилизовать новых героев! В это самое мгновение люди зря тратят время на чтение, тогда как на улицах попираются нормы. …Вы живете не одни в этом мире! Вы обеспечили выполнение нормы сегодня?» Другими словами, нам необходимы социальные нормы, а также избранные люди, которые сделали норму соблюдения норм смыслом своей жизни.

Резюме

Как правило, в играх со многими участниками присутствуют проблемы коллективного действия. Общую структуру коллективных игр можно представить в виде дилеммы заключенных, игры в труса или игры в доверие. Самая большая трудность, связанная с такими играми в любой форме, состоит в том, что равновесие Нэша, проистекающее из рационального выбора отдельных игроков, может не быть социально оптимальным исходом, который максимизирует сумму выигрышей всех игроков.

Когда в играх с коллективным действием действие одного игрока оказывает влияние на выигрыши всех остальных игроков, проявляются внешние эффекты, или экстерналии. Они могут быть положительными или отрицательными и способны привести к продиктованным личными интересами исходам, которые не будут социально оптимальными. Когда действия создают отрицательные сопутствующие эффекты, с точки зрения общества в целом они чересчур активно применяются; когда действия обусловливают положительные сопутствующие эффекты, они недостаточно активны. При наличии положительных сопутствующих эффектов существует такая дополнительная возможность, как положительная обратная связь; при этом в игре может быть несколько равновесий Нэша.

Проблемы коллективного действия волновали ученых из разных областей науки на протяжении многих столетий. В некоторых ранних трудах говорилось об отсутствии в этой ситуации какой-либо перспективы, тогда как другие предлагали кардинальные решения. Авторы последних работ на эту тему признают, что проблемы коллективного действия возникают в самых разных сферах и их универсального решения не существует. Исследования, проведенные в области социологии, показывают, что социальная традиция, или соглашение, может привести к кооперативному поведению. Другие варианты решений связаны с формированием норм приемлемого поведения. Некоторые из этих норм привносятся в виде выигрышей отдельного человека, другие необходимо обеспечивать в принудительном порядке посредством введения санкций в ответ на некооперативное поведение. Авторы большинства работ по этой теме сходятся во мнении, что небольшие группы более эффективно решают проблемы коллективного действия, чем большие.

В играх, проходящих в крупных группах, имеет место диффузия ответственности, которая может обусловить поведение, когда отдельно взятый человек ждет, чтобы другие выполнили необходимое действие, а он взял на себя роль «безбилетника», то есть извлек выгоду из этого действия. Когда кому-то требуется помощь, вероятность ее предоставления снижается по мере увеличения размера группы людей, которые могут ее оказать.

Ключевые термины

Безбилетник

Внешний эффект

Диффузия ответственности

Замыкание

Маржинальная личная выгода

Маржинальная социальная выгода/p>

Маржинальный сопутствующий эффект

Неисключаемые блага

Неконкурентные блага

Норма

Плюралистическое неведение

Положительная обратная связь

Принуждение

Притеснение

Проблема коллективных действий

Санкция

Соглашение

Сопутствующий эффект

Социальный оптимум

Традиция

Чистое общественное благо

Экстерналия

Упражнения с решениями

S1. Предположим, 400 человек выбирают между действиями X и Y. Относительные выигрыши от этих двух действий зависят от того, сколько из 400 человек выберет действие X и сколько — действие Y. Эти выигрыши отображены на представленном ниже графике, но вертикальная ось не обозначена, а значит, вам неизвестно, что именно показывают эти линии — выигрыши или издержки, связанные с этими двумя действиями.

a) Вам сообщают, что исход, при котором 200 человек выберут действие X, — это неустойчивое равновесие. Если 100 человек уже выбрали действие X, то увеличится или уменьшится со временем количество людей, выбирающих действие X? Почему?

b) Для того чтобы график соответствовал поведению, описанному вами в пункте a, должны ли представленные на нем линии быть обозначены как издержки или выгоды от действий X и Y? Обоснуйте свой ответ.

S2. Группа состоит из 100 членов, каждый из которых выбирает, участвовать ли ему в общем проекте. Если n человек решат участвовать, то каждый получит выгоду p(n) = n, а каждый из (100 — n) уклонившихся получит выгоду s(n) = 4 + 3n.

a) Это пример дилеммы заключенных, игры в труса или игры в доверие?

b) Составьте формулу для определения общей выгоды группы.

c) Покажите в графическом либо в математическом виде, что группа получит максимальную общую выгоду при n = 74.

d) Какие трудности возникнут при попытке привлечь к реализации проекта ровно 74 члена группы и позволить остальным 26 членам группы отказаться от него?

e) Как группа может попытаться преодолеть эти трудности?

S3. Рассмотрим небольшой географический регион с общей численностью населения 1 миллион человек. Каждый человек может выбрать, в каком из двух городов жить, Альфавилле или Бетавилле. Какое-то время преимущества проживания в том или ином городе для каждого человека возрастают по мере роста размера города (в крупных городах более развитая инфраструктура и т. д.), но после какого-то момента начинают уменьшаться (в связи с дорожными заторами и т. п.). Если x — доля людей, которые живут в том же городе, что и вы, ваш выигрыш определяется следующими условиями:

x, если 0 x 0,4,
0,6–0,5x, если 0,4 < x 1.

a) Постройте такой же график, как на рис. 11.11, показывающий преимущества проживания в двух городах, когда доля жителей одного города по сравнению с другим непрерывно меняется от 0 до 1.

b) Равновесие достигается, либо когда оба города населены и их обитатели получают равные выигрыши, либо когда один город (например, Бетавилль) полностью обезлюдел, а жители другого (Альфавилля) получают более высокий выигрыш, чем первый человек, решивший поселиться в Бетавилле. С помощью построенного графика найдите все равновесия Нэша.

c) Теперь рассмотрите динамику процесса адаптации к изменившимся условиям, когда люди постепенно переезжают в город, жители которого уже получают более высокий выигрыш, чем обитатели другого города. Какие из равновесий, найденных в пункте b, сохранят свою устойчивость при такой динамике? Какие окажутся неустойчивыми?

S4. Допустим, в городе с населением 100 человек строится парк развлечений. Для покрытия затрат на строительство необходимы добровольные пожертвования. Каждого жителя просят внести 100 долларов. Чем больше людей внесут свой вклад в строительство парка, тем крупнее он будет и тем больше польза для каждого горожанина. При этом невозможно не допустить в парк тех жителей города, которые не внесли вклад в его создание: они получат свою долю выгоды в любом случае. Предположим, что, когда из всех жителей города n внесут вклад (n может быть любым целым числом от 0 до 100), выгода каждого жителя в денежных единицах составит n² долларов.

a) Допустим, сначала никто не вносит вклад. Будучи мэром города, вы хотели бы, чтобы все горожане сделали пожертвование, и можете уговорить некоторых из них. Какое минимальное количество жителей города вам нужно убедить, чтобы остальные добровольно присоединились к проекту?

b) Найдите равновесия Нэша в игре, в которой каждый житель города решает, вносить ли ему вклад в создание парка.

S5. Используйте идею кейнсианской безработицы, описанную в разделе 3.Г, в игре с соответствующими характеристиками и покажите множество равновесий в игре на графике. Отобразите уровень производства (национальный продукт) на вертикальной оси как функцию уровня спроса (национального дохода) на горизонтальной оси. Равновесие достигается, когда национальный продукт равен национальному доходу, то есть когда функция этих двух показателей пересекает линию под углом 45 градусов. При каких формах этой функции возможно множество равновесий? Почему вероятно существование таких форм в реальности? Предположим, доход увеличивается, когда текущий объем производства превышает текущий доход, и снижается, когда текущий объем производства меньше текущего дохода. Какие равновесия устойчивы и какие неустойчивы при таком динамическом процессе?

S6. Составьте краткое описание стратегической игры со многими участниками, свидетелем или участником которой вы были и в которой выигрыши отдельных игроков зависели от количества других игроков и их действий. Попытайтесь проиллюстрировать ее с помощью графика, если это возможно. Опишите исход реальной игры в свете того, что многие подобные игры приводят к неэффективным исходам. Вы видите признаки такого исхода в вашей игре?

Упражнения без решений

U1. На рис. 11.5 представлены выигрыши в обобщенной коллективной игре с двумя участниками. Там были показаны различные неравенства по алгебраическим выигрышам (p(1) и т. д.), которые делают игру дилеммой заключенных. Вам предстоит найти аналогичные неравенства, соответствующие другим типам игр.

a) При каком условии (условиях) в отношении выигрышей эта игра с двумя участниками представляет собой игру в труса? Какое дополнительное условие (условия) делает эту игру версией I игры в труса (которая показана на рис. 11.3)?

b) При каком условии (условиях) в отношении выигрышей эта игра с двумя участниками представляет собой игру в доверие?

U2. Группе из 30 студентов задали домашнее задание, состоящее из пяти вопросов. Первые четыре вопроса — обычные задачи, решение которых в сумме дает 90 баллов. А пятый вопрос — игра на взаимодействие всей группы. В задании сказано: «Вы можете выбрать, отвечать на этот вопрос или нет. Если решите отвечать, просто напишите: “Это мой ответ на вопрос 5”. Если решите не отвечать на вопрос 5, ваша оценка за выполнение домашнего задания будет зависеть от количества баллов, набранных за первые четыре задачи. Если решите ответить на вопрос 5, ваша оценка будет определяться так: если на вопрос 5 ответит меньше половины студентов группы, вы получите 10 баллов и они будут добавлены к баллам за четыре предыдущие задачи, после чего вы получите общую оценку за выполнение домашнег задания. Если на вопрос 5 ответит половина или больше студентов группы, вы получите 10 баллов и они будут вычтены из вашей оценки за предыдущих четыре вопроса».

a) Постройте график, отображающий выигрыши от двух возможных стратегий — «ответить на вопрос 5» и «не отвечать на вопрос 5», в зависимости от количества студентов, отвечающих на этот вопрос. Найдите равновесие Нэша в этой игре.

b) Какого результата игры вы бы ожидали, если бы она действительно проводилась в вашей группе в колледже? Почему? Проанализируйте два случая: 1) студенты делают выбор в индивидуальном порядке, не общаясь друг с другом; 2) студенты делают выбор в индивидуальном порядке, но могут заранее обсудить его на форуме на сайте группы.

U3. Существует два маршрута передвижения из пункта А в пункт Б. Один — скоростная автомагистраль, а другой — местные дороги. Выигрыш от использования автомагистрали представляет собой постоянную величину, равную 1,8, независимо от количества водителей, которые по ней ездят. Местные дороги перегружены, когда ими пользуется слишком много людей, но если по ним передвигается недостаточное количество машин, некоторые водители рискуют стать жертвами преступлений. Предположим, что когда x водителей выбирают местные дороги, выигрыш каждого из них от поездки по такому маршруту определяется по формуле 1 + 9x — 10x².

a) Постройте график, отображающий преимущества двух маршрутов передвижения как функцию x, рассматривая x в качестве непрерывной переменной, значения которой могут меняться от 0 до 1.

b) На основании графика, полученного в пункте а, определите все возможные равновесные схемы движения транспорта. Какие из этих равновесий устойчивы? Какие неустойчивы? Почему?

c) Какое значение x обеспечивает максимальный выигрыш всей совокупности игроков?

U4. Предположим, группа студентов численностью 100 человек сравнивает две карьеры — юриста и инженера. Инженер получает чистую заработную плату 100 000 долларов в год независимо от того, сколько студентов выберут эту профессию. Юристы обеспечивают работу друг другу, поэтому по мере увеличения их количества растет и уровень их дохода — до определенного момента. В конечном счете конкуренция между юристами приводит к снижению дохода каждого из них. В частности, если есть N юристов, каждый из них получит 100N — N² долларов в год. Годовой объем затрат на ведение юридической практики (офисное помещение, секретарь, помощники юриста, доступ к справочным онлайн-службам и т. д.) составляет 800 000 долларов. Следовательно, при общем количестве N юристов каждый юрист получит чистыми 100N — N² — 800 тысяч долларов в год.

a) Постройте график, на котором чистый доход каждого юриста отображен на вертикальной оси, а количество юристов — на горизонтальной. (Нанесите несколько точек, например для 0, 10, 20, …, 90, 100 юристов. Проведите через эти точки линию или используйте компьютерную программу для построения графиков.)

b) Каковы возможные равновесные исходы этой игры в случае, когда игроки делают выбор без координации действий?

c) Допустим, вся группа решает, сколько студентов должны стать юристами с целью обеспечить максимальный общий чистый доход всей группы. Каким будет количество юристов? (Если у вас есть необходимые навыки, воспользуйтесь дифференциальным исчислением, рассматривая N как непрерывную переменную. Если таких навыков нет, примените графические методы или электронную таблицу.)

U5. Группа из 12 стран рассматривает возможность создания валютного союза. Они по-разному оценивают плюсы и минусы такого шага, но каждая страна выиграет от присоединения к союзу и проиграет, отказавшись от него, если большинство стран вступят в союз. Страны упорядочены по степени их желания присоединиться: страна 1 стремится вступить в союз больше всех, а страна 12 — меньше всех. В распоряжении каждой страны два действия — «вступить в валютный союз» и «не вступать в валютный союз». Пусть B(i, n) = 2,2 + n — i — выигрыш страны с порядковым номером i, когда она выбирает стратегию «вступить в валютный союз» и другие n также выбрали эту стратегию. Пусть S(i, n) = i — n — это выигрыш страны с порядковым номером i, когда она предпочитает стратегию «не вступать в валютный союз», а другие n — стратегию «вступить в валютный союз».

a) Покажите, что для страны 1 «вступить в валютный союз» — доминирующая стратегия.

b) Исключив стратегию «не вступать в валютный союз» из стратегий страны 1, покажите, что «вступить в валютный союз» — доминирующая стратегия для страны 2.

c) Продолжив процесс, покажите, что все страны предпочтут стратегию «вступить в валютный союз».

d) Сравните выигрыши в случае такого исхода с выигрышами, которые получат страны при использовании стратегии «не вступать в валютный союз». Сколько стран оказались в худшем положении в результате создания валютного союза?

Глава 12. Эволюционные игры

* * *

До сих пор мы изучали игры со множеством разных свойств — с одновременными и последовательными ходами; с нулевой и ненулевой суммой; стратегические ходы, позволяющие манипулировать правилами предстоящей игры; однократные, повторяющиеся и даже коллективные игры, в которые одновременно играет большое количество людей. Во всех этих случаях мы опирались на основополагающие правила традиционной теории игр, а именно — что у каждого игрока есть непротиворечивая система ценностей, что он может просчитать последствия своего стратегического выбора и делает выбор, максимально соответствующий его интересам. В процессе обсуждения, особенно при оценке эмпирических данных, мы признавали возможность того, что система ценностей игроков включает в себя заботу о других. А иногда, как при рассмотрении квантильного равновесия в главе 5, допускали, что игроки осознают вероятность ошибок. Но мы исходили из предположения, что каждый игрок делает осознанный и продуманный выбор из имеющихся в его распоряжении стратегий.

Однако появившиеся в последнее время теории ставят это предположение под сомнение. Наиболее обоснованная и убедительная критика исходит от психолога и лауреата Нобелевской премии по экономике 2002 года Даниэля Канемана[207]. По его мнению, у людей есть две различные системы принятия решений. Система 1 — инстинктивная и быстрая, система 2 — расчетливая и медленная. Быстрая инстинктивная система может быть частично заложена в мозг человека в процессе эволюции, но также в значительной степени это результат обширного опыта и практики, что развивает интуицию. Эта система очень важна, поскольку экономит много умственных усилий и времени и часто первой применяется при принятии решения. При наличии достаточного количества времени и внимания ее может дополнить или вытеснить расчетливая и более медленная система. Когда инстинктивная система используется на все случаи жизни, накопленный опыт дополняет результат ее работы и может привести к постепенной модификации инстинкта.

Это подразумевает совершенно иной способ ведения и анализа игр. Игроки вступают в игру с инстинктивной системой 1 и разыгрывают стратегию, которую она им подсказывает, хотя эта стратегия может и не быть (или быть) оптимальной в данной ситуации. Положительный результат подкрепляет инстинкт, тогда как отрицательный способствует его постепенному изменению. Безусловно, результат зависит от того, какие стратегии применяет другой игрок или игроки, что зависит от состояния их инстинктивных систем, а это, в свою очередь, — от их опыта и т. д. Нам необходимо определить, куда ведет такой процесс интерактивной динамики инстинктов. В частности, мы должны выяснить, сходится ли он к выбору фиксированных стратегий, и если да, то как этот выбор согласуется с выбором, который бы предписала медленная система. Биологическая теория эволюции и эволюционной динамики предлагает один подход к этому анализу, его мы и опишем в данной главе.

1. Основные концепции

Биологическая теория эволюции основана на трех фундаментальных принципах: гетерогенность (неоднородность), приспособленность и отбор. Исходное положение состоит в том, что поведение животных в значительной мере генетически предопределено: комплекс из одного или более генов (генотип) обусловливает схему поведения (поведенческий фенотип). Естественное разнообразие генофонда обеспечивает гетерогенность фенотипов в популяции. Одни модели поведения в большей степени соответствуют сложившимся условиям, чем другие; успех фенотипа выражается в виде количественного показателя под названием приспособленность. Люди привыкли думать об успехе так, как о нем говорится в распространенной, но вводящей в заблуждение фразе «выживание наиболее приспособленных», тем не менее высший критерий биологической приспособленности — не выживание, а репродуктивный успех. Именно это позволяет животному передавать свои гены следующему поколению и сохранять свой фенотип. Затем более приспособленные фенотипы становятся относительно более многочисленными в следующем поколении, чем менее приспособленные. Именно этот динамический процесс отбора меняет комбинацию генотипов и фенотипов и, возможно, в конечном счете приведет к формированию устойчивого состояния.

Время от времени спонтанно возникают новые генетические мутации. Многие из них создают модели поведения (фенотипы), которые плохо сочетаются с окружающей средой и поэтому вымирают. Однако иногда мутация приводит к образованию нового фенотипа, более приспособленного к окружающей среде. Такой мутантный ген может захватить популяцию, то есть образовать значительную ее долю.

В любой момент времени популяция может содержать некоторые или все биологически возможные фенотипы. Доля более приспособленных фенотипов будет увеличиваться, некоторые неприспособленные могут исчезнуть, а фенотипы, в настоящий момент не входящие в состав данной популяции, могут попытаться ее захватить. Биологи называют конфигурацию популяции и ее текущих фенотипов эволюционно устойчивой, если ни один мутантный фенотип не может успешно ее захватить. Это статический критерий, но чаще применяется более динамический критерий: конфигурация популяции эволюционно устойчива, если она представляет собой единственно возможный результат динамического процесса отбора, начиная с любой произвольной комбинации фенотипов в данной популяции[208].

Приспособленность фенотипа зависит от взаимодействия отдельного организма с окружающей средой. Например, приспособленность определенной птицы зависит от аэродинамических характеристик ее крыльев, а также от всего комплекса разных генотипов, которые существуют в соответствующей среде: как аэродинамика крыльев птицы соотносится с аэродинамическими свойствами крыльев остальных птиц данного вида. Стало быть, приспособленность определенного животного (с его поведенческими характеристиками, такими как агрессивность и стадность) зависит от того, являются ли другие представители этого вида преимущественно агрессивными или пассивными, живут стаями или поодиночке и т. д. Для наших целей подобное взаимодействие между фенотипами в пределах одного вида — самый интересный аспект всей истории. Иногда представители одного вида взаимодействуют с представителями другого вида; тогда приспособленность определенного типа овец, например, может зависеть от качеств, доминирующих в местной популяции волков. Мы рассмотрим и этот тип взаимодействия, но только после анализа взаимодействия в пределах одного вида.

Все вышесказанное имеет свои параллели в теории игр. Поведение фенотипа можно рассматривать как стратегию животного в его взаимодействии с другими животными, например драться или спасаться бегством. Разница лишь в том, что выбор стратегии осуществляется не в результате целенаправленных расчетов, как в стандартной теории игр, а скорее, это генетически предопределенный вариант фенотипа. Взаимодействие обеспечивает фенотипам выигрыши. В биологии они отображают эволюционную или репродуктивную приспособленность; когда же мы используем эти идеи за пределами биологии, они могут иметь иной смысл, подразумевающий успех в социальных, политических и экономических играх.

Выигрыши или показатели приспособленности можно представить в виде таблицы выигрышей, точно так же, как и в обычной игре. В такой таблице все возможные фенотипы одного животного отображаются в строках матрицы, а другого животного — в столбцах матрицы. Если одновременно взаимодействуют больше животных (в биологии это называется игрой по всему полю), то выигрыши можно представить в виде функций, как в играх с коллективным действием из главы 11. В этой главе мы в основном будем рассматривать пары игроков, а случай со многими игроками кратко проанализируем в разделе 7.

Поскольку популяция представляет собой комбинацию фенотипов, различные пары, выбранные из нее, используют во взаимодействии различные сочетания стратегий. Фактический количественный показатель приспособленности фенотипа — это средний выигрыш, который он получит во всех своих взаимодействиях с другими членами популяции. Животные с более высокой приспособленностью будут иметь более крупный эволюционный успех. Итогом динамики популяции станет ее эволюционно устойчивая конфигурация.

Биологи весьма успешно применили этот подход. Комбинации агрессивного и кооперативного поведения, местоположение гнездовий и многие другие явления, не поддающиеся более традиционному объяснению, можно рассматривать как устойчивые результаты эволюционного процесса отбора более приспособленных стратегий. Интересно, что биологи сформулировали идею эволюционных игр, воспользовавшись уже накопленными знаниями в области теории игр и ее терминами, но при этом изменив предположение об осознанных попытках обеспечить максимальное удовлетворение своих потребностей. Теперь специалисты по теории игр, в свою очередь, используют результаты исследований в области биологических эволюционных игр для обогащения своей области знаний[209].

Действительно, создается впечатление, что теория эволюционных игр — готовая концептуальная модель для изучения двух систем принятия решений Канемана[210]. В других областях применения этой теории, не имеющих отношения к биологии, идею о том, что животные используют генетически заданные стратегии, можно интерпретировать более широко. Во взаимодействии между людьми стратегия может быть заложена в разуме человека по разным причинам, среди которых не только генетика, но и социализация (по всей вероятности, еще более важный фактор), культурное воспитание, образование или эмпирический опыт, основанный на прошлых событиях. Все это может охватывать инстинктивная, быстрая система 1 Канемана. Популяция может состоять из совокупности разных людей с разным происхождением или опытом, под влиянием которого они придерживаются различных стратегий системы 1. Так, некоторые политики стремятся соблюдать определенные моральные или этические нормы, даже рискуя успехом на выборах, тогда как другие озабочены только своим переизбранием. Точно так же некоторые компании могут гнаться исключительно за прибылью, тогда как другие преследуют социальные или экологические цели. В рассматриваемом контексте мы можем назвать все логически возможные стратегии, которые могут быть внедрены таким способом, фенотипом популяции игроков.

Из популяции с ее гетерогенностью встроенных стратегий случайным образом многократно выбираются пары фенотипов для взаимодействия (ведения игры) с другими представителями того же или иного «вида». В каждом взаимодействии выигрыш каждого игрока зависит от стратегий обоих; эта зависимость регулируется обычными «правилами игры» и отображается в таблице или дереве игры. Приспособленность конкретной стратегии определяется как ее совокупный или средний выигрыш, полученный в паре со всеми стратегиями данной популяции. У одних стратегий более высокий уровень приспособленности, чем у других, и в следующем поколении (то есть в следующем раунде игры) их используют больше игроков, что обеспечит их размножение. Стратегии с более низким уровнем приспособленности выберут меньше игроков, поэтому их число постепенно сойдет на нет и они исчезнут. Время от времени кто-то может экспериментировать или выбрать из множества логически возможных стратегий ту, которая еще не применялась. Эта ситуация соответствует появлению мутанта.

Хотя мы используем биологическую аналогию, причина увеличения количества более приспособленных стратегий и исчезновения менее приспособленных отличается от сугубо генетического механизма биологии: игроки, которые добились успеха в предыдущем раунде, передадут информацию друзьям и коллегам, играющим в следующем раунде, а игроки, плохо сыгравшие в предыдущем раунде, увидят, какие стратегии оказались более эффективными, и попытаются их имитировать. Другими словами, процесс целенаправленных размышлений и пересмотра предыдущих эмпирических правил происходит между раундами. Такие «социальные» и «обучающие» механизмы передачи информации гораздо важнее в большинстве стратегических игр, чем любая биологическая генетика; в действительности именно так подкрепляется ориентация законодателей на переизбрание и заинтересованность компаний в максимизации прибыли. И наконец, осознанное экспериментирование с новыми стратегиями замещает случайную мутацию в биологических играх. Постепенный процесс изменений с учетом исходов, опыта, наблюдений и экспериментов образует динамику расчетливой, медленной системы 2 Канемана.

Существует два типа эволюционно устойчивых конфигураций биологических игр. Во-первых, один фенотип может оказаться более приспособленным, чем другие, и популяция может состоять только из него. Такой эволюционно устойчивый результат обозначается термином мономорфизм, что означает «одна (моно) форма (морф)». В этом случае одна преобладающая стратегия называется эволюционно устойчивой стратегией (evolutionary stable strategy, ESS). Во-вторых, у двух или более фенотипов может быть одинаковый уровень приспособленности (и выше по сравнению с некоторыми другими генотипами, не принимающими участия в игре), поэтому они могут сосуществовать в определенных пропорциях. Тогда говорят, что популяция демонстрирует полиморфизм, то есть «множественность (поли) форм (морф)». Такое состояние будет устойчивым, если ни один новый фенотип или возможный мутант не сумеет достичь более высокого уровня приспособленности против данной популяции, чем уровень приспособленности тех типов, которые уже в ней присутствуют.

Полиморфизм очень близок к такому понятию теории игр, как смешанная стратегия. Однако есть одно важное отличие. Для получения полиморфизма ни одному отдельно взятому игроку не нужно придерживаться смешанной стратегии. Каждый член популяции может использовать чистую стратегию, но популяция в целом демонстрирует смешивание стратегий, поскольку различные игроки придерживаются различных чистых стратегий.

Вся эта структура (популяция, возможная комбинация фенотипов, таблица выигрышей при взаимодействии с другими фенотипами и правило эволюции соотношения фенотипов в популяции в зависимости от уровня их приспособленности) образует эволюционную игру. Эволюционно устойчивую конфигурацию популяции можно назвать равновесием в эволюционной игре.

В данной главе мы проанализируем некоторые из этих идей, как обычно, с помощью ряда иллюстративных примеров и начнем с симметричных игр, в которых два игрока находятся в одинаковых условиях. Скажем, два представителя одного вида соперничают друг с другом за пищу или самок или (в области социологии) два выборных чиновника конкурируют за право и дальше занимать соответствующую должность. В таблице выигрышей такой игры каждый игрок может быть выбран в качестве игрока, которому соответствуют строки, или в качестве игрока, которому соответствуют столбцы, — это не повлияет на исход игры.

2. Дилемма заключенных

Предположим, популяция состоит из двух фенотипов. Один включает игроков, которым от рождения свойственно стремление к сотрудничеству: они неизменно работают над достижением исхода, наилучшего для всех. Игроки другого типа не склонны к сотрудничеству и делают все исключительно ради себя. В качестве примера возьмем игру в ценообразование в ресторанах, описанную в главе 5 и представленную в упрощенной версии в главе 10. Здесь мы рассмотрим более простую версию, в которой только два варианта выбора цен: наилучшая цена для обоих ресторанов 26 долларов и цена в случае равновесия Нэша 20 долларов. Ресторатор, настроенный сотрудничать, всегда будет выбирать 26 долларов, тогда как владелец ресторана, предпочитающий отказаться от сотрудничества, — 20 долларов. Выигрыши (прибыль) каждого типа в одной игре этой дискретной дилеммы показаны на рис. 12.1, где воспроизведена таблица с рис. 10.2. Мы называем игроков просто Строка и Столбец, поскольку на месте каждого из них может быть любой ресторатор, который входит в состав популяции и которого выбирают случайным образом как конкурента другого случайно выбранного соперника.

Рис. 12.1. Дилемма заключенных в контексте игры в ценообразование (выигрыши исчисляются в сотнях долларов в месяц)

Не забывайте, что в эволюционном сценарии ни у кого нет выбора между сотрудничеством и отказом от него; каждый «рождается» с тем или иным предопределенным качеством. Какое же качество будет более успешным (более приспособленным) в популяции?

Владелец ресторана, который относится к типу не склонных к сотрудничеству игроков, получает выигрыш 288 (28 800 долларов в месяц) в конкурентной борьбе с аналогичным типом и выигрыш 360 (36 000 долларов в месяц) — с типом, готовым сотрудничать. В свою очередь тип, готовый сотрудничать, получает 216 (21 600 долларов в месяц) в соперничестве с типом, не склонным к сотрудничеству, и 324 (32 400 долларов в месяц) — с аналогичным себе типом[211]. Следовательно, тип, не расположенный к сотрудничеству, имеет более высокий ожидаемый выигрыш (а значит, и уровень приспособленности), чем тип, готовый к сотрудничеству, независимо от их соотношения в популяции.

Опишем эту ситуацию более формально. Пусть x — это доля готовых к сотрудничеству типов в популяции. Рассмотрим ее любого отдельно взятого члена, склонного к сотрудничеству. При случайном выборе вероятность того, что он встретит другого такого же представителя популяции (и получит выигрыш 324) равна x, а вероятность того, что он встретит игрока, не расположенного к сотрудничеству (и получит выигрыш 216), составляет (1 — x). Следовательно, среднестатистический ожидаемый выигрыш типа, склонного к сотрудничеству, равен 324x + 216(1 — x). Для противоположного типа вероятность встретить игрока, готового сотрудничать (и получить выигрыш 360), составляет x, а игрока аналогичного себе типа (выигрыш 288) — (1 — x). Таким образом, среднестатистический ожидаемый выигрыш типа, не склонного к сотрудничеству, составляет 360x + 288(1 — x). Очевидно, что при всех значениях x от 0 до 1 выполняется следующее условие:

360x + 288(1 — x) > 324x + 216(1 — x).

Стало быть, тип, не расположенный к сотрудничеству, имеет более высокий ожидаемый выигрыш и более высокий уровень приспособленности, чем тип, идущий на сотрудничество. Это обусловит увеличение доли этих типов (при этом снижается значение x) от поколения к поколению, пока вся популяция не будет состоять исключительно из типов, не склонных к сотрудничеству.

А что если популяция изначально состоит только из таких игроков? Тогда ни один (экспериментальный) мутант, готовый к сотрудничеству, не сможет в ней выжить и размножиться настолько, чтобы эту популяцию захватить. Иными словами, мутанты, расположенные к сотрудничеству, не добьются успеха в захвате популяции игроков, не склонных к нему. Даже при совсем малых значениях x (то есть когда доля игроков, готовых к сотрудничеству, очень мала) расположенные к сотрудничеству игроки остаются менее приспособленными по сравнению с оппонентами и их доля в популяции не увеличится, а будет сведена к нулю и мутантная линия исчезнет.

Наш анализ показывает, что у типа игроков, не расположенных к сотрудничеству, более высокий уровень приспособленности по сравнению с типом игроков, готовых к сотрудничеству, а также что популяция, состоящая только из игроков первого типа, не может быть захвачена мутантами. Таким образом, эволюционно устойчивая конфигурация популяции мономорфна и состоит из одной стратегии, или фенотипа, — «отказ от сотрудничества». В связи с этим мы называем ее эволюционно устойчивой стратегией для популяции, вовлеченной в данную дилемму заключенных. Обратите внимание, что при анализе этой игры с точки зрения рационального поведения «отказ от сотрудничества» — строго доминирующая стратегия. Этот результат носит общий характер: если в игре есть строго доминирующая стратегия, она обязательно будет эволюционно устойчивой.

А. Повторяющаяся дилемма заключенных

В главе 10 мы говорили о том, что повторение дилеммы заключенных позволяет игрокам, осознанно придерживающимся рационального поведения, сотрудничать ради взаимной выгоды. Давайте посмотрим, есть ли подобная возможность в эволюционной игре. Предположим, каждая выбранная пара игроков разыгрывает дилемму заключенных три раза подряд. Общий выигрыш игрока от такого взаимодействия — это сумма выигрышей, полученных за три раунда.

Каждый отдельный игрок запрограммирован на использование только одной стратегии, но она должна представлять собой исчерпывающий план действий. В игре с тремя ходами стратегия может предусматривать во время второго или третьего раунда выполнение действия, которое зависит от того, что произойдет в первом или втором раунде. Например, «Я буду сотрудничать при любых обстоятельствах» и «Я буду всегда отказываться от сотрудничества при любых обстоятельствах» — это допустимые стратегии. Однако также допустима стратегия «Я начну с сотрудничества и буду продолжать его, если вы сотрудничали во время предыдущего раунда, и откажусь от него во всех последующих раундах, если вы не сотрудничали во время первого». На самом деле эта последняя стратегия — не что иное, как стратегия равноценных ответных действий, или «око за око».

Для простоты анализа в этом разделе мы будем исходить из предположения, что в популяции могут существовать только два типа стратегий: «всегда отказ от сотрудничества» (В) и «око за око» (О). Из популяции случайным образом выбираются пары игроков, после чего каждая пара проводит игру определенное количество раз. Уровень приспособленности каждого игрока представляет собой сумму его выигрышей от всех повторений игры против конкретного соперника. Мы проанализируем, что происходит в случае двух, трех и n таких повторений в каждой паре.

I. Игра с двумя повторениями. На рис. 12.2 представлена таблица выигрышей для игры, в которой встречаются два представителя популяции рестораторов и играют друг против друга в точности два раза. Если оба игрока относятся к типу В, оба откажутся от сотрудничества в обоих случаях, тогда, как показано на рис. 12.1, каждый из них получит выигрыш 288 в каждом раунде игры, то есть в сумме 576. Если оба игрока относятся к типу О, отказа не будет и каждый игрок получит в каждом раунде выигрыш 324, в сумме 648. Если один игрок относится к типу В, а другой к типу О, то во время первого раунда игрок типа В откажется сотрудничать, а игрок типа О будет сотрудничать; в итоге у первого выигрыш составит 360, а у второго — 216. Во время второго раунда оба игрока откажутся сотрудничать и получат выигрыш по 288 каждый. Таким образом, общий выигрыш игрока типа В будет 360 + 288 = 648, а игрока О — 216 + 288 = 504.

Рис. 12.2. Исходы дилеммы заключенных с двумя повторениями (в сотнях долларов в месяц)

В дважды повторяющейся дилемме заключенных мы видим, что стратегия В («всегда отказ от сотрудничества») — слабо доминирующая. Очевидно, что, если популяция состоит только из игроков типа В, мутанты О-типа не смогут ее захватить, поэтому В — эволюционно устойчивая стратегия. Но если популяция включает исключительно игроков типа О, мутанты В-типа не могут добиться большего, чем игроки О-типа. Означает ли это, что стратегия О («око за око») должна быть еще одной эволюционно устойчивой стратегией, подобно тому как в случае анализа этой игры с точки зрения рационального поведения игроков был бы сделан вывод о существовании равновесия Нэша? Ответ: нет. Если популяция изначально состоит только из игроков типа О и в игру вступают немногочисленные мутанты типа В, то последние в основном будут встречаться с игроками преобладающего типа О и получат такие же выигрыши, как и выигрыш игрока типа О в паре с другим игроком типа О. Но иногда мутант типа В будет встречаться с другим мутантом типа В и тогда получит более высокий выигрыш, чем получил бы игрок типа О в паре с игроком типа В. Таким образом, у мутантов немного более высокий уровень приспособленности, чем у представителей преобладающего фенотипа, и это преимущество приводит к увеличению (хотя и медленному) их доли в популяции. Следовательно, мутанты типа В все же могут успешно захватить популяцию, состоящую только из игроков типа О, а значит, эту стратегию нельзя назвать эволюционно устойчивой.

Наши рассуждения основаны на двух критериях определения эволюционно устойчивой стратегии. Во-первых, мы анализируем, получает ли мутант более высокий или низкий результат, чем преобладающий фенотип, когда каждый противостоит игроку преобладающего типа. Если этот первичный критерий дает четкий ответ, значит вопрос решен. Но если первичный критерий дает равный счет, мы используем вторичный критерий, позволяющий определить победителя: добивается ли мутант большего или меньшего, чем преобладающий фенотип, когда каждый противостоит мутанту? Равный счет бывает крайне редко, поэтому обычно необходимости применять вторичный критерий нет, но он есть в резерве для таких ситуаций, как отображенная на рис. 12.2 [212].

II. Игра с тремя повторениями. Теперь предположим, что каждая подобранная пара игроков из популяции (В, О) играет в эту игру три раза. На рис. 12.3 представлены итоговые показатели приспособленности по всем трем раундам для каждого типа игроков в паре с соперниками каждого типа.

Рис. 12.3. Исходы дилеммы заключенных с тремя повторениями (в сотнях долларов в месяц)

Для того чтобы увидеть, как повышаются показатели приспособленности, рассмотрим пару примеров. Когда встречаются два игрока типа О, оба идут на сотрудничество в первом раунде, а значит, оба его продолжат и во втором, и в третьем раундах. При этом игроки каждый раз получают по 324, что в сумме дает каждому из них выигрыш 972 за три месяца. Когда игрок типа О встречается с игроком типа В, второй получает хороший результат в первом раунде (360 в паре с игроком В и 216 в паре с игроком О), но во втором и третьем раундах игрок типа О также отказывается от сотрудничества и каждый из них получает по 288 в обоих раундах (в сумме выигрыш игрока типа В равен 936, а типа О — 792).

Относительная приспособленность двух типов зависит от состава популяции. Если она почти полностью состоит из игроков типа В, то у типа В более высокий уровень приспособленности, чем у типа О (поскольку при встрече игроков типа В в основном с другими игроками типа В они в большинстве случаев получают выигрыш 864, а игроки типа О — 792). С другой стороны, если в популяции преобладают игроки типа О, у типа О более высокий уровень приспособленности, чем у типа В (так как игроки типа О получают выигрыш 972 при встрече в основном с другими представителями типа О, а выигрыш игроков типа В в такой ситуации составляет 936). Уровень приспособленности каждого типа выше, если он уже преобладает в популяции. Следовательно, тип О не может успешно захватить популяцию, состоящую из игроков типа В, и наоборот. Таким образом, существуют две возможные эволюционно устойчивые конфигурации популяции: в одной эволюционно устойчивая стратегия — стратегия В («всегда отказ от сотрудничества»), а в другой — стратегия О («око за око»).

Теперь рассмотрим эволюционную динамику в случае, когда исходная популяция представляет собой комбинацию двух типов. Как распределится ее состав с течением времени? Допустим, доля x в популяции — это игроки типа О, а остальная часть (1 — x) — игроки типа В[213]. Отдельный игрок типа В, выставленный против различных соперников, выбранных из данной популяции, получает выигрыш 936 в противостоянии с игроком типа О, что происходит в x случаях, и выигрыш 864 в противостоянии с другим игроком типа В, что наблюдается в (1 — x) случаях. Это дает следующий ожидаемый выигрыш каждого игрока типа В:

936x + 864(1 — x) = 864 + 72x.

Аналогичным образом отдельный игрок типа О получает такой ожидаемый выигрыш:

972x + 792(1 — x) = 792 + 180x.

Стало быть, уровень приспособленности игрока типа О выше уровня приспособленности игрока типа В, если первый в среднем получает больше, то есть при выполнении следующего условия:

792 + 180x > 864 + 72x,
108x > 72,
x > 2/3.

Иными словами, если более двух третей (67 %) популяции уже принадлежат к типу О, то у игроков этого типа более высокий уровень приспособленности и их доля будет расти, пока не достигнет 100 %. Если в начале игры в популяции менее 67 % игроков типа О, тогда у игроков типа В более высокий уровень приспособленности и доля игроков типа О будет падать, пока не достигнет 0 %, то есть популяция будет полностью состоять из игроков типа В. Эволюционная динамика смещает популяцию к одному из двух крайних состояний, каждое из которых может быть эволюционно устойчивой стратегией. Эта динамика приводит к тому же выводу, что и статический критерий захвата популяции мутантами. Это общее, хотя и не универсальное свойство эволюционных игр.

Таким образом, мы определили две эволюционно устойчивые конфигурации популяции. В каждой из них популяция состоит из игроков только одного типа (то есть мономорфна). Например, если изначально популяция включает 100 % игроков типа О, то даже после появления небольшого количества мутантов В-типа она по-прежнему будет состоять из более чем 66,66…% игроков типа О. Другими словами, тип О останется более приспособленным, а мутирующая линия типа В исчезнет. Точно так же, если изначально популяция на 100 % состоит из игроков типа В, то небольшое количество мутантов типа О (менее 66,66…%) покинет ее, а значит, уровень приспособленности игроков типа В будет выше и мутирующая линия типа О исчезнет. Как мы уже видели ранее, экспериментирующие мутанты типа N не добьются успеха в популяции типов В и О, в основном состоящей из игроков либо В-, либо О-типа.

Но что если в исходную популяцию входит ровно 66,66…% игроков типа О (и 33,33…% игроков типа В)? Тогда у обоих типов одинаковый уровень приспособленности, и мы могли бы назвать эту ситуацию полиморфизмом. Тем не менее на самом деле такая популяция неподходящий кандидат на эволюционно устойчивую конфигурацию и может поддерживать этот слабо сбалансированный исход только до появления мутанта любого типа. По воле случая такой мутант рано или поздно появится, что сместит расчеты приспособленности в пользу мутантного типа, и данное преимущество будет накапливаться до тех пор, пока не будет достигнута эволюционно устойчивая стратегия со 100 % игроков этого типа. Это просто пример применения вторичного критерия определения эволюционной устойчивости. Мы иногда будем в широком смысле говорить о такой конфигурации как о неустойчивом равновесии, для того чтобы сохранить параллель с обычной теорией игр, в которой мутации не учитываются и слабо сбалансированное равновесие может существовать. Однако в рамках строгой логики биологического процесса это вообще не равновесие.

Наши рассуждения можно представить в виде простого графика, очень напоминающего те, которые мы строили при вычислении соотношений в равновесии в смешанных стратегиях с участием игроков, осознанно придерживающихся рационального поведения. Единственное различие — в эволюционном контексте соотношение стратегий, используемых игроками, не вопрос выбора, сделанного любым отдельно взятым игроком, а свойство всей популяции, как показано на рис. 12.4. На горизонтальной оси отображена доля в популяции x (от 0 до 1) игроков типа О. Уровень приспособленности показан на вертикальной оси. Каждая линия отображает уровень приспособленности одного типа. Линия, соответствующая типу О, начинается ниже (в точке 792 по сравнению с 864 в случае линии типа В) и заканчивается выше (972 против 936). Линии пересекаются при x = 0,66…. Направо от этой точки уровень приспособленности типа О выше, поэтому процент игроков данного типа в популяции с течением времени возрастает, а значение x приближается к 1. Точно так же слева от этой точки уровень приспособленности типа В выше, поэтому процент игроков В-типа в популяции с течением времени увеличивается, а значение x приближается к 0. Такие диаграммы — полезный способ наглядного представления данных, поэтому мы будем их широко использовать[214].

Рис. 12.4. Графики уровня приспособленности, а также равновесия в дилемме заключенных с тремя повторениями

Б. Многократно повторяющиеся игры

А что если каждая пара игроков разыграет неоговоренное количество раундов? Давайте сосредоточимся на популяции, состоящей только из игроков типа В и О, в которой взаимодействие между случайно отобранными парами происходит n раз (где n > 2). Таблица общих результатов такой игры представлена на рис. 12.5. Два игрока типа В при встрече всегда отказываются от сотрудничества и всякий раз получают выигрыш 288; иными словами, выигрыш каждого игрока составляет 288n в n раундах игры. Два игрока типа О при встрече начинают с сотрудничества, причем никто из них не отказывается от него первым, а значит, они каждый раз получают выигрыш 324, что в сумме равно 324n. Когда игрок типа В встречается с игроком типа О, в первом раунде игры игрок типа О сотрудничает, а игрок типа В отказывается от сотрудничества и в итоге получает выигрыш 360, а игрок типа О — выигрыш 216. Во всех последующих раундах игрок типа О отвечает отказом на предшествующий отказ игрока В; при этом каждый из них получает выигрыш 288 в оставшихся (n — 1) раундах. Таким образом, тип В в сумме имеет 360 + 288(n — 1) = 288n + 72 в n раундах игры против типа О, тогда как тип О — 216 + 288(n — 1) = 288n — 72 в n раундах игры против типа В.

Рис. 12.5. Исходы дилеммы заключенных с n повторениями

Если доля игроков типа О в популяции равна x, то каждый игрок типа В получает в среднем x(288n + 72) + (1 — x)288n, а типа О — x(324n) + (1 — x)(288n — 72). Следовательно, уровень приспособленности типа О выше, если

x(324n) + (1 — x)(288n — 72) > x(288n + 72) + (1 — x) 288n, 36xn > 72,

Опять же, мы снова получили две мономорфные эволюционно устойчивые стратегии: одна — когда популяция состоит только из игроков типа О (или x = 1 — к этому значению сходится процесс начиная с любого значения x > 2/n), а другая — когда популяция состоит только из игроков типа В (или x = 0 — к этому значению сходится процесс начиная с любого значения x < 2/n). Как показано на рис. 12.4, существует только одно неустойчивое полиморфное равновесие в равновесной точке x = 2/n.

Обратите внимание, что доля игроков типа О в равновесной точке зависит от n: она меньше, когда значение n больше. При n = 10 доля игроков типа О составляет 2/10, или 0,2. Так что, если популяция изначально состоит из 20 % игроков типа О, в ситуации, когда каждая пара проводит 10 повторений игры, доля игроков типа О будет расти до тех пор, пока не достигнет 100 %. Вспомним, что, когда пары проводили три раунда игры (n = 3), игрокам типа О понадобилась более крупная исходная доля в размере не менее 67 %, чтобы достичь аналогичного результата, а в случае всего двух повторений доля игроков типа О в популяции должна была составлять 100 %, чтобы они выжили. (Мы видим причину такого исхода в нашем выражении для вычисления критического значения x, которое показывает, что при n = 2 значение x должно превышать 1, прежде чем уровень приспособленности типа О повысится.) Не забывайте также о том, что популяция, состоящая исключительно из игроков типа О, добивается сотрудничества. Таким образом, оно формируется при выполнении более широкого диапазона исходных условий, когда игра повторяется большее число раз. В этом смысле при большем количестве повторений вероятность сотрудничества увеличивается. То есть ценность установления сотрудничества повышается по мере увеличения длительности периода взаимодействия.

В. Сравнение эволюционной модели и модели рационального игрока

И наконец, вернемся к трижды повторяющейся игре, представленной на рис. 12.3, и вместо использования эволюционной модели проанализируем ее как игру с участием двух игроков, осознанно придерживающихся рационального поведения. Каковы в ней равновесия Нэша? Есть два равновесия в чистых стратегиях, одно — когда оба игрока выбирают стратегию В, а другое — когда оба игрока выбирают стратегию О. Существует также равновесие в смешанных стратегиях, в котором стратегия О используется в 67 % случаев, а стратегия В — в 33 % случаев. Два первых равновесия и есть те мономорфные эволюционно устойчивые стратегии, которые мы нашли, а третье равновесие — это неустойчивое полиморфное эволюционное равновесие. Другими словами, существует тесная связь между эволюционным подходом к таким играм и подходом, основанным на концепции осознанной рациональности игроков.

Это не совпадение. Эволюционно устойчивая стратегия должна быть равновесием Нэша в игре, которую ведут осознанно рациональные игроки, с такой же структурой выигрышей. Для того чтобы в этом удостовериться, предположим на мгновение обратное. Если применение всеми игроками какой-то стратегии (назовем ее S) не приводит к равновесию Нэша, то другая стратегия (назовем ее R) должна обеспечивать более высокий выигрыш одному игроку в игре против стратегии S. Мутант, использующий стратегию R, достигнет более высокого уровня приспособленности в популяции, выбравшей стратегию S, и ему удастся захватить эту популяцию. Следовательно, стратегия S не может быть эволюционно устойчивой. Это равносильно утверждению, что если стратегия S эволюционно устойчива, то она должна быть равновесием Нэша для всех игроков, ее использующих.

Таким образом, эволюционный подход обеспечивает косвенное обоснование рационального подхода. Даже когда игроки не предпринимают осознанных действий, направленных на максимизацию своего выигрыша, если более эффективные стратегии разыгрываются чаще, а менее эффективные исчезают и в итоге процесс сводится к устойчивой стратегии, то исход должен быть таким же, как и исход в случае рациональной игры.

Хотя эволюционно устойчивая стратегия должна быть равновесием Нэша в соответствующей рациональной игре, обратное неверно. Мы привели два примера, подтверждающих этот вывод. В дважды повторяющейся дилемме заключенных на рис. 12.2, основанной на рациональном поведении игроков, стратегия О была бы равновесием Нэша в том слабом смысле, что при выборе ее обоими игроками ни один из них не получит положительной выгоды от перехода к стратегии В. Однако в случае эволюционного подхода стратегия В может возникнуть в качестве мутации и успешно захватить популяцию типа О. А в трижды повторяющейся дилемме заключенных (см. рис. 12.3 и рис. 12.4) рациональная игра приведет к формированию равновесия в смешанных стратегиях. Однако его биологический аналог, полиморфное состояние, могут захватить мутанты, а значит, это равновесие не будет истинным эволюционно устойчивым. Следовательно, биологическая концепция устойчивости может помочь нам при выборе из всего множества равновесий Нэша в рациональной игре.

В нашем анализе повторяющейся игры есть одно ограничение. Изначально мы исходили из допущения о наличии всего двух стратегий, В («всегда отказ от сотрудничества») и О («око за око»). То есть предполагалось, что больше никаких стратегий нет или не может возникнуть вследствие мутации. В биологии типы появляющихся мутаций зависят от генетических факторов. В социальных, политических или экономических играх формирование новых стратегий предположительно определяется историей, культурой и опытом игроков. Кроме того, способность людей усваивать и обрабатывать информацию также должна сыграть свою роль. Тем не менее в нашей модели в данной ситуации ограничения, которые мы накладываем на комбинацию стратегий, возможных в определенной игре, имеют важные последствия в свете того, какие из этих стратегий (если они есть) могут быть эволюционно устойчивыми. Если бы мы допустили в примере с трижды повторяющейся дилеммой заключенных существование стратегии S, которая сводится к сотрудничеству во время первого раунда и отказу от него в ходе второго и третьего, то мутанты типа S могли бы успешно захватить популяцию, состоящую только из игроков типа О, поэтому стратегия О не была бы эволюционно устойчивой. Дальнейший анализ подобной перспективы содержится в примерах в конце данной главы.