Думай медленно… Решай быстро Канеман Даниэль
Я изменил процедуру: вместо того чтобы читать каждую работу по отдельности, я проверял ответ на первый вопрос у всех студентов и выставлял оценки, а затем переходил к следующему. Результаты я записывал на предпоследней странице работы, чтобы во время чтения второго ответа меня подсознательно не сбивали уже выставленные оценки. Вскоре после перехода на новый метод я с тревогой отметил, что стал выставлять оценки с меньшей уверенностью, чем раньше, – из-за того, что часто испытывал непривычный дискомфорт. Разочаровавшись во втором ответе, я заглядывал на предпоследнюю страницу, чтобы записать плохую оценку, и временами обнаруживал там высокую оценку за первый вопрос. Также выяснилось, что мне хотелось уменьшить разницу между оценками, изменив еще не записанный результат, и с большим трудом удавалось придерживаться простого правила не поддаваться этому искушению. В моих оценках ответов одного и того же студента часто наблюдался значительный разброс. Отсутствие когерентности раздражало и вызывало во мне неуверенность.
Я стал менее доволен и менее уверен в своих оценках, однако понимал, что это служило хорошим знаком, свидетельствовало о том, что новый метод лучше. Радовавшее меня прежде сходство оценок оказалось ложным и давало ощущение когнитивной легкости; моя Система 2 с безмятежной радостью принимала окончательную оценку. Позволив оценке первого ответа влиять на оценку всех остальных, я не замечал несоответствия, проявлявшегося в отличных ответах студента на одни вопросы и плохих – на другие. Раздражающая несообразность, обнаружившаяся при переходе на новую процедуру выставления оценок, как выяснилось, существует в действительности: она отражала и то, что единичный ответ не может служить адекватной мерой знаний студента, и то, что мои оценки ненадежны.
Мой метод уменьшения эффекта ореола сводится к общему принципу: избавляйтесь от корреляции ошибок! Чтобы понять, как работает этот принцип, представьте, что множеству испытуемых показывают стеклянные банки, заполненные монетками, и просят оценить количество мелочи в каждой банке. Как объяснил Джеймс Шуровьески (James Surowiecki) в своей замечательной книге «Мудрость толпы», с такими заданиями участники, как правило, справляются плохо, но если объединить все единичные суждения, то результат будет неожиданно хорошим. Кто-то переоценивает настоящее количество, кто-то – недооценивает, но если все оценки усреднить, то результат выходит довольно точным. Механизм прост: все смотрят на одну и ту же банку, у всех оценок – одна основа, и все же ошибки каждого испытуемого не зависят от ошибок других и (в отсутствие систематических искажений) усредняются до нуля. Вдобавок магия уменьшения ошибки срабатывает только в том случае, когда наблюдения взаимно независимы, а ошибки не коррелируют. Если испытуемые находятся под влиянием общего для них предубеждения, то агрегация оценок его не уменьшит. По сути, если позволить наблюдателям влиять друг на друга, то размер выборки уменьшится, а с ним уменьшится и точность групповой оценки.
Для получения полезной информации из множественных источников следует обеспечить их независимость друг от друга. Это правило широко используют в полицейских расследованиях: многочисленным свидетелям происшествия не разрешают обсуждать его до дачи показаний. Цель не только в том, чтобы предотвратить сговор между злоумышленниками, но и в том, чтобы непредубежденные свидетели не повлияли друг на друга. Те, кто обмениваются впечатлениями, впоследствии будут склонны делать одинаковые ошибки в показаниях, уменьшая общую ценность предоставляемых ими сведений. Избавляйтесь от избыточности в ваших источниках.
Этот принцип независимости суждений и декоррелированных ошибок могут с успехом применять руководители компаний во время проведения совещаний и всевозможных встреч. Следует соблюдать простое правило: все участники записывают краткое изложение своей точки зрения до обсуждения, и, таким образом, эффективно используется все разнообразие знаний и мнений внутри группы. При стандартном открытом обсуждении слишком большой вес получают мнения тех, кто говорит раньше и убедительнее других, вынуждая остальных присоединяться.
Что ты видишь, то и есть (WYSIATI)
Размышляя о первых годах совместной работы с Амосом, я неизбежно вспоминаю его любимую шутку. Ловко пародируя одного из университетских преподавателей философии, мой приятель с сильным немецким акцентом хрипло произносил: «Не забывайте о примате Бытия!» Что именно имел в виду профессор, я так и не понял (подозреваю, что и Амос тоже), но шутки моего друга всегда имели определенный смысл. Мы с ним вспоминали эту фразу всякий раз, когда сталкивались с удивительно асимметричным отношением наших умов к информации, которая у нас имеется, и к информации, которой мы не располагаем.
Важнейшая особенность устройства ассоциативного механизма состоит в том, что он представляет лишь активированные идеи. Информация, которую не извлекают из памяти хотя бы подсознательно, с тем же успехом может просто не существовать. Система 1 отлично справляется с выстраиванием наилучшей возможной истории, включающей активированные в данный момент идеи, но не учитывает (и не может учитывать) информацию, которой у нее нет.
Мерой успеха для Системы 1 является когерентность созданной истории. Количество и качество данных, на которых она основана, особого значения не имеют. Когда информации мало, как это часто бывает, Система 1 работает как механизм для поспешных выводов. Подумайте над следующим: «Будет ли Миндик хорошим лидером? Она умная, сильная…» Вам в голову быстро пришел ответ: «Да». Вы выбрали наилучший вариант на основании ограниченной доступной информации, но вы поторопились. А вдруг следующие два прилагательных оказались бы «коррумпированная» и «жестокая»?
Обратите внимание, чего вы не сделали, кратко оценивая Миндик в роли лидера. Вы не начали с вопроса: «Что мне нужно знать, чтобы сформировать мнение о качестве лидерства?» С первого же прилагательного Система 1 принялась за самостоятельную работу: «умная» – это хорошо, «умная и сильная» – отлично. Это лучшая история, которую можно построить по двум прилагательным, и Система 1 создала ее с большой когнитивной легкостью. Историю пересмотрят, если появится новая информация (например, что Миндик коррумпирована), но ожидания или субъективного дискомфорта нет. Вдобавок первое впечатление все равно кажется более предпочтительным.
Стремящаяся к когерентности Система 1 в сочетании с ленивой Системой 2 подразумевает, что Система 2 примет много интуитивных убеждений, точно отражающих впечатления, сгенерированные Системой 1. Разумеется, Система 2 способна на более систематичный и осторожный подход к данным, а также может выполнить ряд проверок, необходимых для принятия решения, – например, когда вы покупаете дом, вы сознательно ищете информацию, которой у вас нет. Однако предполагается, что Система 1 влияет и на более взвешенные решения. Ей всегда есть что сказать.
Склонность делать поспешные выводы из ограниченных данных так важна для понимания интуитивного мышления и так часто упоминается в этой книге, что я буду использовать для нее довольно громоздкое сокращение: WYSIATI, которое означает: «что ты видишь, то и есть» (What You See Is All There Is). Система 1 категорически невосприимчива к количеству и качеству информации, на которой основываются впечатления и предчувствия.
Амос и два его аспиранта в Стэнфорде опубликовали результаты наблюдений за реакцией испытуемых, получивших одностороннюю информацию и знающих об этом. Это исследование имеет прямое отношение к WYSIATI. Участникам эксперимента описывали судебные разбирательства, например:
Третьего сентября истец Дэвид Торнтон, сорокатрехлетний инспектор профсоюза, находился в аптеке № 168 с обычным контрольным визитом. Через десять минут после его появления к нему подошел директор аптеки и заявил, что с сотрудниками – членами профсоюза следует общаться не в торговом зале, а в служебном помещении во время перерыва. Такое требование разрешено договором аптеки с профсоюзом, но раньше его не выдвигали. Когда мистер Торнтон возразил, ему предложили выбор: или выполнить требование, или покинуть аптеку, или попасть под арест. Здесь мистер Торнтон указал директору, что ему всегда позволяли проводить в торговом зале десятиминутные опросы сотрудников при условии, что он не мешал работать, и что он скорее готов быть арестованным, чем поменяет программу обычного контрольного визита. Директор вызвал полицию, и на мистера Торнтона надели наручники за несанкционированное проникновение в помещение аптеки. Мистер Торнтон был доставлен в отделение полиции и ненадолго заключен в камеру. Затем все обвинения с него были сняты. Мистер Торнтон выдвинул иск к аптечной сети за незаконное задержание.
Все участники ознакомились с этой информацией. Испытуемых разделили на три группы: одна группа прослушала юристов истца, вторая – юристов ответчика, а третья, как присяжные, выслушала аргументы обеих сторон. Естественно, адвокат профсоюза описывал арест как попытку запугивания, а адвокат аптечной сети утверждал, что разговоры в торговом зале мешали работе и что директор действовал верно. Юристы не сообщили никакой дополнительной информации, кроме той, которую можно было почерпнуть из исходной истории.
Участники полностью осознавали условия происходящего, и те, кто слышал аргументы одной стороны, с легкостью могли вывести доводы и в пользу противоположной. Тем не менее то, как преподносила данные одна из сторон, оказало весьма отчетливое влияние на суждения. Более того, участники, изучившие односторонние доказательства, с большей уверенностью выносили суждения, чем испытуемые, ознакомившиеся с доказательствами обеих сторон. Этого и следует ожидать, если уверенность суждений формируется когерентностью истории, которую испытуемым удается построить из доступной информации. Для связного рассказа важно, чтобы информация была непротиворечивой, но необязательно полной. На самом деле зачастую, когда знаешь меньше, проще сложить все известное в когерентную схему.
Благодаря WYSIATI легче достичь когерентности и когнитивной легкости, которые заставляют нас принимать утверждение как истинное. Именно поэтому мы думаем быстро и осмысляем неполную информацию в сложном мире. В основном наши логически последовательные истории достаточно близки к реальности и служат основанием для рациональных действий. Тем не менее, учитывая WYSIATI, я предложу объяснения длинному перечню разнообразных искажений выбора и суждений, включая следующие:
• Сверхуверенность: как подразумевает правило WYSIATI, ни количество, ни качество доказательств не влияет на субъективную уверенность отдельных индивидов. Вера в собственные убеждения в целом зависит от качества истории, составляемой на основании увиденного, даже если увидено немного. Мы часто не учитываем возможность того, что у нас нет данных, необходимых для формирования суждения, – что мы видим, то и есть. Более того, наша ассоциативная система любит склоняться к когерентной схеме активации и подавляет сомнения и неоднозначность.
• Эффект фрейминга: разные способы подачи одной и той же информации часто вызывают разные эмоции. Утверждение «Выживаемость в течение месяца после операции составляет 90 %» успокаивает больше, чем эквивалентное утверждение «Смертность в течение месяца после операции составляет 10 %». Аналогично продукты с описанием «на 90 % без жира» более привлекательны, чем те, на которых написано: «содержание жира 10 %». Эквивалентность формулировок очевидна, но человек обычно видит лишь одну из них, а для него существует только то, что он видит.
• Пренебрежение априорной вероятностью: вспомните робкого и аккуратного Стива, которого часто принимают за библиотекаря. Описание личности яркое и живое, и, хотя вы наверняка знаете, что мужчин-фермеров больше, чем библиотекарей, этот статистический факт, скорее всего, не пришел вам в голову, когда вы обдумывали этот вопрос в первый раз. Что вы видите, то и есть.
Разговоры о поспешных выводах
«Она ничего не знает про его менеджерские навыки. Она основывается лишь на эффекте ореола от хорошей презентации».
«Прежде чем начать дискуссию, давайте узнаем отдельно мнение каждого, чтобы декоррелировать ошибки. Независимые оценки дадут больше информации».
«Они приняли это серьезное решение на основании благоприятного отчета от единственного консультанта. Что они видят, то у них и есть. Похоже, они не поняли, как мало у них было информации».
«Они не хотели дополнительной информации, которая могла бы испортить историю. Что видишь, то и есть».
8
Как выносятся суждения
Числу вопросов, на которые вы можете ответить, нет предела, независимо от того, спрашивает ли вас собеседник, или вы задаете их сами себе. Нет предела и числу признаков, которые вы можете оценить. Вы способны посчитать количество заглавных букв на этой странице, сравнить высоту окон в вашем доме и доме через улицу и оценить начинания какого-нибудь политического деятеля по шкале от «отлично» до «провально». Вопросы адресуются Системе 2, которая направит внимание на поиск ответа в памяти. Система 2 может вопросы получать, а может генерировать, но перенаправление внимания и поиск ответа в памяти происходят в любом случае. Система 1 работает по-другому. Она постоянно отслеживает, что происходит внутри и снаружи разума, и генерирует оценки различных аспектов ситуации без конкретного намерения и почти или совсем без усилий. Эти базовые оценки играют важную роль в интуитивных суждениях, поскольку их с легкостью подставляют вместо более сложных ответов – это и есть основная идея метода эвристики и искажений. Две другие черты Системы 1 также поддерживают замену одного суждения на другое. Одна из них – способность переносить значения между измерениями. Вы делаете это, отвечая на легкий для большинства вопрос: «Если бы Сэм был такой же высокий, как он умный, какого роста он бы был?» И, наконец, есть «мысленный выстрел дробью» (mental shotgun): намерение Системы 2 ответить на конкретный вопрос или оценить определенное свойство ситуации автоматически запускает другие вычисления, в том числе и базовые оценки.
Базовые оценки
В ходе эволюции Система 1 выработала способность обеспечивать постоянную оценку основных задач, которые организм должен решать для выживания: как идут дела? не возникла ли угроза? не появилась ли хорошая возможность? все ли нормально? приблизиться или держаться подальше? Наверное, эти вопросы не столь важны для городского жителя, как для газели в саванне, но мы унаследовали нейронные механизмы, непрерывно оценивающие уровень угрозы, которые нельзя отключить. Ситуации постоянно определяются как плохие или хорошие, требующие бегства или позволяющие приближение. Для человека хорошее настроение и когнитивная легкость – эквиваленты оценки среды как безопасной и знакомой.
Конкретным примером базовой оценки служит способность с одного взгляда отличать друга от врага. Подобная специализированная возможность влияет на шансы выживания организма в опасном мире и развилась в ходе эволюции. Алекс Тодоров, мой коллега по Принстону, изучал биологические корни быстрой оценки безопасности при взаимодействии с посторонними. Он показал, что у нас есть способность с одного взгляда на лицо незнакомца оценивать два основных и потенциально важных признака: уровень его доминантности (и, соответственно, степень грозящей опасности) и насколько он достоин доверия, то есть окажутся ли его намерения дружественными или враждебными. Форма лица, например «сильная» квадратная челюсть, позволяет в определенной степени оценить доминантность. Выражение лица (улыбка или хмурый взгляд) дает подсказки относительно намерений. Сочетание квадратной челюсти с опущенными уголками рта может предвещать беду. Точность такой оценки далеко не идеальна: круглые подбородки не очень надежно отражают кротость, а улыбки можно (до некоторой степени) сымитировать. И все-таки даже несовершенная способность оценивать посторонних дает преимущество при выживании.
Этот древний механизм в современном мире получил новое использование: он до некоторой степени влияет на то, как люди голосуют. Тодоров показывал своим студентам фотографии мужчин, некоторые всего лишь на одну десятую секунды, и просил их оценить лица по разным признакам, включая привлекательность и компетентность. В оценках испытуемых не обнаружилось значительного разброса. Тодоров показывал не набор случайных фотографий, а подборку изображений кандидатов в предвыборных кампаниях. Затем исследователь сравнил результаты выборов с рейтингом компетентности, составленным принстонскими студентами после короткого просмотра фотографий и вне политического контекста. Примерно в 70 % случаев на выборах на пост сенатора, конгрессмена и губернатора победил тот кандидат, чье изображение в эксперименте получило более высокий рейтинг компетентности. Этот поразительный результат быстро подтвердился во время всеобщей избирательной кампании в Финляндии, на выборах в муниципальные советы в Англии и в различных избирательных кампаниях в Австралии, Германии и Мексике. Для меня полной неожиданностью стало то, что рейтинг компетентности в исследовании Тодорова прогнозировал результаты голосования лучше, чем рейтинг привлекательности.
Тодоров обнаружил, что люди судят о компетентности, сочетая два измерения: силу и надежность. На лицах, излучающих компетентность, сильный подбородок сочетается с легкой уверенной улыбкой. Нет никаких свидетельств, что эти черты лица действительно предсказывают, насколько хорошо политики справятся со своими обязанностями. Но изучение реакции мозга на выигрывающих и проигрывающих кандидатов демонстрирует, что мы биологически предрасположены отвергать тех, у кого нет ценимых нами признаков. В этом исследовании проигравшие вызывали более сильную негативную эмоциональную реакцию. Это – пример эвристики суждения, о которой я буду говорить далее. Избиратели пытаются составить впечатление о том, насколько будет хорош кандидат на своем посту, и склоняются к более простой оценке, которая выносится быстро, автоматически и доступна в момент, когда Система 2 принимает решение.
Развивая основополагающие исследования Тодорова, политологи определили категорию избирателей, для которых автоматические предпочтения Системы 1, вероятнее всего, сыграют существенную роль. Они обнаружили их среди политически неграмотных избирателей, которые много смотрят телевизор. Как и ожидалось, внешность, создающая впечатление компетентности, влияет на недостаточно информированных любителей телепередач втрое сильнее, чем на других. Разумеется, относительная важность Системы 1 в определении выбора предпочтений при голосовании для всех разная. Мы встретим и другие примеры таких индивидуальных отличий.
Система 1, конечно же, понимает язык, и это понимание зависит от базовых оценок, которые постоянно генерируются в ходе восприятия событий и понимания сообщений. Эти оценки включают высчитывание сходства и репрезентативности, установление причин и оценку доступности ассоциаций и примеров. Это делается даже при отсутствии конкретных задач, хотя результаты используются для выполнения требований, возникающих по мере появления заданий.
Базовых оценок очень много, но оцениваются не все возможные признаки. Для примера взгляните на рисунок 7.
Рис. 7
С первого взгляда создается впечатление о многих особенностях рисунка. Вы знаете, что высота крайних столбиков одинакова и что сходство столбиков друг с другом больше, чем сходство между столбиком слева и массивом кубиков посередине. Вы не осознаете, что количество кубиков в столбике слева такое же, как в средней фигуре, и не знаете, какой высоты будет столбик, построенный из кубиков. Чтобы подтвердить количество, придется пересчитать два набора кубиков и сравнить результаты, а это может сделать лишь Система 2.
Наборы и прототипы
В качестве другого примера подумайте над таким вопросом: какова средняя длина линий на рисунке 8?
Рис. 8
Вопрос легкий, и Система 1 отвечает на него без подсказок. Эксперименты показали, что испытуемым достаточно доли секунды для довольно точной оценки средней длины набора линий. Более того, точность этих оценок не страдает, если мозг испытуемого в это же время занят тестом на память. Испытуемые не всегда знают, как выразить среднее значение в дюймах или сантиметрах, но очень точно подгоняют под него длину другой линии. Чтобы сформировать впечатление о средней длине, Система 2 не нужна. Это автоматически и без усилий делает Система 1, точно так же, как она отмечает цвета линий и факт, что они не параллельны. Мы можем немедленно сформировать впечатление о количестве предметов в наборе: точно, если их число равно или меньше четырех, или примерно, если оно больше четырех.
Перейдем к другому вопросу: какова суммарная длина линий на рисунке 8? С ним все по-другому, потому что Системе 1 нечего предложить. На него можно ответить, лишь активировав Систему 2, которая старательно оценит среднюю длину, посчитает количество линий и перемножит их.
На первый взгляд то, что Система 1 не может вычислить общую длину нескольких линий, вполне очевидно; вы и не думали, что можете это сделать. Это пример важного ограничения Системы 1. Она представляет категории через прототип или несколько типичных образцов, а потому хорошо справляется со средними значениями, но не очень хорошо – с суммированием. Объем категории и количество объектов в ней обычно игнорируются в суждениях относительно того, что я буду называть суммоподобными переменными.
В одном из многочисленных экспериментов, проведенных в связи с судебным процессом после аварии танкера «Эксон Вальдес», испытуемых спросили о степени их готовности оплатить приобретение сетей для покрытия пролитой нефти, в который вязнут и тонут перелетные птицы. Трем группам участников предложили оплатить спасение соответственно двух тысяч, двадцати тысяч или двухсот тысяч птиц. Если спасение птиц – экономический товар, оно должно представлять суммоподобную переменную: спасение двухсот тысяч птиц, казалось бы, стоит дороже, чем спасение двух тысяч. В действительности количество птиц мало повлияло на средний размер взноса для каждой из трех групп: 80, 78 и 88 долларов соответственно. Во всех трех группах участники реагировали на прототип – изображение беспомощной птицы, покрытой нефтью. Как неоднократно подтверждалось опытным путем, количеством почти всегда пренебрегают в подобных эмоциональных обстоятельствах.
Сопоставление интенсивности
Вопросы о вашем благополучии, о популярности президента, о достойном наказании финансовых махинаторов и о перспективах некоего политика объединяет важная черта: они все обращаются к лежащему в их основе понятию интенсивности или количества, позволяющему использовать слово «больше»: более счастливый, более популярный, более строго или более влиятельный (о политике). К примеру, политическое будущее кандидата может варьироваться от малого «Ее обгонят еще на внутрипартийных выборах» до серьезного «Когда-нибудь она станет президентом США».
Здесь мы сталкиваемся с еще одной способностью Системы 1. Лежащая в основе шкала интенсивности позволяет находить соответствия в самых различных областях. Если бы преступления выражались через цвет, убийство приобрело бы более темный оттенок красного, чем кража. Если бы их выражали через музыку, массовое убийство звучало бы очень громко, а неуплата штрафов за неправильную парковку – едва слышно. Разумеется, вы чувствуете нечто сходное и в отношении интенсивности наказаний. В классических экспериментах одни испытуемые настраивали громкость звука в соответствии с серьезностью преступления, а другие – в соответствии с серьезностью наказания. Услышав один звук для преступления и другой – для наказания, вы сочли бы несправедливым, если бы один из них был заметно громче другого.
Давайте рассмотрим пример, с которым мы еще встретимся:
В четыре года Джули свободно читала.
Теперь сопоставьте ее умение читать с такой шкалой интенсивности:
Какого роста должен быть мужчина, если он настолько же высок, насколько развита Джули?
Как насчет метра восьмидесяти? Явно маловато. А два пятнадцать? Наверное, чересчур. Вам нужен рост, который так же необычен, как и умение читать в четыре года: довольно примечательно, но не поразительно. Вот если бы Джули читала в год и три месяца, это уже было бы выдающееся достижение, вроде роста в два с половиной метра.
Какой уровень дохода в вашей профессии соответствует достижениям Джули в чтении?
Какое преступление настолько же серьезно, насколько велики достижения Джули?
Какой средний выпускной балл в университете «Лиги плюща» соответствует умению Джули читать?
Несложно, правда? Более того, ваши ответы будут близки к тому, что скажут другие люди вашего круга. Если испытуемых просят предсказать средний выпускной балл Джули по тому, когда она научилась читать, то они с легкостью переводят результат из одного измерения в другое и выбирают соответствующий балл. В дальнейшем мы увидим, почему подобный метод предсказаний на основе сопоставления статистически неверен, хоть и абсолютно естественен для Системы 1, и почему у большинства людей – за исключением статистиков – его результаты приемлемы для Системы 2.
«Мысленный выстрел дробью»
В каждый момент времени Система 1 выполняет множество вычислений. Некоторые из них – обычное непрерывное оценивание. Когда у вас открыты глаза, ваш мозг выстраивает трехмерную модель того, что находится в вашем поле зрения, включая форму объектов, их расположение в пространстве и названия. Для запуска этого задания или для постоянного отслеживания нарушенных ожиданий намерения не требуются. В противоположность обычным базовым оценкам другие вычисления производятся лишь по необходимости: вы не занимаетесь постоянной оценкой своего благополучия или богатства и не проводите непрерывного расчета перспектив президента, даже если любите политику. Суждения относительно какого-либо события произвольны и появляются лишь в том случае, когда у вас возникает соответствующее намерение.
Вы не занимаетесь автоматическим подсчетом количества слогов в каждом прочитанном слове, но можете, если захотите. Впрочем, контроль за намеренными вычислениями не слишком точен: мы часто насчитываем намного больше нужного или желаемого. Я называю эти лишние вычисления мысленной дробью. Из дробовика в одну точку не попасть, потому что дробь рассыпается в разные стороны, и, похоже, Системе 1 так же трудно делать ровно столько, сколько от нее требует Система 2. Этот образ порожден двумя экспериментами, о которых я когда-то читал.
В одном из них участники слушали пары слов и должны были как можно быстрее нажимать клавишу, когда замечали, что слова рифмуются. В обеих парах слова рифмуются:
VOTE – NOTE
VOTE – GOAT
Вам разница очевидна, поскольку вы видите обе пары. VOTE и GOAT рифмуются, но пишутся по-разному. Участники слова только слышали, но написание на них тоже повлияло. Задержка в опознании рифмующихся, но пишущихся по-разному слов была вполне очевидна. Хотя инструкции требовали лишь сравнения звуков, испытуемые сравнивали и написание, и несоответствие по несущественному параметру замедляло их реакцию. Намерение ответить на поставленный вопрос повлекло за собой и другие выкладки – не просто избыточные, а вредящие исполнению главного задания.
Еще в одном исследовании испытуемым предлагалось прослушать фразы и как можно быстрее нажать одну клавишу, если фраза верна в прямом смысле, и другую – если она неверна в прямом смысле. Каковы правильные ответы для следующих фраз?
Некоторые дороги – змеи.
Некоторые работы – змеи.
Некоторые работы – тюрьмы.
Все три фразы неверны в прямом смысле. Тем не менее вы наверняка почувствовали, что ложность второй фразы более заметна по сравнению с двумя другими – время реакций в эксперименте показало существенную разницу. Причина различия в том, что оставшиеся две трудных фразы верны в переносном смысле. Намерение выполнить одну выкладку повлекло за собой исполнение другой. В этом конфликте победил правильный ответ, но сам конфликт повлиял на эффективность. В следующей главе мы увидим, что сочетание «мысленной дроби» с сопоставлением интенсивности объясняет, почему у нас существуют интуитивные мнения о множестве мало известных нам вещей.
Разговоры о суждениях
«Оценка привлекательности – одна из базовых. Она выполняется автоматически, независимо от желания, и влияет на нас».
«В мозгу есть области, оценивающие доминантность по форме лица. С виду он вполне подходит на роль лидера».
«Наказание покажется несправедливым, если степень его интенсивности не будет соответствовать преступлению. Примерно так же можно сопоставить громкость звука с яркостью света».
«Явный пример „мысленной дроби“. Его спросили, считает ли он компанию финансово стабильной, но он не мог забыть, что ему нравится их продукция».
9
Ответ на более легкий вопрос
В жизни вашего разума есть одна примечательная особенность: вы редко приходите в замешательство. Конечно, время от времени вы сталкиваетесь с вопросом вроде «17 24 =?», ответ на который сразу в голову не приходит, но такое случается редко. В нормальном состоянии ваш разум обладает интуитивными чувствами и мнениями почти обо всем, что вам встречается. Люди вам нравятся или не нравятся задолго до того, как вы достаточно о них узнаете; вы без особых причин доверяете или не доверяете незнакомцам; вы чувствуете, что дело будет успешным, не вдаваясь в его анализ. Опираясь на данные, которые вы не можете ни объяснить, ни обосновать, вы часто знаете ответы на не вполне понятные вам вопросы независимо от того, заявляете вы об этом или нет.
Подстановка вопросов
Я предлагаю простое объяснение того, как мы генерируем интуитивные мнения по сложным вопросам. Если на сложный вопрос быстро не находится удовлетворительного ответа, Система 1 подыскивает более легкий родственный вопрос и отвечает на него. Я называю операцию ответа на один вопрос вместо другого подстановкой. Также я использую следующие термины:
Целевой вопрос – это оценка, которую вы намереваетесь дать.
Эвристический вопрос – более простой вопрос, на который вы отвечаете вместо целевого.
Формальное определение эвристического метода примерно таково: это простая процедура или установка, помогающая найти адекватный, хотя часто неидеальный, ответ на трудные вопросы. Слово «эвристика» происходит от того же корня, что и «эврика».
Идея подстановки возникла в нашей с Амосом работе довольно рано и стала ядром того, что позже превратилось в метод эвристики и искажений. Мы спросили себя, как люди умудряются оценивать вероятность, не зная точно, что она из себя представляет. Мы заключили, что эта невозможная задача каким-то образом упрощается, и решили выяснить, как это происходит. Наш ответ был таков: при необходимости вычислить вероятность люди оценивают нечто другое, однако считают, что оценили непосредственно вероятность. Система 1 часто исполняет этот маневр, сталкиваясь с трудным целевым вопросом, если легко находится ответ на более легкий эвристический вопрос, родственный заданному.
Подстановка одного вопроса вместо другого служит хорошей стратегией решения трудных задач. Дьёрдь Пойа включил метод подстановки в свой классический труд «Как решать задачу»: «Если задачу решить не удается, найдите более легкую родственную задачу, которую вы сможете решить». Эвристические методы Пойа – стратегические процедуры, намеренно реализуемые Системой 2. Но эвристические методы, обсуждаемые в этой главе, не выбираются, они – следствие «мысленной дроби», нашего неточного контроля над поиском ответов на вопросы.
Обдумайте вопросы в левой колонке таблицы 1. Это – трудные вопросы, и еще до того, как вы найдете на любой из них обоснованный ответ, вам придется справляться с другими сложными задачами. Что такое счастье? Какие политические тренды будут вероятны в следующие полгода? Какие приговоры обычно выносят за финансовые преступления? Насколько сильна конкуренция, с которой столкнется кандидат? Какие еще факторы и обстоятельства нужно учесть? Всерьез разбирать эти вопросы совершенно непрактично. Но вы не ограничены одними лишь разумными ответами. Точным рассуждениям есть эвристическая альтернатива, которая временами работает неплохо, а временами ведет к серьезным ошибкам.
Таблица 1
«Мысленная дробь» позволяет легко генерировать быстрые ответы на трудные вопросы, не загружая ленивую Систему 2 тяжелой работой. Очень вероятно, что при попытке ответить на вопросы слева всплывут вопросы справа, и на них легко найдется ответ. Разум мгновенно осознает чувства, испытываемые к дельфинам и мошенникам, ваше настроение, впечатления о способностях того или иного политика или текущий рейтинг президента. Эвристические вопросы предлагают готовые ответы на каждый из трудных целевых вопросов.
В этой истории не хватает еще кое-чего: ответы должны подходить к первоначальным вопросам. К примеру, мои чувства относительно умирающих дельфинов необходимо выразить в долларах. Эту задачу решает другая возможность Системы 1 – сопоставление интенсивности. Вспомните, что шкалы интенсивности применимы и к чувствам, и к денежным взносам. Я могу испытывать к дельфинам более или менее сильные чувства, и для их отражения существует определенный размер денежного взноса. Мне в голову придет соответствующее количество долларов. Такие сопоставления возможны и для остальных вопросов. К примеру, способности политика могут варьироваться от жалких до исключительно впечатляющих, а шкала политического успеха может лежать между низким «Она не пройдет даже внутрипартийные выборы» и высоким «Когда-нибудь она станет президентом США».
Автоматические процессы «мысленной дроби» и сопоставления интенсивности часто предлагают ряд решений легких вопросов, которые можно предложить и в ответ на целевой вопрос. В некоторых случаях произойдет подстановка, и Система 2 примет эвристический ответ. Конечно, Система 2 может отвергнуть интуитивный ответ или изменить его, включив туда другую информацию. Однако ленивая Система 2 часто следует по пути наименьших усилий и принимает эвристический ответ, не слишком рассматривая, уместен ли он. Вы не растеряетесь, вам не придется напрягаться, и вы можете даже не заметить, что ответили на другой вопрос. Более того, вы можете не понять, что целевой вопрос был трудным, потому что интуитивный ответ легко пришел в голову.
Эвристика трехмерности
Посмотрите на трех мужчин на картинке и ответьте на вопрос.
Рис. 9
На рисунке фигура справа больше, чем фигура слева?
В голову быстро приходит очевидный ответ: фигура справа больше. Тем не менее если измерить фигуры линейкой, то обнаружится, что они совершенно одинаковые. Ваше впечатление о размере обусловлено мощной иллюзией, которая изящно иллюстрирует процесс подстановки.
Коридор, где расположены фигуры, нарисован в перспективе, и кажется, что он уходит в глубину. Система восприятия автоматически интерпретирует картинку как трехмерное изображение, а не как картинку, отпечатанную на плоской поверхности бумаги. В трехмерной интерпретации фигура справа находится намного дальше и существенно крупнее фигуры слева. Иллюзия трехмерности ошеломляет многих. Умение рассматривать рисунок как объект на странице развито только у опытных фотографов и у тех, кто занимается изобразительным искусством. У остальных происходит подстановка: доминирующее впечатление размера трехмерного объекта диктует, какие суждения следует выносить о размере двумерного объекта. Иллюзия возникает из-за эвристики трехмерности.
Приведенное выше изображение – это настоящая иллюзия, а не непонимание вопроса. Вы знали, что вопрос касался размеров фигур, изображенных на рисунке. Из экспериментальных данных известно, что на предложение оценить размер изображения испытуемые отвечают в дюймах, а не в футах. Вас запутал не этот вопрос, а сбил с толку другой, который вам не задавали: «Как высоки эти трое?»
Важный этап эвристического метода – подстановка трехмерного размера вместо двумерного – прошел автоматически. На картинке есть подсказки, предполагающие трехмерную интерпретацию. Эти подсказки неважны для выполняемого задания – вынесения решений о размерах фигур на странице, – и вам стоило бы их проигнорировать, но вы не смогли. Искажение, связанное с эвристическим методом, состоит в том, что на странице объекты, кажущиеся более далекими, также выглядят и более крупными. Как показывает этот пример, суждение на основе подстановки обязательно будет искажено предсказуемым образом. В данном случае это происходит так глубоко внутри системы восприятия, что вы просто не в состоянии себя перебороть.
Эвристика настроения вместо счастья
Один из лучших примеров подстановки – опрос, проведенный среди немецких студентов. Его участники среди прочих отвечали на следующие два вопроса:
Насколько вы счастливы в последнее время?
Сколько свиданий у вас было за прошлый месяц?
Исследователей интересовала корреляция между ответами. Окажется ли, что студенты, у которых было много свиданий, счастливее других? Как ни странно, корреляция оказалась практически нулевой. Очевидно, личная жизнь при оценке собственного счастья приходила в голову не первой. Другая группа студентов видела те же два вопроса, но в обратном порядке:
Сколько свиданий у вас было за прошлый месяц?
Насколько вы счастливы в последнее время?
На этот раз результаты опроса выглядели совершенно иначе: корреляция между количеством свиданий и общим ощущением счастья оказалась необычайно высокой для соотносимых психологических показателей. Что же произошло?
Объяснение простое, и оно – хороший пример подстановки. Свидания, очевидно, были не главным в жизни студентов (в первом исследовании счастье и свидания не коррелировали), но вопрос о личной жизни вызывал эмоциональную реакцию. Студенты, часто ходившие на свидания, вспомнили о радостной стороне своей жизни, а те, кто делал это реже, вспомнили об одиночестве и неудачах. В такой последовательности при ответе на вопрос об общем счастье эмоции, возникшие в связи с вопросом о личной жизни, еще были свежи.
Случившееся точно повторяет психологический эффект иллюзии размера на рисунке 9. «Ощущение счастья в последнее время» оценивать сложно и непривычно. Ответ требует серьезных размышлений. Однако студентам, которых только что спросили о свиданиях, не пришлось много думать, потому что у них в голове уже имелся ответ на родственный вопрос: насколько счастливы они в своей личной жизни. Они подставили вместо заданного вопроса тот, на который у них был готов ответ.
Здесь, так же как и в примере с иллюзией, мы вправе спросить: неужели студенты запутались? Возможно ли, что они и впрямь считают эти вопросы эквивалентными? Конечно же, нет. Студенты не утрачивают способность различать личную жизнь и жизнь в целом. На вопрос, есть ли разница между личной жизнью и жизнью в целом, они ответят, что это не одно и то же. Однако их не спрашивали о разнице между этими концепциями, а поинтересовались тем, насколько они счастливы. У Системы 1 был наготове ответ.
Речь может идти не только о свиданиях. То же самое обнаруживается, если вопросу о счастье вообще предшествует вопрос об отношениях с родителями или о финансовом положении. В обоих случаях при оценке доминирует удовлетворение конкретной областью интересов. Любой эмоционально важный вопрос, влияющий на настроение, окажет то же действие. Что ты видишь, то и есть. Текущее умонастроение сильно влияет на людей при оценке собственного счастья.
Эвристика аффекта
Преобладающее влияние выводов над доводами заметнее всего в ситуациях с вовлечением эмоций. Психолог Пол Словик предложил в виде объяснения эвристику аффекта, под воздействием которой наши предпочтения и неприязни способны формировать наши убеждения об окружающем мире. Ваши политические предпочтения определяют, какие доводы покажутся вам привлекательными. Если вам нравится политика, проводимая в области здравоохранения, то вы считаете ее весьма выгодной и менее затратной, чем предлагаемые альтернативы. Если вы агрессивно настроены в отношении других государств, то, вероятно, считаете, что они слабы и легко подчинятся желаниям вашего правительства. Если вы настроены более кротко, вы, вероятно, думаете, что они сильны и не покорятся чужой воле. Ваше эмоциональное отношение к облучению пищевых продуктов, красному мясу, атомной энергетике, татуировкам или мотоциклам предопределит ваше мнение о пользе и рисках, связанных с их использованием. Если вам не нравится что-то из этого списка, вы, скорее всего, считаете, что риски слишком высоки, а польза пренебрежимо мала.
Это не означает, что ваш разум совершенно закрыт, а убеждения полностью изолированы от информации и разумных рассуждений. Ваши убеждения и эмоциональное отношение могут несколько измениться, когда вы узнаете, что риск от неприятного вам занятия меньше, чем вы думали. Информация о более низком риске также изменит и оценку преимуществ, даже если в полученной вами информации об этом не было ни слова.
Здесь мы видим новую сторону «личности» Системы 2. До сих пор я описывал ее как относительно уступчивого наблюдателя, предоставляющего Системе 1 значительную свободу. В моем представлении Система 2 занимается активным намеренным поиском информации в памяти, сложными вычислениями, сравнениями, планированием и выбором. В задаче про биту и мяч и во многих других примерах взаимодействия двух систем казалось, что Система 2 – главная, что у нее есть способность противостоять предложениям Системы 1, притормаживать развитие событий и проводить логический анализ. Самокритика – одна из функций Системы 2. Однако в вопросах эмоционального отношения к чему-либо Система 2 – не критик, а защитник эмоций Системы 1, она поощряет, а не запрещает. Она ищет в основном ту информацию и доводы, которые согласуются с ее существующими убеждениями, а не ту, которая позволит их проанализировать. Активная, ищущая когерентности Система 1 предлагает решения нетребовательной Системе 2.
Разговоры о подстановках и эвристических методах
«Мы еще помним, на какой вопрос пытаемся ответить? Или уже заменили его вопросом полегче?»
«Мы рассматриваем вопрос, добьется ли этот кандидат успеха, но, похоже, ответ даем на вопрос, хорошо ли он держится во время интервью. Давайте не будем делать подстановки».
«Ей нравится проект, поэтому она считает, что затраты на него невелики, а выгоды много. Хороший пример эвристики аффекта».
«Мы используем прошлогодние показатели в качестве эвристической модели, чтобы дать оценку потенциальной стоимости компании через несколько лет. Насколько пригодна такая модель? Какая еще информация нам нужна?»
В таблице ниже приведен перечень характерных черт и действий, относящихся к Системе 1. Каждое предложение в действительном залоге заменяет утверждение в страдательном залоге, более точное с технической точки зрения, но более сложное для понимания, смысл которого заключается в том, что соответствующее событие внутри разума случается автоматически и быстро. Я надеюсь, что этот перечень поможет вам выработать интуитивное «чувство личности» выдуманной Системы 1. Как и у многих известных вам персонажей, у вас будут возникать предчувствия насчет того, что Система 1 сделала бы в других обстоятельствах, и большая часть ваших предчувствий будет верной.
• Порождает впечатления, чувства и склонности; когда Система 2 принимает их, они становятся убеждениями, позициями и намерениями.
• Действует автоматически и быстро, почти или совсем без усилий и без ощущения сознательного контроля.
• Может быть запрограммирована Системой 2 на мобилизацию внимания для обнаружения определенной модели (то есть на проведение поиска).
• После соответствующего обучения умело реагирует на стимулы и раздражители и порождает квалифицированные предчувствия.
• Создает когерентную модель активированных идей в ассоциативной памяти.
• Соединяет ощущение когнитивной легкости с иллюзиями правды, приятными чувствами и пониженной бдительностью.
• Отделяет неожиданное от обычного.
• Предполагает причины и намерения или придумывает их.
• Пренебрегает неоднозначностью и подавляет сомнения.
• Предрасположена верить и подтверждать.
• Преувеличивает эмоциональную согласованность (эффект ореола).
• Сосредоточивается на существующих доказательствах и игнорирует те, которых нет (WYSIATI: что ты видишь, то и есть).
• Генерирует ограниченный набор базовых оценок.
• Представляет множества при помощи норм и прототипов; не интегрирует.
• Сопоставляет уровень интенсивности различных шкал (например, размера и громкости).
• Вычисляет больше, чем намеревалась («мысленная дробь»).
• Иногда подставляет более легкий вопрос вместо трудного (эвристические методы).
• Более чувствительна к переменам, чем к состояниям (теория перспектив)*.
• Переоценивает малые вероятности*.
• Демонстрирует снижающуюся чувствительность к количеству (психофизика)*.
• Реагирует на потери сильнее, чем на выигрыши (неприятие потерь)*.
• Заключает задачи принятия решений в узкие рамки, изолируя их друг от друга[1].
Часть II
Методы эвристики и искажения
10
Закон малых чисел
Исследование частоты рака почки, проведенное в 3141 округе США, выявило удивительную закономерность: самый низкий уровень заболеваемости обнаружен в сельских, малонаселенных округах, расположенных в традиционно республиканских штатах на Среднем Западе, Юге и Западе. Чо вы думаете по этому поводу?
Ваш разум в последние несколько секунд был очень активен, причем работала преимущественно Система 2. Вы планомерно искали в памяти информацию и формулировали гипотезы. Вам понадобились некоторые усилия: у вас расширились зрачки, измеримо участилось сердцебиение. Но и Система 1 не бездельничала: работа Системы 2 полагалась на факты и предложения, извлеченные из ассоциативной памяти. Вы, вероятно, отвергли мысль о том, что республиканские политические взгляды защищают от рака почки. Скорее всего, в итоге вы сосредоточились на том факте, что округа с низким уровнем заболеваемости в основном сельские. Остроумные статистики Говард Вейнер и Харрис Цверлинг, приводя в пример это исследование, прокомментировали: «Очень легко и соблазнительно сделать вывод, что низкий уровень заболеваемости – прямое следствие здоровой сельской жизни: воздух чистый, вода тоже, еда свежая и без добавок». Очень разумно.
Рассмотрим теперь округа с самым высоким уровнем заболеваемости раком почки. Эти нездоровые округа в основном сельские, малонаселенные и расположены в традиционно республиканских штатах на Среднем Западе, Юге и Западе. Вейнер и Цверлинг в шутку комментируют: «Легко предположить, что высокий уровень заболеваемости – прямое следствие бедности сельской жизни: хорошая медицина далеко, пища жирная, злоупотребление алкоголем и табаком». Конечно же, что-то не так. Сельская жизнь не может служить одновременным объяснением и для высокого, и для низкого уровня заболеваемости раком почки.
Основной фактор здесь – не то, что округа сельские или в основном республиканские. Все дело в том, что население сельских округов малочисленно. Главный урок, который нужно усвоить, касается не эпидемиологии, а сложных отношений между нашим разумом и статистикой. Система 1 отлично приспособлена к одной форме мышления – она автоматически и без усилий опознает каузальные связи между событиями, иногда даже в тех случаях, когда связи не существует. Услышав об округах с высоким уровнем заболеваемости, вы немедленно заключили, что они чем-то отличаются, что у этой разницы есть объяснение. Однако, как мы увидим, Система 1 не слишком способна управляться с «чисто статистическими» фактами, которые меняют вероятность результатов, но не заставляют их случаться.
Случайное событие – по определению – не подлежит объяснению, но серии случайных событий ведут себя чрезвычайно регулярным образом. Представьте себе сосуд, наполненный небольшими шариками. Половина из них – красные, половина – белые. Затем представьте очень терпеливого человека (или робота), который вслепую достает по четыре шарика, записывает число красных, бросает их обратно и повторяет так много-много раз. Если обобщить результаты, то обнаружится, что сочетание «два белых, два красных» появляется почти в шесть раз чаще, чем «четыре белых» или «четыре красных». Это соотношение – математический факт. Результат многократного извлечения шариков из урны можно предсказать с той же точностью, как результат удара молотком по яйцу. Предсказать, как именно разлетятся осколки скорлупы, вы не сможете, но в целом вы уверены в результате. Впрочем, есть одно различие: удовлетворенное ощущение причинной связи, которое вы испытываете, думая о молотке и яйце, в случае с шариками напрочь отсутствует.
С этим связан и другой статистический факт, относящийся к примеру о раке. Из одного и того же сосуда два очень терпеливых экспериментатора по очереди достают шарики. Джек в каждой попытке вытаскивает по 4 штуки, а Джилл – по 7. Они оба делают отметку каждый раз, когда им достаются шарики одного цвета, все белые или все красные. Если достаточно долго этим заниматься, то Джек будет наблюдать такие результаты примерно в 8 раз чаще Джилл (ожидаемый процент составляет 12,5 и 1,56 % соответственно). И вновь ни молотка, ни причины, просто математический факт: наборы из 4 шариков чаще дают однородные результаты, чем наборы из 7.
А теперь представьте население США шариками в огромном сосуде, причем некоторые шарики помечены буквами «РП», что говорит о раке почки. Вы извлекаете наборы шариков и по очереди населяете каждый округ. Выборки в сельских местностях меньше остальных. Как и в игре Джека и Джилл, экстремумы – то есть очень высокие и/или очень низкие уровни заболеваемости раком – с большей вероятностью окажутся в малонаселенных округах. Вот и вся история.
Мы начали с факта, который требует объяснения: уровень заболеваемости раком почки сильно меняется в зависимости от округа, и в этих изменениях есть закономерность. Я предложил статистическое объяснение: экстремумы (высокие и низкие показатели) вероятнее появятся в маленьких выборках, чем в больших. Это – не причина. Маленькое население округа не порождает рак и не спасает от него. Оно просто позволяет уровню заболеваемости быть намного выше (или намного ниже), чем в более многочисленной популяции. Истина состоит в том, что объяснять здесь нечего. На самом деле уровень заболеваемости раком не выше и не ниже нормы; если в округе маленькое население, она лишь кажется такой в отдельно взятом году из-за случайности выборки. Если повторить анализ на следующий год, мы заметим, что в целом ситуация с экстремумами в малых выборках та же, но округа, где в предыдущем году было много случаев рака, необязательно и на этот раз покажут высокий уровень заболеваемости. Если так, то разница между плотно населенными и сельскими округами не считается, это просто артефакты, то есть явления, порожденные исключительно каким-то аспектом метода исследования, в данном случае – различиями в размере выборки.
Вы, может, и удивились моему рассказу, но не восприняли его как откровение. Вам давно известно, что результаты исследований надежнее на больших выборках, и о законе больших чисел слышали даже те, кто статистики совершенно не знает. Но просто «знать» недостаточно, и, возможно, вы обнаружите, что в отношении вас справедливы следующие утверждения:
• Вы не придали значения признаку «малонаселенный», когда читали историю об исследовании частоты заболеваний раком.
• Вы сильно удивились, узнав о разнице между выборками в 4 и 7 шариков.
• Даже сейчас вам требуются определенные умственные усилия, чтобы понять, что следующие два утверждения означают совершенно одно и то же:
– Большие выборки дают более точный результат, чем маленькие.
– Маленькие выборки чаще больших дают экстремумы.
Первое утверждение кажется истинным, но нельзя считать, что вы его поняли, пока интуиция не приняла второе.
Итак, вы знали, что результаты на больших выборках точнее, но сейчас вы, наверное, понимаете, что знали это не очень хорошо. Вы не одиноки. Наше с Амосом первое совместное исследование показало, что даже у опытных исследователей плохая интуиция и зыбкое представление о значении объема выборки.
Закон малых чисел
Мое сотрудничество с Амосом в 1970-е годы началось с дискуссии об утверждении, что люди обладают интуитивным статистическим чутьем, даже если их статистике не обучали. На семинаре Амос рассказал нам об исследователях из Мичиганского университета, которые в целом оптимистично относились к интуитивной статистике. Меня эта тема очень волновала по личным причинам: незадолго до того я обнаружил, что я – плохой интуитивный статистик, и мне не верилось, что я хуже других.
Для психолога-исследователя изменчивость выборки – не просто странность, это неудобство и помеха, которая дорого обходится, превращая любое исследование в игру случая. Предположим, вы хотите подтвердить гипотезу, что словарный запас шестилетних девочек в среднем больше, чем словарный запас мальчиков того же возраста. В объеме всего населения гипотеза верна, у девочек в шесть лет словарный запас в среднем больше. Однако девочки и мальчики бывают очень разными, и можно случайно выбрать группу, где заметной разницы нет, а то и такую, где мальчики набирают больше баллов. Если вы – исследователь, такой результат вам дорого обойдется, поскольку, потратив время и усилия, вы не подтвердите правильность гипотезы. Риск снижается только использованием достаточно большой выборки, а те, кто работает с маленькими выборками, отдают себя на волю случая.
Риск ошибки в каждом эксперименте оценивается при помощи довольно простой операции, однако психологи не пользуются вычислениями для определения размера выборки, а принимают решения в соответствии с собственным, зачастую ущербным, пониманием. Незадолго до дискуссии с Амосом я прочитал статью, прекрасно иллюстрирующую типичные ошибки исследователей. Автор отмечал, что психологи сплошь и рядом используют настолько маленькие выборки, что рискуют не подтвердить верные гипотезы с вероятностью 50 %! Ни один разумный исследователь не примет такой риск. Правдоподобным объяснением казалось то, что решения психологов относительно размера выборок отражали господствующие интуитивные заблуждения о диапазоне изменчивости.
Меня поразили содержащиеся в статье объяснения, проливающие свет на проблемы с моими собственными исследованиями. Как и большинство психологов, я постоянно использовал слишком маленькие выборки и часто получал бессмысленные, странные результаты, оказывавшиеся артефактами, которые порождал сам метод моих исследований. Мои ошибки были тем постыднее, что я преподавал статистику и умел вычислять размер выборки, необходимый для снижения риска неудачи до приемлемого уровня. Но я никогда этим не занимался при планировании экспериментов и, подобно другим исследователям, верил традиции и собственной интуиции, не задумываясь о проблеме всерьез. К моменту, когда Амос посетил мой семинар, я уже осознал, что моя интуиция не работает, а во время самого семинара мы быстро пришли к выводу, что ошибаются и оптимисты из Мичиганского университета.
Мы с Амосом решили выяснить, есть ли среди исследователей такие же наивные глупцы, как я, и допускают ли те же ошибки ученые, обладающие математическими знаниями. Мы разработали опросник с описанием реалистичных исследований и успешных экспериментов. Опрашиваемые должны были определить размеры выборок, оценить связанные с этими решениями риски и дать советы гипотетическим аспирантам, планирующим научно-исследовательскую работу. На конференции Общества математической психологии Амос провел опрос присутствующих (включая авторов двух учебников по статистике). Результаты оказались очевидны: я был не одинок. Почти все респонденты повторили мои ошибки. Выяснилось, что даже эксперты недостаточно внимательны к размеру выборки.
Первая статья, написанная мной в соавторстве с Амосом, называлась «Вера в закон малых чисел». В ней шутливо пояснялось, что «…интуитивная оценка размера случайных выборок, похоже, удовлетворяет закону малых чисел, гласящему, что закон больших чисел с тем же успехом применим и к малым». Также мы включили в статью настойчивую рекомендацию для исследователей относиться к своим «статистическим предчувствиям с недоверием и при любой возможности заменять впечатления вычислениями».
Предпочтение уверенности сомнению
По результатам телефонного опроса 300 пенсионеров, 60 % поддерживают президента.
Если бы вас попросили изложить смысл этого предложения в трех словах, как бы вы это сделали? Почти наверняка вы бы сказали: «Пенсионеры поддерживают президента». Эти слова передают суть истории. Опущенные детали опроса (то, что его проводили по телефону, и количество респондентов) сами по себе неинтересны, они просто описывают исходные условия. При другом размере выборки вы все равно сказали бы то же самое. Конечно, абсурдное количество – 6 или 60 миллионов – привлекло бы внимание. Но если вы профессионально этим не занимаетесь, вы, возможно, почти одинаково отреагируете на выборку из 150 и 3000 человек. Фраза «Люди не уделяют должного внимания размеру выборки» именно это и означает.
Сообщение об опросе содержит информацию двух типов: историю и ее источник. Естественно, вы больше обращаете внимание на саму историю, чем на достоверность результатов. Однако, если достоверность невысока, сообщение не усвоят. Услышав, что «Группа сторонников провела некорректный и тенденциозный опрос, чтобы показать, что пенсионеры поддерживают президента», вы, конечно же, отвергнете эту информацию, результаты опроса не станут частью того, во что вы верите. Вместо этого некорректный опрос и его фальшивые результаты превратятся в очередную историю о вранье политиков. В таких явных случаях вы можете принять решение не верить. Но достаточно ли хорошо вы ощущаете разницу между «Я прочел в The New York Times…» и «Я слышал возле кулера…»? Умеет ли ваша Система 1 различать степени веры? Принцип WYSIATI предполагает, что нет.
Как уже упоминалось, Система 1 не склонна к сомнениям. Она подавляет неоднозначность и самопроизвольно составляет когерентные истории. Если сообщение не отвергается немедленно, то связанные с ним ассоциации будут распространяться так, как если бы оно было верным. Система 2 способна сомневаться, поскольку может одновременно рассматривать несовместимые варианты. Однако поддерживать сомнения труднее, чем уверяться в чем-либо. Закон малых чисел – проявление общей склонности к уверенности вместо сомнений, которая под разными видами еще не раз появится в следующих частях.
Сильная предрасположенность верить, что маленькие выборки точно представляют все население, означает и нечто большее: мы склонны преувеличивать последовательность и когерентность увиденного. Излишняя вера исследователей в результаты нескольких наблюдений сродни эффекту ореола, часто возникающему у нас чувству, что мы знаем и понимаем человека, о котором нам, по сути, известно мало. Система 1 предвосхищает факты, составляя по обрывочным сведениям полную картину. Механизм для поспешных выводов ведет себя так, будто верит в закон малых чисел. В целом он создает чересчур осмысленную картину реальности.
Причина и случай
Ассоциативные механизмы ищут причины. Статистические закономерности трудно воспринимать, потому что к ним требуется принципиально иной подход. Рассматривая событие со статистической точки зрения, мы интересуемся его связью с тем, что могло произойти, а не как именно оно произошло. Никакой особой причины не было, случай выбрал его среди других.
Наша склонность к каузальному мышлению порождает серьезные ошибки в оценке случайности действительно случайных событий. Для примера возьмем пол шести младенцев, родившихся в больнице один за другим. Последовательность появления мальчиков и девочек совершенно случайна: события независимы, а число мальчиков и девочек, родившихся за последние часы, абсолютно не влияет на пол следующего младенца. Теперь рассмотрим три возможные последовательности:
МММДДД
ДДДДДД
МДММДМ
Одинаковая ли у них вероятность? Возникающий интуитивный ответ «Конечно, нет!» – неправильный. Поскольку события независимы, а варианты исхода Д и М примерно равновероятны, любая возможная последовательность полов шести новорожденных так же вероятна, как остальные. Даже сейчас, когда вы знаете, что этот вывод правильный, он все равно противоречит интуиции, потому что только третья строка кажется случайной. Как и можно было ожидать, последовательность МДММДМ считают более вероятной, чем две другие. Мы ищем закономерности, верим в когерентность окружающего мира, где появление на свет шести девочек подряд не случайно, а результат механической причины или чьего-то намерения. Мы не ожидаем, что случайный процесс приведет к регулярным результатам, и, обнаружив нечто, похожее на закономерность, быстро отказываемся от мысли о случайности такого процесса. На самом деле случайные процессы порождают множество последовательностей, подталкивая наблюдателей к убеждению в неслучайности таковых. Разумеется, желание придерживаться каузальности дает определенные эволюционные преимущества: это часть бдительности, унаследованной от предков. Мы автоматически следим за изменениями окружающей среды. Львы появляются на равнине в случайное время, но безопаснее замечать и должным образом реагировать на увеличение частоты появлений львиных прайдов, даже если оно вызвано флуктуациями в случайном процессе.
Широко распространенное непонимание случайности иногда имеет серьезные последствия. В нашей статье о репрезентативности мы с Амосом процитировали статистика Уильяма Феллера, показавшего, как легко найти закономерности там, где их нет. В годы Второй мировой войны считалось, что бомбардировки Лондона совершаются по определенному плану и не могут быть случайными, поскольку на карте распределения очагов поражения выявлялись подозрительные пробелы. Подозревали, что в непострадавших районах живут немецкие шпионы. Тщательный статистический анализ показал, что распределение очагов поражения было типичным для случайного процесса, включая и сам тот факт, что оно вызывало сильное впечатление неслучайности. Феллер говорит: «Для неопытного глаза случайность выглядит как регулярность или тенденция к группированию». Вскоре мне представилась возможность на практике применить наблюдения Феллера. В 1973 году началась четвертая арабо-израильская война, и мой единственный незначительный вклад в нее состоял в том, что я посоветовал высшему командованию израильских ВВС прекратить начатое расследование. Израильские войска понесли значительный урон в результате эффективных воздушных атак противника с применением египетских ракет «земля – воздух». Существенные потери казались неравномерно распределенными: к примеру, из двух эскадрилий, вылетевших с одного аэродрома, одна потеряла четыре самолета, а другая – ни одного. Для выявления ошибок, допущенных пострадавшей эскадрильей, начали расследование. Не было никаких причин считать, что эскадрильи различались по уровню подготовки; никакой разницы в действиях пилотов не обнаружили. Разумеется, жизнь пилотов различалась по множеству случайных показателей, включая, как помнится, частоту поездок домой и методы проведения разборов полетов. Я посоветовал командованию прекратить расследование и смириться с тем, что понесенные потери оказались результатом слепого случая. Я выдвинул следующие аргументы: вероятнее всего, дело в случайности, искать неочевидную причину наугад безнадежно, а пилотов понесшей потери эскадрильи не стоит обременять чувством вины за смерть товарищей.
Через несколько лет Амос и его ученики Том Гилович и Роберт Валлоне опубликовали исследование о неверном восприятии случайности в баскетболе. Среди игроков, тренеров и болельщиков бытует убеждение, что иногда у игроков бывает «легкая рука». Удержаться от такого вывода невозможно: если игрок забрасывает три или четыре мяча подряд, возникает каузальное убеждение, что он будет играть успешнее других. Обе команды подстраиваются под такое решение: «свои» чаще дают удачливому игроку пас, а защита «чужих» старается блокировать его. Анализ тысяч последовательностей бросков привел к неутешительному заключению: в профессиональном баскетболе не бывает бросков «легкой руки» – ни с площадки, ни со штрафной. Конечно, некоторые игроки точнее других, но последовательность успешных бросков и промахов удовлетворяет всем тестам на случайность. Все остальное – выдумки наблюдателей, склонных находить упорядоченность и каузальность в случайных событиях. «Легкая рука» – распространенная когнитивная иллюзия.
Реакция общественности на это исследование весьма показательна: неожиданные выводы привлекли внимание прессы, но восприняли их с огромным недоверием. Знаменитый тренер баскетбольной команды «Бостон Селтикс» Рэд Ауэрбах, услышав об исследовании Гиловича, сказал: «Да кто он такой? Ну, провел исследование, а мне какая разница?» Склонность видеть закономерности в случайном сильнее каких-то там исследований.
Иллюзия закономерности влияет на наши жизни и вне баскетбольных площадок. Сколько выгодных сделок должен заключить ваш финансовый консультант, прежде чем вы решите, что он необычайно эффективен? Какое количество успешных приобретений убедит совет директоров, что у генерального директора талант к подобным сделкам? Простой ответ на эти вопросы гласит, что, следуя интуиции, вы чаще воспримете случайное событие как закономерное. Мы слишком охотно отвергаем мысль о том, что многое в нашей жизни случайно.
Я начал эту часть с примера о частоте заболеваемости раком в США. Он появляется в книге, предназначенной для преподавателей статистики, но я узнал о нем из упомянутой выше статьи Говарда Вейнера и Харриса Цверлинга. Они написали о крупном вкладе в 1,7 миллиарда долларов, сделанном Фондом Гейтса в исследования необычных характеристик самых преуспевающих школ.
Многие пытаются найти секрет успешного образования, определяя высокорезультативные школы в надежде выяснить, чем же они отличаются от остальных. Один из выводов этого исследования состоит в том, что в среднем небольшие школы результативнее. К примеру, в обзоре 1662 школ в Пенсильвании 6 из 50 лучших были небольшими, что в 4 раза превышает реальные показатели. На основании этих данных Фонд Гейтса сделал значительные инвестиции в создание небольших школ, иногда даже путем разделения крупных школ. К нему присоединились и другие известные организации, включая Фонд Анненберга и Благотворительный фонд Пью, а также Программа малых учебных сообществ министерства образования США.
Интуитивно это ощущается как разумное объяснение. Легко составить каузальную историю, объясняющую, почему, в отличие от крупных школ, небольшие учебные заведения дают замечательное образование и, таким образом, выпускают замечательных учеников, уделяя им больше внимания и лучше поощряя их. К несчастью, анализ причин бессмыслен, поскольку неверны факты. Если бы статистики, делавшие доклад в Фонде Гейтса, задались вопросом о характеристиках самых плохих школ, то обнаружилось бы, что плохие школы обычно тоже малочисленные. Дело в том, что в среднем маленькие школы ничуть не лучше, у них просто выше изменчивость. Вейнер и Цверлинг утверждают, что большие школы дают лучшие результаты, особенно в старших классах, когда важно большее разнообразие доступных предметов.
Благодаря последним открытиям когнитивной психологии очевидно то, что мы с Амосом заметили лишь мельком: закон малых чисел – один из многих, объясняющих, как устроен наш разум.
• Преувеличенная вера в маленькие выборки – один из примеров общей иллюзии: мы обращаем больше внимания на содержание сообщений, чем на информацию об их надежности, и в результате получаем более простую и связную картину окружающего мира, чем предполагают данные. Поспешные выводы безопаснее делать в воображении, но не в действительности.
• Статистика порождает много наблюдений, которые, казалось бы, требуют каузальных объяснений, но на самом деле им не подлежат. Вероятность отвечает за множество событий, включая случайность выборки. Каузальное объяснение случайностей неминуемо будет неправильным.
Разговоры о законе малых чисел
«Да, с приходом нового директора студия сняла три успешных фильма, но еще слишком рано говорить, что у него легкая рука».
«Я не поверю, что новый трейдер – гений, пока не посоветуюсь со статистиком, способным оценить вероятность того, что эти удачи – не просто воля случая».
«Выборка слишком маленькая, чтобы делать выводы. Давайте не будем следовать закону малых чисел».
«Я планирую держать результаты эксперимента в тайне, пока у нас не будет достаточно большой выборки, иначе нас заставят сделать выводы раньше времени».
11
Эффект привязки
Мы с Амосом как-то раз подкрутили рулетку, размеченную от 0 до 100, таким образом, что она останавливалась только на цифрах «10» или «65». Участниками эксперимента стали студенты Орегонского университета. Мы раскручивали колесо и просили испытуемых записать число, на котором останавливалась рулетка (то есть 10 или 65). Затем мы задавали им два вопроса:
Доля африканских стран среди членов ООН больше или меньше числа, которое вы только что записали?