Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет Сильвер Нейт
По словам Хациуса, потребители пользовались слишком большим кредитом, чтобы заплатить за дома, стоимость которых из-за пузыря на жилищном рынке стала для большинства из них недоступной. Многие перестали платить по ипотеке, а это могло привести к еще более значительным потерям. Степень левериджа в системе могла бы лишь усилить эту проблему, парализуя кредитный рынок, да и всю систему финансовых услуг в целом. Шок может быть достаточно серьезным и подтолкнуть к возникновению сильной рецессии.
Именно это и произошло, когда разразился финансовый кризис. Прогноз Хациуса оказался не просто верным: в нем были правильно указаны причины кризиса и дано объяснение как причин, так и возможных последствий происходившего. Сам Хациус называет эту цепочку причинно-следственных событий «историей». И хотя эта история об экономике и управляется данными, ее корни лежат во вполне реальном мире.
Напротив, если вы будете рассматривать экономику как набор переменных и уравнений, не принимая во внимание ее фундаментальную структуру, то почти гарантированно ошибетесь и примете шум за сигнал, ошибочно заставив себя (и доверчивых инвесторов) думать, что вы создаете хороший прогноз, хотя на самом деле это не так. Давайте посмотрим, что произошло с одним из конкурентов Хациуса – компанией ECRI.
В сентябре 2011 г. ECRI говорила о почти гарантированной глубокой рецессии.
«Политики ничего не могут сделать для исправления ситуации, – утверждалось в заявлении компани{425}. – Если вы думаете, что происходящее сейчас – это плохое состояние экономики, то считайте, что вы еще ничего не видели». В интервью управляющий директор компании Лакшман Ахутхан предположил, что рецессия может начаться прямо сейчас, если уже не началась{426}. Компания обосновала свое заключение следующим образом:
«Наше мнение об угрозе рецессии основано не на одном или двух опережающих индексах, а на десятке специализированных показателей, в том числе долговременных основных показателях США… за которыми следует снижение еженедельных основных показателей и других, более коротких опережающих индексов. По сути, большинство надежных прогнозных индикаторов ведет себя так, как если бы мы находились на пороге полноценной рецессии»{427}.
Это заключение написано на профессиональном языке, однако ему недостает реальной экономической сути. Это – повествование о данных, как будто данные сами по себе способны вызвать рецессию, а не об экономике. Но компания ECRI гордится таким подходом. В 2004 г. в документе, адресованном клиентам, ее руководители писали: «Так же, как вам, чтобы ездить на автомобиле не нужно точно знать, как работает его двигатель, вам не нужно понимать все тонкости экономики для того, чтобы пользоваться сделанными нами выводами»{428}.
Подобные заявления становятся все более распространенными в эпоху Больших данных{429}. Кому нужна теория, когда у вас так много информации? Однако подобная точка зрения категорически неверна в области прогнозов, особенно экономических, где данные наполнены шумом. Статистические выкладки кажутся куда более убедительными, если они подкреплены теорией или хотя бы сопровождаются глубоким размышлением об их фундаментальной основе. Разумеется, в сентябре 2011 г. имелись причины для экономического пессимизма{430} – например, долговой кризис, разворачивавшийся в Европе, – однако ECRI даже не смотрела в сторону этих событий. Вместо этого она варила суп из случайных переменных, принимая совпадение за причинно-следственную зависимость{431}.
Следует отметить, что после прогноза ECRI в экономике действительно возникла поворотная точка – однако она была позитивной. Показатель S&P 500 набрал 21 % за пять месяцев после того, как после ECRI заявила о возможной рецессии{432}, а рост ВВП составил в последнем квартале 2011 г. неплохие 3 % вместо того, чтобы упасть в результате рецессии. ECRI пустилась в объяснения о том, что воздействие позитивных факторов усилилось в 2012 г., что невозможно было предсказать изначально{433}.
Когда предвзятые прогнозы оказываются рациональными
Если вам действительно нужен экономический прогноз, то лучше всего обращаться к средним или обобщенным прогнозам, чем к прогнозам отдельных экономистов. Мое исследование обзоров профессиональных прогнозистов в сфере экономики SPF показало, что обобщенные прогнозы примерно на 20 % точнее, чем индивидуальные, предсказывают величину ВВП, на 10 % – уровень безработицы и на 30 % – уровень инфляции{434}. Эта особенность – групповые прогнозы переигрывают индивидуальные – проявлялась почти в любой области, где проводились подобные исследования.
И хотя идея о том, что обобщенные прогнозы оказываются лучше индивидуальных, может считаться важной с эмпирической точки зрения, порой она используется как отговорка, препятствующая улучшению прогнозов. Обобщенный прогноз создается из отдельных; и если они улучшаются, то улучшается и групповой результат. Более того, даже обобщенные экономические прогнозы оказываются достаточно плохими с точки зрения работы в реальном времени, так что в этом вопросе есть над чем работать.
Большинство экономистов высказывает свои суждения при создании прогноза с определенными условиями, а не делятся результатами статистической модели как таковой. С учетом того, насколько сильно данные забиты шумом, это имеет смысл. Исследование Стивена К. Макнесса, бывшего вице-президента Федерального резервного банка Бостона, показало, что корректировки методов статистических прогнозов, связанные с теми или иными суждениями, позволяют повысить точность прогнозов примерно на 15 %{435}. Идея о том, что статистическая модель будет способна «решить» проблему экономического прогнозирования, была довольно расплывчатой в 1970е и 1980е гг., когда компьютеры только начинали получать широкое распространение. Однако, как и в других областях (например, при предсказании землетрясений), улучшение технологий не компенсировало недостатка теоретического понимания экономики. По сути, компьютеры дали экономистам лишь более быстрые и продвинутые способы ошибочно принимать шум за сигнал. Модели, прежде казавшиеся многообещающими, в тот или иной момент терпели поражение и отправлялись в мусорное ведро{436}.
Свою роль в развитии искажений играют и человеческие суждения. Вы можете создать прогноз, который волшебным образом станет соответствовать вашим экономическим стимулам или политическим убеждениям. Вы можете возгордиться и не захотите изменить его, даже когда этого потребуют факты и обстоятельства. «Я думаю, что у людей есть одна тенденция, которой стоит активно противостоять, – сказал мне Хациус, – она заключается в том, что человек воспринимает информационный поток таким, каким он хочет его видеть». Но есть ли экономисты, которым удается лучше других управлять этим компромиссом? Можно ли считать, что экономист, правильно предсказавший рецессию в прошлом, сможет предсказать и будущую? На этот вопрос есть интересный ответ.
Когда мы, чтобы оценить умение прогнозировать, применили статистические методы анализа к данным SPF, результат оказался в целом негативным{437}.
Иными словами, при изучении результатов мы не можем сделать вывод о том, что некоторые экономисты обычно создают более хорошие прогнозы, чем остальные. Однако изучение прогнозов другой группы экспертов – от компаний «голубых фишек» (Blue Chip Economic Survey) – позволило получить более позитивные результаты{438}. Разумеется, в экономическом прогнозировании велика доля удачи: экономисты, которые последовательно защищают «медвежью» или «бычью» точку зрения, время от времени гарантированно будут правы. Однако исследования мнения экспертов «голубых фишек» показали, что некоторым из них действительно удается создавать лучшие прогнозы на долгосрочную перспективу.
В чем состоит разница между двумя опросами? Опрос SPF проводится анонимно: каждый экономист получает случайный номер, не меняющийся от опроса к опросу, однако у читателей нет никакой возможности понять, кто скрывается за тем или иным номером. В рамках опроса «голубых фишек» прогноз каждого участника подкрепляется его именем и репутацией.
Если рядом с прогнозом стоит ваше имя, это может привести к изменению структуры ваших стимулов. Допустим, вы работаете на малоизвестную компанию. В этом случае для вас может иметь смысл создавать достаточно дикие прогнозы – пусть они и не будут сбываться достаточно часто, но в случае успеха вам гарантировано должное внимание. С другой стороны, сотрудники компаний типа Goldman Sachs должны вести себя более консервативно, для того чтобы оставаться в рамках консенсуса.
Именно это и было выявлено в результате исследования прогнозов Blue Chip{439} – довольно заметное явление под названием «искажения из соображений рациональности»{40}. Чем менее известно ваше имя, тем меньше вы можете потерять, принимая на себя риски, связанные с прогнозами. Даже если вы знаете, что вы немного лукавите в своем прогнозе, для вас может иметь смысл попытаться сделать большую ставку. С другой стороны, если у вас уже имеется серьезная репутация, вы, возможно, не захотите слишком отклоняться от общей точки зрения, даже в том случае, когда, по вашему мнению, это следует из имеющихся данных.
Каждое из этих опасений, связанных с вашей репутацией, способно отвлечь вас от основной цели – создания наиболее честных и точных прогнозов. Несмотря на довольно незначительные различия, исторические данные по анонимным участникам SPF показывают, что им удавалось немного лучше предсказывать показатели ВВП и безработицы, чем участникам экспертов из «голубых фишек», заботящихся о своей репутации{441}.
Преодоление искажений
Если оказалось, что создавать плохие прогнозы рационально, то можно предположить, что у таких прогнозов есть свой рынок и есть потребители, способствующие их развитию. Подобно тому как в политике существует целая группа экспертов, делающих карьеру на том, что они предлагают довольно дикие идеи аудиториям, состоящим из представителей той или иной партии, в экономике также имеются свои «медведи», «быки» и прочие участники, которые всегда захотят прислушаться к вашим выводам. Иногда экономические прогнозы напрямую связаны с политическими целями (расчеты показывают, что экономические прогнозы, созданные Белым домом, исторически были одними из самых неточных{442}, вне зависимости от того, кто занимал пост президента – демократ или республиканец).
Однако, когда речь заходит об экономическом прогнозировании, ставки значительно повышаются. Как отметил Роберт Лукас, линия между экономическим прогнозированием и экономической политикой достаточно размыта. Плохой прогноз способен ухудшить ситуацию в реальной экономике.
Впрочем, можно надеяться, что процесс экономического прогнозирования значительно улучшится в дальнейшем за счет использования новых технологических усовершенствований. Например, поисковый трафик Google может уже сейчас служить опережающим индикатором для ряда экономических показателей, таких как уровень безработицы.
«Давайте рассуждать: показатель запросов, связанных со страховками на случай потери работы, может служить хорошим индикатором, предсказывающим уровень безработицы, а тот, в свою очередь, хорошим индикатором, предсказывающим уровень экономической активности», – рассказывал мне главный экономист Google Хэл Вариан во время моего визита в головной офис Google в Маунтин-Вью, штат Калифорния.
«Мы можем предсказать рост количества таких страховок заранее. Если вы работаете в компании, в которой начинают ходить слухи о сокращении штатов в ближайшем будущем, сотрудники начинают создавать поисковые запросы типа “Где находится ближайший офис бюро занятости”, “как подавать заявление на бирже труда” и т. д. Так что это вполне может рассматриваться как некий опережающий индикатор». Тем не менее история прогнозирования в экономике и других областях показывает, что технологические усовершенствования не приносят особой пользы, если они компенсируются человеческими предубеждениями. У нас нет серьезных оснований считать, что экономическое прогнозирование не подвержено влиянию таких предубеждений. Например, прогнозисты, по всей видимости, ничему не научились на опыте с Великой рецессией. Если посмотреть на прогнозы роста ВВП, сделанные участниками SPF в ноябре 2011 г. (рис. 6.6), то мы увидим, как проявляется та же самоуверенность, что и в 2007 г. Экономические сценарии, как позитивные, так и негативные, создаются с невероятной лихостью, никак не учитывающей степень исторической правильности прежних прогнозов{443}.
Рис. 6.6. Прогнозируемое распределение вероятностей: реальный рост ВВП США (2012 г.) и исторические ошибки прогнозирования (по данным SPF, ноябрь 2011 г.)
Если мы захотим снизить влияние таких искажений – а мы никогда не сможем избавиться от них полностью, – то у нас имеются два фундаментальных альтернативных способа. Первый связан с предложением точных экономических прогнозов, а второй – со снижением спроса на неточные или слишком самоуверенные прогнозы. Робин Хэнсон, экономист Университета Джорджа Мэйсона, относится к серьезным защитникам первого подхода. Мы встретились с ним за обедом в одном из его любимых марокканских ресторанов в Северной Виргинии. Робину уже за 50, но выглядит он значительно моложе (несмотря на довольно большую лысину). Он склонен к эксцентричным поступкам. Так, он планирует, что после смерти его голова будет заморожена в криогенной камере{444}. Кроме этого, он поддерживает идею системы, которую сам называет «футархией» (futarchy), при которой решения политических вопросов принимаются не политиками, а по итогам работы рынков предсказаний{445}. Совершенно очевидно: этот человек не боится бросить вызов общепринятым точкам зрения.
«Я думаю, что самый интересный вопрос состоит в том, как мало усилий мы в реальности прикладываем к прогнозированию даже тех вещей, которые, по нашим словам, для нас крайне важны, – сказал мне Хэнсон, как только нам принесли обед. – В школах MBA часто рисуется образ менеджера как автора великих решений – человека, принимающего решения “по науке”. У него есть электронные таблицы, статистика, и он умеет взвешивать различные варианты. Однако на практике менеджмент значительно сильнее связан с управлением коалициями, поддерживающими тот или иной проект. В случае если вы создали коалицию, а затем в самый последний момент прогнозы начинают меняться, вы же не отбрасываете проект в сторону?»
«Судя по всему, в сборе данных о качестве исторических прогнозов не заинтересованы даже академические ученые, – добавил он позже. – Возможно, они не видят в этом смысла? Куда более фундаментальная проблема состоит в том, что в нашем обществе есть спрос на экспертов, но нет спроса на точные прогнозы». В качестве решения этой проблемы Хэнсон пропагандируют идею создания рынков предсказания – систем, в которых вы можете делать ставки на определенный экономический или политический исход, например, вступит ли Израиль в войну с Ираном или насколько вырастет глобальная температура вследствие климатических изменений. Его точка зрения в данном вопросе достаточно проста: возникающие при этом методе финансовые риски заставляют нас быть более точными и не пытаться хорошо выглядеть в глазах других.
Мы еще вернемся к идее рынков предсказаний в главе 11. Разумеется, она не является панацеей, особенно если мы допустим ошибку и предположим, что эта система никогда не может ошибаться сама по себе. Однако, по словам Хэнсона, она способна улучшить, хотя бы отчасти, систему стимулирования экспертов.
Эта система может применяться, например, для оценки макроэкономических переменных типа величины ВВП или уровня безработицы. Уже сейчас имеется довольно много прямых и косвенных способов делать ставки на величину показателей инфляции, процентных ставок и цены на товары, но пока что не создано сколь-нибудь важного рынка для оценок ВВП.
У таких рынков может найтись своя аудитория. Не так давно четко проявлялась корреляция между ценами на акции и макроэкономическими рисками{446}, поэтому в данном случае они могут выступать в качестве своеобразного инструмента хеджирования. Эти рынки смогут также предоставлять информацию в режиме реального времени политикам, выступая, по сути, инструментом постоянного обновления прогнозов по ВВП. Если добавить в систему несколько вариантов ответа – скажем, ставки на то, что ВВП вырастет на 5 % и снизится на 2 %, – это позволит наказать слишком самоуверенных прогнозистов и обеспечит более надежные расчеты неопределенностей, присущих прогнозированию экономики.
На осуществление другого решения, связанного со спросом, потребуется значительно больше времени. В сущности, оно предполагает, что мы должны стать лучше в качестве потребителей прогнозов. В контексте экономического прогнозирования это может означать, что нам следует отвернуться от шарлатанов с их «черными ящиками», набитыми случайными комбинациями опережающих индикаторов, и обратиться в сторону людей типа Яна Хациуса, рассказывающих о сути экономических явлений. Также из этого может следовать вывод о том, что необходимо уделять больше внимания уровню шума в экономических показателях и прогнозах. Возможно, нам надо потребовать, чтобы в расчетах ВВП указывались пределы их точности, так же как это происходит в опросах на политические темы.
В более общем смысле это означает, что мы должны признать следующее. Объем доверия, который мы выражаем к тому или иному прогнозу, еще не говорит о его правильности. Напротив, между этими качествами может иметься обратная зависимость. Самая главная опасность – как в экономике, так и в других областях – возникает, когда мы препятствуем прогнозистам, желающим максимально полно и детально описать риски, присущие окружающему нас миру.
Глава 7
Ролевые модели
Грипп обрушивался на Форт-Дикс[91] каждый год, как по часам. Он стал своеобразным обрядом посвящения. Большинство солдат разъезжалось на Рождество по домам, расположенным по всей территории Соединенных Штатов. Возвращались же они на базу сытыми, хорошо отдохнувшими, но при этом «прихватывали» и переносили любые вирусы, которые только могли найтись в их родных городах. Если где-то в стране царил грипп, то обычно он «прибывал» вместе с ними. В казарме трудно уединиться. Если даже один солдат заболевал гриппом, обстановка казармы становилась чуть ли не идеальным условием для переноса болезни.
Такое положение дел обычно не вызывало особого беспокойства – десятки миллионов американцев ежегодно заболевают гриппом в январе-феврале. И очень малое количество заболевших умирает от этой болезни. Исключением не были и молодые мужчины, такие как Дэвид Льюис, 19-летний рядовой из Уэст-Эшли, штат Массачусетс, который вернулся в Форт-Дикс после отпуска. Поэтому Льюис, хотя и чувствовал себя хуже других новобранцев и мог остаться в казарме, решил не отставать от товарищей и отправился в 80-километровый переход через покрытые снегом равнины центральной части штата Нью-Джерси. Он совсем не хотел, чтобы небольшая лихорадка ему помешала. На дворе стоял 1976 г. – год 200-летия основания страны, которая так нуждалась в порядке и дисциплине после Уотергейта и Вьетнама{447}.
Но Льюис так и не вернулся в казарму. Пройдя 20 км после начала марш-броска, он потерял сознание, а затем был объявлен умершим. Вскрытие показало, что легкие Льюиса наполнены кровью. Он умер от воспаления легких – типичного осложнения, вызванного гриппом, которое, однако, редко приводит к смерти здоровых и молодых людей.
Медики Форт-Дикс к тому времени уже были обеспокоены ситуацией на базе. Несмотря на то что у нескольких сотен солдат, заболевших гриппом той зимой, был выявлен штамм A/Victoria (распространенный и сравнительно безопасный вирус, путешествовавший в том году по всему миру{448}), им пришлось столкнуться и с более тяжелыми случаями заболеваний, такими как у Льюиса, пострадавшего от другой, малоизвестной и, по всей видимости, гораздо более опасной разновидности гриппа. Образцы крови Льюиса были отправлены Центр по контролю за заболеваниями (Center for Disease Control – CDC), который находится в Атланте, для дальнейшего исследования.
Через две недели CDC удалось распознать этот таинственный вирус. Это была не новая разновидность, а скорее, пугающий призрак прошлых эпидемий – вирус инфлюэнцы типа H1N1, более часто известный под названием «свиной грипп». Именно он вызывал самую страшную пандемию в современной истории – «испанку» 1918–1920 гг., во время которой заболело 30 % населения планеты и умерло 50 млн человек, в том числе 675 тыс. в Соединенных Штатах{449}. Это открытие взволновало все эпидемиологическое сообщество страны, причем не только с научной точки зрения, не последнюю роль сыграло и суеверие. Эпидемия 1918 г. также началась на военной базе Форт-Райли в Канзасе, где солдаты готовились к вступлению в Первую мировую войну{450}. Более того, в то время существовало убеждение – основанное на довольно хлипких научных свидетельствах, – что серьезная эпидемия гриппа проявляется примерно каждые 10 лет{451}. Всплески гриппа наблюдались в 1938, 1947, 1957 и 1968 гг.{452}; поэтому в 1976 г. мир готовился к новой пандемии.
Вскоре появились и пугающие предсказания. Проблема была связана не с текущей вспышкой, к тому времени как CDC удалось выявить штамм N1H1, сезон гриппа уже почти исчерпал себя. Однако ученые опасались, что следующей зимой может произойти нечто куда более страшное. Как писал в газете New York Times один видный врач{453}, на практике никогда не было случая, чтобы новый штамм гриппа не смог бы вытеснить своих конкурентов и не стать глобальным гегемоном. Иными словами, достаточно слабый штамм A/Victoria не имел никаких шансов выстоять в борьбе против своего опасного и изобретательного соперника. Если бы в мире начала развиваться эпидемия, хотя бы отдаленно похожая на события 1918 г., то можно было бы ожидать самых страшных последствий. По оценкам Ф. Дэвида Мэтьюса, советника по вопросам здравоохранения президента Джеральда Форда, в результате могло бы умереть до 1 млн американцев, значительно больше, чем в 1918 г.{454}.
Президент Форд оказался в затруднительном положении. Перед тем как начать изготавливать вакцины в промышленных масштабах, как это происходит и в индустрии моды, требуется по крайней мере шесть месяцев для того, чтобы понять, какая вакцина будет самой популярной в следующем сезоне. Формула немного меняется каждый год. Если создавать вакцину против H1N1 необходимо – особенно в количествах, достаточных для спасения всей страны, – работу нужно было начинать немедленно. Между тем Форд старался изменить общественное мнение, считавшее его медленно соображающим и неуверенным в себе. Это впечатление усиливалось с каждым уик-эндом благодаря талантливым пародиям актера Чеви Чейза, выходившим на канале NBC в новом популярном шоу под названием «Saturday Night Live». Поэтому Форд решил сделать решительный шаг и попросил Конгресс заказать около 200 млн доз вакцины и запустить программу массовой вакцинации. Программ такого масштаба у страны не было со времен, когда Йонас Солк разработал вакцину от полиомиелита в 1950е гг.
Пресса очень скептически отнеслась к новой программе массовой вакцинации, назвав происходившее азартной игрой{455}. Однако Форд понимал, что это игра между деньгами и жизнями и что он сам находится на правильной стороне. Подавляющее большинство обеих палат Конгресса одобрило его планы, на реализацию которых требовалось 180 млн долл.{456}.
Тем не менее к лету начали появляться серьезные сомнения, касающиеся планов правительства. Хотя лето обычно не сезон для гриппа в США{457}, в Южном полушарии была зима, время, когда грипп обычно достигает пика. И нигде, от Окленда до Аргентины, не было следов H1N1; напротив, вновь стал доминировать умеренный и привычный штамм A/Victoria. По сути, две сотни заболевших в Форт-Дикс стали единственными подтвержденными случаями возникновения H1N1 в мире, а рядовой Льюис – единственной жертвой. На программу обрушился нескончаемый поток критики – буквально со всех сторон. Ее критиковали и помощик директора CDC{458}, и Всемирная Организация Здравоохранения{459}, и престижный британский медицинский журнал Lancet{460}, и редакторы New York Times, охарактеризовавшие угрозу H1N1 как «ложную тревогу»{461}. Ни одна другая западная страна не призвала принять столь же решительные меры, как это сделали США.
Вместо того чтобы признаться в том, что угроза оказалась переоцененной, администрация Форда решила нанести ответный удар. Она подготовила серию довольно пугающих объявлений и запустила их в регулярную ротацию на национальных телевизионных каналах{462}. В одном ролике высмеивалась наивность людей, отказывавшихся от прививки. Сначала герой, изображавший довольно типичного американца, говорил: «Я самый здоровый 55-летний человек, которого вам только доводилось видеть, – я играю в гольф каждые выходные!» – а в следующем кадре он уже лежал на смертном одре. В другом хриплый женский голос повествовал о том, как вирус передавался от одного человека другому, причем так, что у зрителей возникали ассоциации с заболеванием, передававшимся половым путем: «Мать Бетти передала его водителю такси… и одной из тех очаровательных стюардесс… а та передала его своей подруге Дотти, у который случился сердечный приступ, и она умерла».
Эти довольно манерные ролики были призваны донести до зрителей очень серьезное сообщение – американцам нужно было бояться, и бояться очень сильно. Страна заглотнула наживку. Однако страх проявился скорее по отношению к вакцине, чем к самой болезни. На протяжении всей американской истории сама мысль о том, что правительство тыкает иголки в руки жителям, всегда вызывала серьезное беспокойство. Однако на этот раз причины для общественного беспокойства были куда более серьезными. В августе того же года под давлением компаний – изготовителей лекарств Конгресс и Белый дом согласились освободить их от юридической ответственности в случае производственных дефектов. Общественность восприняла это как вотум недоверия. Казалось, что правительство торопится выпустить в свет вакцину, которая не была протестирована в течение времени, необходимого для полного исследования. Проведенные тем летом опросы показали, что лишь около 50 % американцев планировали сделать прививку, и это значение оказалось очень далеким от той цели – вакцинации 80 % населения, поставленной правительством{463}.
Волнение достигло апогея только в октябре, когда началась программа вакцинации. 11 октября появился отчет из Питтсбурга о том, что три пенсионера умерли вскоре после прививки. То же самое произошло с двумя стариками в Оклахома-Сити, а потом еще с одним в Форт-Лодердейле{464}. На самом деле ничто не свидетельствовало о том, что эти смерти были связаны с вакцинацией – в конце концов, пожилые люди умирают каждый день{465}. Однако в тех условиях, когда люди проявляли беспокойство по поводу правительственной программы вакцинации и при этом плохо разбирались в тех статистических данных, что узнавали из СМИ{466}, каждая смерть человека, сделавшего прививку, становилась поводом для тревоги. Даже журналист Уолтер Кронкайт, человек, которому верило большинство американцев, отказался от своей привычной сдержанности и призвал СМИ успокоиться, однако безрезультатно. Клиники в Питтсбурге и многих других городах были закрыты{467}.
К концу осени возникла еще одна проблема, куда более серьезная. Около 500 пациентов, получивших прививку, начали испытывать симптомы редкого неврологического расстройства, известного как синдром Гийена – Барре (аутоиммунного расстройства, способного вызвать паралич). На этот раз статистические данные выглядели гораздо более убедительными – обычная заболеваемость синдромом Гийена – Барре в популяции – примерно один случай на 1 млн человек{468}. Показатель для населения, получившего прививку, был в 10 раз выше – 500 случаев на 50 млн человек. Хотя ученые и не были до конца уверены в причинах, вызывавших синдром, но наиболее правдоподобным виновником были названы производственные дефекты, связанные с лихорадочным графиком работ{469}. Медицинское сообщество пришло к единому мнению{470}: эта программа вакцинации должна быть закрыта навсегда, и правительство наконец сделало это 16 декабря.
В конце концов всплеск H1N1 в Форт-Дикс оказался полностью изолирован; в стране больше не выявили ни одного подтвержденного случая заболевания{471}. При этом смертность от обычного штамма A/Victoria зимой 1976/77 г. оказалась чуть ниже среднего значения{472}. По сути, ситуацию можно было описать выражением «много шума из ничего».
Эта история, вскоре получившая название «фиаско свиного гриппа», оказалась катастрофической для президента Форда. В ноябре того же года он проиграл очередные выборы демократу Джимми Картеру{473}. Производители лекарств были освобождены от какой-либо юридической ответственности, в связи с чем граждане обратились в суд против правительства Соединенных Штатов, выдвинув иски на общую сумму 2,6 млрд долл.{474}. Казалось, что каждая местная газета опубликовала статью о бедной официантке или школьном учителе, который исполнил свой долг и сделал прививку, после чего пострадал от синдрома Гийена – Барре. Количество американцев, готовых получить прививку от гриппа, снизилось примерно до 1 млн человек{475}, что могло привести к смертельной угрозе для страны, если бы на нее в 1978 или 1979 гг. обрушился более серьезный штамм гриппа{476}.
Действия президента Форда в этой ситуации были безответственными сразу на нескольких уровнях. Для начала он выстроил прямые параллели с событиями 1918 г., тем самым выступив против мнения медицинских экспертов (считавших, что вероятность столь неблагоприятного исхода составляет всего от 2 до 35 %){477}.
Тем не менее до сих пор осталось неясным, что способствовало исчезновению H1N1 – столь же внезапному, как и его появление. Прогнозы, сделанные в отношении этого штамма, имели значительно больше шансов сбыться, когда он вернулся примерно 33 года спустя. Поначалу, после первых признаков возвращения H1N1 в 2009 г., ученые не обратили на него внимания, а затем, как только он проявил себя достаточно серьезно, они значительно переоценили угрозу.
Фиаско свиного гриппа, часть вторая?
Важную роль в распространении вируса играют птицы, особенно дикие морские птицы типа альбатросов, чаек, уток, лебедей и гусей, которые переносят его гены с одного континента на другой, но редко сами заболевают. Они передают его другим биологическим видам – особенно свиньям и одомашненным птицам, таким как куры{478}, которые живут в большей близости к человеку. Куры могут заболеть гриппом, но обычно достаточно хорошо с ним справляются, выживают и передают своим хозяевам. Свиньям это удается еще лучше, поскольку они восприимчивы и к человеческим, и к птичьим заболеваниям (не говоря уже о своих собственных). По сути, они могут представлять собой своеобразный «сосуд», в котором различные штаммы вируса могут смешиваться и мутировать вместе{479}.
Таким образом, идеальным инкубатором для свиного гриппа будет регион, в котором соблюдаются три условия.
1. Люди и свиньи живут в тесной близости друг к другу, то есть свинина в этом регионе является одним из основных продуктов питания.
2. Местность должна находиться вблизи от океана, что создает условия для осуществления контакта между свиньями и мореплавающими птицами.
3. Большая вероятность, что это регион одной из развивающихся стран, где из-за бедности более низкий уровень гигиены и санитарии, что позволяет вирусам животных легче передаваться людям.
Эти три условия почти идеально описывают такие страны Юго-Восточной Азии, как Китай, Индонезия, Таиланд и Вьетнам (в одном только Китае живет почти половина всего мирового поголовья свиней{480}). Данные страны часто становятся местом зарождения различных штаммов гриппа, вызывающих заболевания животных и потенциально способных привести к глобальной пандемии[92]. Поэтому они уже давно стали объектом пристального внимания медицинского сообщества, особенно в последние годы, когда усилился страх появления очередного штамма вируса. В течение ряда лет в Восточной Азии вызревал штамм H5N1, известный как «птичий грипп», различные мутации которого могут привести к невероятно опасным последствиям.
Однако опасный регион не ограничивается Азией. Например, в мексиканском штате Веракрус условия для распространения гриппа столь же благоприятны. Веракрус располагается на берегу Мексиканского залива, а сама Мексика – развивающаяся страна, в кулинарных традициях которой делается большой акцент на свинине{481}. Именно в штате Веракрус, в регионе, на которой обращало внимание крайне мало ученых{482}, и начался всплеск H1N1 2009 г.{483}.
К концу апреля 2009 г. ученые начали получить огромное количество данных о заболеваниях свиным гриппом в штате Веракрус и других частях Мексики. В некоторых отчетах приводилась цифра о 1900 случаях заболевания H1N1 в Мексике и порядка 150 смертельных исходов. Соотношение этих двух цифр, известное как «смертность», казалось очень высоким: от этого гриппа умерло около 8 % заразившихся людей, что превышало показатели для эпидемии «испанки»{484}.
Более того, многие из умерших были сравнительно молодыми и здоровыми взрослыми людьми (что часто считается еще одной характеристикой серьезной проблемы). Вирусу удавалось успешно репродуцироваться. Случаи заболевания были выявлены в Канаде, Испании, Великобритании, Израиле, Новой Зеландии, Германии, Нидерландах, Швейцарии и Ирландии (помимо Мексики и Соединенных Штатов){485}.
Внезапно показалось, что именно H1N1– а не H5N1– и есть тот враг, появления которого ученые боялись все эти годы. Мехико оказался фактически закрыт на карантин; европейские страны порекомендовали своим гражданам не ездить в Мексику или США. Фондовые рынки в Гонконге и Сингапуре (странах, особенно обеспокоенных пандемией гриппа) испытали резкое падение{486}.
Однако вскоре опасения поутихли. Хотя свиной грипп и распространялся в США невероятно быстро – начиная с 20 подтвержденных случаев 26 апреля до 2618 уже 15 днями позже{487}, в большинстве случаев заболевание протекало достаточно умеренно. В США было подтверждено всего три смертельных исхода, то есть показатель смертности был вполне сопоставим с таковым при заболевании обычным гриппом. Уже через неделю после того, как всем казалось, что свиной грипп обладает безграничным разрушительным потенциалом, CDC порекомендовала вновь открыть закрытые школы.
Однако болезнь продолжала распространяться по всему миру, и к июню 2009 г. ВОЗ присвоила ей шестой уровень, то есть самый высокий уровень угрозы. Ученые боялись, что болезнь будет распространяться в тех же масштабах, что и эпидемия «испанки» 1918 г., которая поначалу была достаточно умеренной, однако ее вторая и третья волны оказались смертельно опасными (рис. 7.1). К августу настроение жителей США вновь сменилось на пессимистичное. Власти страны начали описывать «вполне правдоподобный сценарий», при котором до половины населения страны могло быть инфицировано свиным гриппом, а около 90 тыс. американцев могло умереть{488}.
Рис. 7.1. Смертность в результате вспышек заболеваний вирусом H1N1 в 1918–919 гг.
Однако эти прогнозы оказались необоснованными. В конце концов правительство США сообщило о том, что в 2009 г. штаммом H1N1 оказалось инфицировано около 50 млн американцев, то есть не половина, а примерно одна шестая часть населения страны, и что от болезни умерло 11 тыс. человек{489}. Штамм H1N1 оказался на удивление умеренным, и смертность составила всего 0,02 %. Фактически от гриппа в 2009–2010 гг. умерло чуть меньше людей, чем в любой другой год{490}. Конечно, эта ошибка в данных была не столь эпической, как в 1976 г., однако прогнозы оказались неудачными от начала и до конца.
Нет никаких гарантий, что прогнозы распространения гриппа будут лучше в следующий раз. Грипп и другие инфекционные заболевания обладают рядом свойств, вследствие которых их распространение очень сложно предсказать.
Опасность экстраполяции
Экстраполяция является одним из основных методов прогнозирования, порой слишком простым. В сущности, это предположение о том, что текущая тенденция будет развиваться и в будущем, причем до бесконечности. Некоторые самые известные неудачные предсказания были сделаны именно вследствие слишком вольного обращения с подобным предположением.
Например, на рубеже XX в. многие градостроители были обеспокоены увеличением использования конных экипажей, следствием использования которых было загрязнение улиц конским навозом. Один из авторов газеты Times of London предсказывал, что если в 1894 г. улицы Лондона, фигурально выражаясь, погрязли по колено в навозе, то к 1940м гг. они окажутся погребенными под трехметровой толщей этой субстанции{491}. К счастью, примерно через 10 лет после публикации этой статьи Генри Форд начал производить первые прототипы автомобиля «Модели Т», и подобного кризиса удалось избежать.
Экстраполяция также стала виновником и некоторых других неудачных предсказаний, связанных с ростом населения. Возможно, самые первые серьезные усилия по предсказанию роста населения в мире были предприняты английским экономистом сэром Уильямом Петти в 1682 г.{492}. В то время статистика населения была не особенно доступна, и Петти выполнил большую инновационную работу, чтобы рассчитать (достаточно точно), что темп роста населения в XVII в. был довольно медленным. Однако затем он совершенно неверно предположил, что события в будущем станут развиваться точно такими же темпами, и, согласно его прогнозам, глобальное население планеты в 2012 г. должно было составить всего чуть более 700 млн человек{493}.
Через сто лет началась промышленная революция, и население начало расти значительно быстрее. В реальности количество жителей планеты, перевалившее за 7 млрд в конце 2011 г.{494}, примерно в 10 раз больше, чем следовало из прогнозов Петти.
В 1968 г. была издана достаточно противоречивая книга «Демографическая бомба» (Paul Ehrlich «Population Bomb»), написанная биологом из Стэнфорда Полом Р. Эрлихом и его женой, Анной Эрлих. В ней была допущена противоположная ошибка. Авторы этой книги совершенно ошибочно предположили, что от голода в 1970е гг. умрут сотни миллионов людей{495}. Неудача этого предсказания бла вызвана огромным количеством причин, в том числе и склонностью Эрлихов концентрироваться на самых страшных сценариях, чтобы привлечь внимание к своей точке зрения. Однако одна значительная проблема состояла в том, что они предполагали сохранение высокого уровня рождаемости, присущего эре свободной любви 1960х гг., и в будущем. С их точки зрения, это означало появление все большего и большего количества голодных ртов[93].
«В процессе написания “Демографической бомбы” я предполагал, что интерес людей к сексу и детям настолько силен, что изменить размер семьи будет сложно, – рассказывал мне Пол Эрлих в коротком интервью, – но затем мы поняли, что, если относиться к женщинам достойно и предоставить им достаточно возможностей для работы, показатель рождаемости начинает снижаться». Другие ученые, не склонные к подобным упрощениям, поняли это уже тогда. Прогнозы роста населения, изданные ООН в 1960е и 1970е гг., в целом достаточно точно показали, чему будет равна численность населения планеты через 30 или 40 лет{496}.
Экстраполяция приводит к одной из самых значительных проблем при исследовании как роста населения, так и распространения болезней, когда изучаемый показатель увеличивается по экспоненте. В начале 1980х гг. совокупное количество случаев заболевания СПИДом, диагностированных в США, росло в геометрической прогрессии{497}: в 1980 г. было 99 случаев, в 1981 г. – 434, а к 1984 г. оно достигло 11 148. Эти цифры можно нанести на график, как сделали некоторые ученые в то время{498}, и попытаться его экстраполировать, чтобы выявить закономерность. В этом случае можно было бы сделать прогноз о том, что количество случаев СПИДа, диагностированных в США, могло бы вырасти к 1995 г. до 270 тыс. Довольно неутешительный прогноз, однако на самом деле все стало гораздо хуже: к 1985 г. СПИДом заболело около 560 тыс. человек, то есть примерно в два раза больше (рис. 7.2).
Рис. 7.2. Общее количество случаев заболевания СПИДом, диагностированных в США: реальное до 1984 г. и экстраполированное до 1995 г.
Возможно, однако, что с точки зрения статистики точные прогнозы, основанные на экстраполяции по экспоненциальной шкале, вообще нельзя делать. Даже корректная версия этого метода{499}, учитывающая предел погрешности, показывает, что количество случаев заболевания СПИДом в 1995 г. могло колебаться в пределах от 35 тыс. до 1,8 млн. Этот диапазон слишком широк, чтобы дать какую-то разумную основу для прогноза.
Почему оказались неудачными предсказания, касающиеся эпидемии гриппа в 2009 г.
Хотя статистические методы, используемые эпидемиологами при анализе вспышек гриппа, не так просты, как в описанных выше примерах, при их использовании все равно приходится сталкиваться с проблемой экстраполяции. Это связано с тем, что обычно имеется только небольшое количество потенциально сомнительных базовых точек данных.
Одной из самых полезных переменных при прогнозировании распространения болезни является так называемое репродуктивное число, обычно обозначаемое R0. Значение R0 показывает, какое количество неинфицированных людей потенциально могут заразиться от единственного инфицированного человека. Например, значение R0, равное 4, означает, что – при отсутствии вакцин или других средств защиты – заболевший человек передаст болезнь еще четырем людям до того момента, как выздоровеет (или умрет).
Теоретически любая болезнь с R0 > 1 распространится со временем (при отсутствии вакцин и карантинов) на все население. Однако порой значение R0 бывало обманчивым: оно приближалось к 3 для «испанки», к 6 для оспы и к 15 для кори. В случае малярии, одной из самых смертельно опасных болезней в истории цивилизации, до сих пор отвечающей примерно за 10 % смертей в некоторых уголках мира, значение этого показателя может достигать сотен{500} (табл. 7.1).
Таблица 7.1. Медианные значения[94] R0 для различных заболеваний{501}
Проблема состоит в невозможности сформулировать надежные расчеты R0 до тех пор, пока болезнь не распространится по всему сообществу и пока у вас не появится достаточно времени для тщательного изучения статистики. Поэтому эпидемиологи вынуждены делать экстраполяции, основываясь на ранних и немногих данных. Измерить на ранних этапах другой ключевой статистический показатель заболеваемости, смертность, может быть столь же сложно. Мы сталкиваемся с ситуацией «Уловки-22»; болезнь невозможно точно предсказать без этой информации, однако надежные количественные расчеты чаще всего оказываются невозможными, пока болезнь не наберет обороты.
Данные о первых вспышках инфекционных заболеваний часто бывают искаженными. Например, приведенные выше цифры о первых поставленных диагнозах СПИДа в США стали доступными лишь через несколько лет после заражений. Но даже скорректированные статистические данные не позволили улучшить качество прогнозов. Однако если бы мы были вынуждены положиться на данные, реально доступные ученым в то время{502}, то результаты могли оказаться еще хуже. Это связано с тем, что в первые годы своего развития СПИД плохо воспринимался и вызывал чувство стыда как у пациентов, так и у врачей{503}. Множество странных синдромов с симптомами, напоминавшими СПИД, оставались без диагноза или диагностировались неправильно – иногда причиной смерти считались другие инфекции, вызываемые СПИДом. Лишь многие годы спустя, когда врачи начали заново открывать старые истории болезней, им удалось лучше оценить развитие СПИДа в первые годы.
Неточные данные также послужили причиной плохих прогнозов распространения свиного гриппа в 2009 г. Смертность, связанная с H1N1, была, по всей видимости, достаточно высокой в Мексике, однако оказалась невероятно низкой в США. Хотя отчасти это было связано с различиями в эффективности здравоохранения в каждой стране, значительная часть различий представляла собой на самом деле статистическую иллюзию.
Само понятие смертности представляет собой простое отношение количества смертельных случаев, вызванных болезнью, к количеству случаев заболеваний. Однако оба элемента этого соотношения вызывают целый ряд вопросов. С одной стороны, в Мексике имелась тенденция относить к жертвам H1N1 людей, умерших от других форм гриппа или вообще других болезней. Лабораторные тесты показали, что не менее четверти смертей, ранее связывавшихся с действием вируса H1N1, в реальности не имели никаких черт, присущих гриппу. С другой стороны, в ряде случаев данные о заболеваниях, вызванных вирусом H1N1, передавались не в полном объеме. В таких развивающихся странах, как Мексика, не развиты ни такая сложная система отчетов, как в Соединенных Штатах, ни культура посещения врача при первых признаках заболевания{504}. Факт быстрого распространения заболевания после того, как оно оказалось на территории США, заставляет предположить, что в Мексике имелись десятки, а то и десятки тысяч заболевших, о которых не было известно властям.
Фактически вирус H1N1 мог циркулировать по южной и центральной Мексике на протяжении ряда месяцев, пока на него не обратила внимание медицинская общественность (занятая в то время поисками следов птичьего гриппа в Азии). Отчеты о вспышке респираторного заболевания появились сначала в небольшом городке Ла Глория, штат Веракрус, в начале марта 2009 г., после того как гриппом заболело большинство жителей, однако поначалу мексиканские власти полагали, что это вызвано более привычным штаммом вируса под названием H3N2{505}.
Напротив, свиной грипп былнавязчивым объектом множества публикаций в СМИ с момента его появления на территории США. Только несколько случаев могло бы остаться без внимания. Так как в США используются более высокие стандарты отчетности, показатель смертности там был более надежным и позволял исключить некоторые плохие сценарии из дальнейшего рассмотрения – но лишь до тех пор, пока не оказалось слишком поздно отказываться от некоторых пугающих прогнозов, ставших доступными широкой публике.
Самореализующиеся и самоотменяющиеся предсказания
Во многих случаях, связанных с предсказаниями деятельности человека, сам факт создания предсказания может повлиять на поведение людей. Иногда, как и в экономике, эти изменения в поведении могут повлиять и на результат прогноза, либо аннулировав его, либо, напротив, повысив его точность. Прогнозы, касающиеся гриппа и других инфекционных заболеваний, затрагивают обе стороны этой проблемы. Случай, при котором предсказание приводит к событиям, его подтверждающим, называется самореализующимся предсказанием или самоисполняющимся пророчеством. Примером его может служить выпуск результатов политического опроса в гонке с множеством кандидатов, например, первичные выборы на президентский пост.
В таких случаях избиратели могут из тактических соображений поддержать кандидата, потенциально способного выиграть (а не растратить зря свой голос), и раскрученные результаты опроса часто лучше всего показывают, какому кандидату это по силам. Например, на последних этапах политической гонки республиканцев в Айове в 2012 г. канал CNN выпустил результаты опроса, показывавшие, что Рик Санторум может рассчитывать на 16 % голосов, а не на 10 %, как это было раньше{506}. Этот опрос выбивался из общего ряда – другие исследования общественного мнения не показывали, что Санторум набирает обороты, даже после выпуска опроса CNN{507}. Тем не менее благодаря опросу Санторум получил значительную и позитивную поддержку СМИ, и некоторые избиратели, ранее поддерживавшие кандидатуры других, близких по идеологическим взглядам кандидатов типа Мишель Бахманн и Рика Перри, перешли на его сторону. Через некоторое время опрос сделал свое дело, Санторум выиграл в Айове, а Бахманн и Перри остались далеко позади.
Более тонкие примеры этого подхода можно найти в таких областях, как дизайн и развлечения, где компании, в сущности, соревнуются друг с другом в том, что смогут предугадать вкусы потребителей. Но они также способны влиять на потребителей определенным образом через толковые маркетинговые планы. Что касается моды, то специалисты в этой области пытаются угадать, какие цвета будут популярными в следующем сезоне{508} – это нужно делать заранее, примерно за год, поскольку именно такой срок требуется для переналадки производственных линий.
Допустим, группа влиятельных модельеров решит, что в следующем году популярным будет коричневый цвет, и начнет выпускать большое количество одежды коричневого цвета. Если модели и знаменитости начнут носить коричневое, а в каталогах и витринах магазинов будет преобладать одежда коричневых тонов, то велики шансы на то, что публика последует за этой тенденцией. Однако в данном случае она просто реагирует на маркетинг коричневого цвета, а не выражает какое-либо глубинное предпочтение к нему. Дизайнер может показаться настоящим провидцем, угадавшим цвет, хотя, если бы он выбрал белый, черный или лавандовый, произошло бы примерно то же самое{509}.
Заболевания и другие медицинские обстоятельства также могут обладать свойствами самореализации. Когда те или иные медицинские аспекты широко обсуждаются в СМИ, люди чаще начинают находить у себя соответствующие симптомы, а врачи чаще диагностируют ту или иную болезнь. Наиболее известный пример такого случая, наблюдаемый в последние годы, связан с аутизмом.
Если вы сравните количество детей, которым поставлен диагноз «аутизм»{510}, с частотой использования термина аутизм в американских газетах{511}, то обнаружите почти идеальное соответствие по модели «один-к-одному» (рис. 7.3), причем оба значения в недавние годы выросли. И хотя аутизм не всегда воспринимается как заболевание, можно провести определенные параллели с гриппом. «Мы наблюдаем поразительное явление. Для заболеваний, не имеющих четкого механизма возникновения, новости сами по себе начинают способствовать появлению все новых случаев постановки такого диагноза», – рассказал мне доктор Алекс Озонофф из гарвардской Школы здравоохранения. Озонофф серьезно изучал математику и довольно свободно разбирается в вопросе управляемых данных, однако сейчас он в основном концентрируется на использовании тщательного статистического анализа при исследовании гриппа и других инфекционных заболеваний. «Мы раз за разом обнаруживаем, что чем чаще люди думают и обсуждают конкретный диагноз или болезнь, тем чаще его начинают ставить, и корреляция доходит почти до 100 %».
Рис. 7.3. Аутизм: освещение в СМИ и количество поставленных диагнозов, 1992–008 гг.
Озонофф полагает, что именно это явление может отвечать за ту скорость, с которой свиной грипп распространился по США в 2009 г. Хотя болезнь и распространялась достаточно быстро, резкий статистический прирост мог быть отчасти связан с тем, что люди сообщали врачам о симптомах, которые прежде игнорировали.
Если бы доктора решили производить расчеты темпа распространения болезни среди населения, то количество официально объявленных случаев привело бы к искаженной статистике. Чем-то это напоминает ситуацию со статистикой преступности. Предположим, что полиция сообщает об увеличении количества ограблений в каком-то районе. Связано ли это с тем, что полицейские усилили бдительность и стали раскрывать больше преступлений, чем раньше, или же им стало проще сообщать об этом?[95] А может быть, этот район действительно стал более опасным? Подобные проблемы очень сложны для любого, кто хочет делать прогнозы заболеваемости гриппом на ранних стадиях.
Самоотменяющиеся предсказания
Самоотменяющееся предсказание относится к противоположным случаям, при которых факт появления предсказания приводит к прекращению развития ситуации. Интересным примером здесь могут служить системы GPS-навигации, обретающие все большую популярность. Через Манхэттен проходят две основные трассы в направлении с юга на север – Вест-Сайдское шоссе, идущее вдоль реки Гудзон, и скоростная магистраль ФДР-Драйв на восточной стороне острова. В зависимости от конечной точки водитель не всегда может отдать предпочтение определенной трассе. Однако его GPS-система сама укажет, по какой дороге ехать, учитывая степень их загруженности: система, по сути, предсказывает, какой путь выбрать, чтобы быстрее добраться до точки назначения. Проблема возникает, когда много водителей пользуется одной и той же системой: совершенно внезапно дорога становится перегруженной машинами, и прежде «более быстрая» трасса превращается в более медленную. Уже есть ряд теоретических{512} и эмпирических{513} свидетельств того, что это стало проблемой на некоторых часто используемых трассах в Нью-Йорке, Бостоне и Лондоне и что такие системы иногда могут оказаться контрпродуктивными.
Это качество предсказаний порой может представлять проблему и с точки зрения правильности предсказаний, касающихся гриппа, поскольку их цель, хотя бы отчасти, состоит в повышении общей осведомленности о болезни и, таким образом, изменения поведения в обществе. Самым эффективным прогнозом в отношении гриппа может считаться тот, которому не удается сбыться, поскольку он мотивирует людей на более здоровый выбор.
Простота без изощренности
Финский ученый Ханна Кокко предпочитает использовать статистическую или прогнозную модель рисования карт{514}. Модель должна содержать достаточно деталей, чтобы быть полезной и честно отображать фундаментальную картину: наверняка вы не захотите упустить из внимания крупные города, рельефные реки, высокие горные массивы и главные дороги.
Однако чрезмерное количество деталей иногда может запутать путешественника, а порой и сбить его с пути. Как было отмечено в главе 5, эти проблемы носят не только эстетический характер.
Без необходимости усложненные модели способны оставить в системе больше шумов, чем сигналов, и в результате плохо воспроизводят лежащую в основе структуру, тем самым ухудшая качество прогнозов.
Но какой объем деталей считать недостаточным или, напротив, чрезмерным? Чтобы изучить картографию и научиться сочетать элементы искусства и науки, присущие ей, может уйти целая жизнь. Возможно, говорить о выстраивании модели как о форме искусства – это уже чересчур, но что-то правильное в идее есть.
Однако в идеале на вопросы, подобные тому, что задала Кокко, можно дать эмпирический ответ. Работает ли модель? Если нет, то, возможно, нам стоит изучить ее с другой степенью детализации. В эпидемиологии традиционные модели, используемые докторами, довольно просты – и не работают так, как хотелось бы.
Самое базовое математическое описание инфекционного заболевания называется SIR-моделью (рис. 7.4). В этой модели, сформулированной в 1927 г.{515}, принято следующее допущение: существуют три «состояния», в одном из которых любой человек может находиться в каждый момент времени. S (susceptible) означает восприимчивые к болезни, I (infectiousill) – заразившиеся, a R (recovery) – выздоровевшие после болезни. В рамках этой модели переход от одного состояния к другому происходит всегда в одном направлении – от S к I и затем к R. Вакцинация выступает своего рода «короткой дорожкой»[96], позволяющей человеку перейти от S к R без перенесения заболевания. Математика этой модели сравнительно проста и сводится к ряду дифференциальных уравнений, которые можно решить на ноутбуке за несколько секунд.
Рис. 7.4. Схематическое изображение SIR-модели
Проблема состоит в том, что для нормальной работы модели требуется сделать множество предположений, и некоторые из них на практике выглядят не вполне реалистично. В частности, в модели заложено предположение, что все участники той или иной популяции ведут себя одинаковым образом: то есть они в равной степени подвержены болезням, имеют одинаковый доступ к вакцинации и пересекаются друг с другом случайным образом. Нет никаких различий с точки зрения расы, пола, возраста, религии или сексуальной ориентации, и все ведут себя более-менее одинаково.
Парадокс ВИЧ в Сан-Франциско
Увидеть недостатки этих допущений проще всего при изучении болезней, передающихся половым путем. В конце 1990х и начале 2000х гг. был заметен сильный рост незащищенного секса в гомосексуальном сообществе Сан-Франциско{516}, опустошенном пандемией ВИЧ/СПИД двумя десятилетиями ранее. Некоторые исследователи видели причину этого в увеличении темпов потребления наркотиков, особенно кристального метамфетамина, который наиболее часто вызывает более рискованное сексуальное поведение. Другие обращали внимание на повышение эффективности антиретровирусной терапии – коктейлей из различных лекарственных средств, способных продлить жизнь ВИЧ-инфицированных пациентов на многие годы или десятилетия. В результате геи перестали воспринимать диагноз ВИЧ как смертельный приговор. Другие теории концентрировались на поколенческих закономерностях – молодое поколение геев начало воспринимать Сан-Франциско 1980х гг. с его эпидемией СПИДа как древнюю историю{517}.
Единственное заключение, с которым соглашались эксперты, состояло в том, что при увеличении случаев незащищенного секса должно было увеличиться и количество случаев заражения ВИЧ{518}. Однако этого не случилось, хотя наблюдался рост других заболеваний, передающихся половым путем. В частности, наблюдался всплеск (с девяти случаев в 1998 г. до 502 в 2004 г.{519}) количества вновь поставленных диагнозов «сифилис» среди мужчин, занимавшихся сексом с другими мужчинами (MSM){520}, притом что в 90е гг. эти болезни почти исчезли в Сан-Франциско. Выросло и количество заболеваний гонореей. Однако, как ни парадоксально, количество новых случаев ВИЧ не увеличилось. В 2004 г., когда заболеваемость сифилисом достигла самого высокого уровня за многие годы наблюдений, количество диагнозов ВИЧ упало до минимального значения с начала эпидемии СПИДа (рис. 7.5). С точки зрения исследователей, это казалось очень странным: сифилис и ВИЧ в обычных условиях обладают достаточно высокой статистической корреляцией. Кроме этого, между ними имеется причинно-следственная связь, поскольку наличие одной болезни может сделать вас более уязвимым к приобретению второй{521}.
Рис. 7.5. Изменение количества вновь поставленных диагнозов ВИЧ и сифилиса, геи, Сан-Франциско, 1998–004 гг.
Как оказалось, решение парадокса заключалось в том, что геи начали активнее использовать так называемый серосортинг, иными словами, они выбирали половых партнеров с тем же статусом ВИЧ, что и у них. Не до конца понятно, как им удавалось это организовать, однако этот факт был задокументирован детальными поведенческими исследованиями, проведенными в Сан-Франциско{522}, Сиднее{523}, Лондоне и других городах с большими популяциями геев. Возможно, что положительную роль сыграли и кампании в области здравоохранения – часть из них переключилась с идеи борьбы с «усталостью от презервативов» на «обсуждаемую безопасность». Также не исключено и влияние интернета, заменившего бары в качестве лучшего места для поиска половых партнеров. В интернете существуют другие нормы по разглашению информации: многие мужчины указывают в профилях на специализированных сайтах свой статус ВИЧ, а кроме того, в интернете проще задавать интимные вопросы (и получать честные ответы), чем на танцполе{524}.
В чем бы ни состояла причина, было ясно, что это специфическое и локализованное поведение не вполне соответствует простым моделям заболевания – к счастью, в данном случае это означало, что прогнозы исследователей в отношении ВИЧ оказались слишком пугающими. Модели, основанные на различных состояниях, предполагают, что у каждого человека имеется свой уровень восприимчивости к болезни. Это допущение не работает столь же точно в случае болезней, требующих более близкого контакта, или в случаях, когда уровень риска является асимметричным для различных групп населения. Иными словами, вы не можете зайти в продуктовый магазин и выйти из него зараженным ВИЧ.
Почему не сработали модели в Форт-Дикс
Однако даже в случае более простых заболеваний компартментальные модели[97] могут оказаться неприменимыми из-за слишком общих и нестрогих допущений, заложенных в них. Рассмотрим, например, корь.
Корь – это первая болезнь, которую (вследствие ее простоты) начинают изучать будущие эпидемиологи в рамках программы PhD[98]. «Корь представляет собой удобную модель для изучения системы инфекционного заболевания, – утверждает Марк Липсиц, коллега Озоноффа по Гарварду. – Она одномерна. Ее можно выявить с помощью анализа крови, у нее имеется лиь один штамм, и у всех заболевших проявляются одни и те же симптомы. Переболев ею, вы не заразитесь второй раз». Если бы нужно было назвать единственную болезнь, идеально описываемую SIR-моделью, то специалисты выбрали бы корь.
Однако в 1980х и начале 1990х гг. в Чикаго был зафиксирован ряд необычно тяжелых всплесков кори, которые эпидемиологи не могли предсказать. В соответствии с традиционной моделью, прививки имелись у такого количества жителей города, которого должно было быть достаточного для формирования так называемого коллективного иммунитета – своего рода биологического эквивалента брандмауэра, благодаря которому болезнь не имеет возможности развиваться и затухает сама собой. Однако в отдельные годы на протяжении 1980х корью заболевало не менее 1000 жителей города – в основном маленькие дети. Проблема показалась настолько тревожной, что власти приказали медсестрам ходить от двери к двери и делать жителям прививки{525}.
Доктор Роберт Даум, педиатр и специалист по инфекционным заболеваниям, работавший в нескольких больницах Чикагского университета, серьезно изучил эти всплески кори. Даум – настоящий идеал врача. У него глубокий голос, огромная борода и потрясающее чувство юмора. Незадолго до встречи со мной в Чикаго Даум вернулся с Гаити, где вместе с коллегами помогал преодолевать последствия землетрясения 2010 г.
Чикаго, в котором я прожил 13 лет, – это город пригородов. Зачастую пригороды бывают достаточно сегрегированы либо по расовому составу, либо по социально-экономическим признакам. Даум обнаружил, что население пригородов также различалось по отношению к прививкам. Небогатые афроамериканцы, жившие в районах типа Саус-Сайд, неохотно разрешали прививать своих детей вакциной MMR (против кори, свинки и краснухи). Непривитые дети вместе ходили в школу, вместе играли, кашляя и чихая друг на друга. Их поведение отвергало одно из предположений модели SAR о так называемом случайном смешивании, согласно которому любые два человека имеют одинаковый шанс вступить в контакт друг с другом. И понятно было, что эти дети как раз и явились распространителями кори.
Именно это явление неслучайного перемешивания и стало причиной «фиаско свиного гриппа» в 1976 г., когда ученые посчитали H1N1 угрозой национального масштаба на основании нескольких случаев заболевания в Форт-Дикс. Штамм свиного гриппа – известный в наши дни под названием A/New Jersey/76 – казался столь угрожающим отчасти потому, что быстро распространился по военной базе: в течение от двух до трех недель было диагностировано 230 подтвержденных случаев{526}. Это дало ученым основание предположить, что у болезни имеется крайне высокое репродуктивное число R0, близкое к 3, что было сопоставимо со значением R0 для пандемии «испанки» 1918 г.
Однако воинское подразделение можно считать средой, предрасположенной к заболеваниям. Солдаты находятся в нетипично тесном контакте друг с другом, в условиях, где им приходится делиться едой и постельными принадлежностями и сложно уединиться. Более того, они часто выполняют тяжелые физические упражнения, которые временно истощают иммунную систему, а социальные нормы в армии предполагают, что вы должны заниматься делом, даже если больны. Таким образом, для передачи инфекционного заболевания появляется множество возможностей, и оно начинает распространяться значительно быстрее.
Последующее изучение{527} событий в Форт-Дикс показало, что бурное распространение заболевания было вызвано этими особыми факторами, а не его вирулентностью. Форт-Дикс нельзя было считать аналогом какого-нибудь американского пригорода. Сам по себе штамм A/New Jersey/76 не был таким уж опасным. Значение R0 для него составляло всего 1,2, то есть было примерно таким же, как у обычного сезонного гриппа. Если бы дело происходило не на военной базе (или в другом месте с похожими условиями, типа тюрьмы или университетского общежития), то болезнь не распространилась бы так широко. В сущности, грипп в Форт-Дикс исчез сам по себе, после того как на базе не осталось инфицированных людей.
Фиаско, связанное с A/New Jersey/76, – как и парадокс в отношении ВИЧ/сифилиса в Сан-Франциско или всплески кори в Чикаго в 1980е гг. – способно многое сказать об ограничениях моделей, основанных на слишком упрощенных допущениях. Конечно же, я не хочу сказать, что вам всегда стоит предпочитать сложные модели простым; как мы уже видели в других главах этой книги, сложные модели так же успешно могут завести людей в тупик. А поскольку сложные модели часто дают нам более точные (хотя и не обязательно правильные) ответы, они способны слишком повысить самоуверенность исследователя и заставить его ошибочно считать себя отличным прогнозистом.
Тем не менее, хотя и можно считать плюсом модели ее простоту, она должна быть хотя бы изощренно простой{528}. Модели типа SIR, хотя и полезны для понимания болезни, слишком туповаты для того, чтобы помочь нам предсказать ее дальнейшее развитие.
Система имитационного моделирования Sim[99] в действии
Прогнозы погоды представляют собой один из немногих примеров сравнительно сложных моделей, в рамках которых качество предсказаний смогло значительно улучшиться. Для этого потребовались десятилетия работы, однако после создания системы, способной физически имитировать атмосферу, метеорологи получили возможность делать нечто большее, чем использовать исключительно статистические подходы к предсказаниям погоды.
Все больше и больше профессионалов пытается применять аналогичный подход к предсказанию развития болезней на основе агентного моделирования[100]. Я побывал в Питтсбургском университете и встретился с исследователями, находящимися на передовом крае разработки этой методики. Для названия своей модели команда использует аббревиатуру FRED, которая расшифровывается как «основа реконструкции динамики эпидемий» (framework for reconstruction of epidemic dynamics). Одновременно это имя является своеобразной данью уважения уроженцу Питтсбурга Фреду Роджерсу, бывшему ведущему детского телевизионного шоу «Mister Rogers’ Neighborhood».
Питтсбург, как и Чикаго, – это город, состоящий из пригородов. Размышляя о болезни, исследователи постоянно апеллируют к ним, и поэтому FRED представляет собой своеобразный аналог Питтсбурга – СимПиттсбург (SimPittsburgh) – невероятно детальную имитационную модель, в которой каждый человек представлен «агентом», имеющим семью, сеть социальных контактов, место жительства и набор убеждений и манер поведения, соответствующих его социально-экономическому статусу.
Доктор Джон Грефенстетте, один из ученых питтсбургской команды, прожил в этом городе значительную часть своей жизни, однако до сих пор говорит с заметным иностранным акцентом. Он рассказал мне, как организована работа FRED: «Школы, офисы и больницы размещены в этой модели так же, как в реальном городе. У жителей нашей системы имеются вполне реальные проблемы при записи детей в школы; они не всегда ходят в самую ближнюю – а кроме того, некоторые школы слишком малы, в то время как другие огромны. Это чем-то напоминает игру SimCity». Доктор Грефенстетте и его любезный коллега доктор Шон Браун показали мне некоторые результаты имитационного моделирования, полученные с использованием FRED, на которых волны болезней, раскрашенные разным цветом, распространялись по районам СимПиттсбурга, СимВашингтона или СимФиладельфии. Однако при этом FRED – это серьезный бизнес. Модели такого рода не ищут легких путей, в них должны быть представлены практически все жители города, графства или штата.
Некоторые модели, основанные на агентах, пытаются даже имитировать всю страну или весь мир. Как и погодные модели, они требуют проведения огромного количества расчетов, а следовательно, использования суперкомпьютеров. Естественно, что при проведении расчетов ткого рода необходимо правильно учесть демографические данные (это вполне можно сделать, используя результаты переписи населения). Однако модели также должны принимать во внимание куда менее предсказуемое человеческое поведение. Например, насколько велика вероятность того, что 26-летняя мать-одиночка-латиноамериканка пойдет делать прививку? Вы можете провести опрос и спросить ее – основанные на агентах модели довольно сильно полагаются на данные опросов. Однако люди на удивление часто лгут (или забывают), когда речь идет об их действиях, связанных с охраной здоровья: так, они заявляют, что моют руки{529} или используют презервативы{530} гораздо чаще, чем это происходит в реальности.
По словам доктора Грефенстетте, одно довольно устоявшееся правило заключается в следующем: люди готовы принимать участие в неудобных, но ведущих к оздоровлению действиях, таких как вакцинации, если они связаны с достаточно высоким, по их мнению, риском заболеть. Жительница СимПиттсбурга получит прививку от гриппа, если будет считать риск свиного гриппа серьезным. Однако как изменится ее представление о происходящем, если заболеет ее сосед или даже ребенок? Что, если в местных новостях постоянно рассказывают случаи, связанные с гриппом? Самореализующиеся и самоотменяющиеся свойства предсказания заболеваний играют огромную роль в этих моделях с использованием агентов. Поскольку они динамичны и позволяют поведению агента меняться со временем, то в какой-то момент дают возможность получить ответы и на заданные мной чуть выше вопросы.
Можно посмотреть и на работу доктора Даума и его команды из Чикагского университета, которые строят модели, основанные на агентах, для изучения распространения опасного заболевания под названием MRSA[101] -инфекции. Вызывающие ее стафилококки устойчивы к антибиотикам, и в результате обычные ссадины, порезы и синяки могут стать опасными для жизни, а порой привести к неизлечимому заболеванию. MRSA-инфекция – это сложное заболевание с множеством путей распространения: через объятия, открытые раны или через пот или кровь. Порой они могут задерживаться на различных поверхностях, таких как столешницы или полотенца. Часто следы MRSA можно найти в раздевалках, в которых спортсмены обмениваются снаряжением; всплески MRSA время от времени фиксируются у членов футбольных команд разного уровня – от школьных до профессиональных. Задача усложняется еще и потому, что многие люди являются носителями бактерии MRSA, но не заболевают и не страдают от присущих болезни симптомов.
Предпринимая попытку смоделировать действие MRSA, Даум и его коллеги задают себе примерно такие вопросы: люди какого типа используют пластыри, если они получили ссадину или порез? Насколько распространены объятия среди представителей разных культур? Какая доля жителей пригорода сидела в тюрьмах (где стафилококковые инфекции встречаются чаще обычного)?
Используя традиционные модели, даже нельзя рассчитывать на то, чтобы учитывать ответы на подобные вопросы, но модели, основанные на агентах, могут, по крайней мере, предложить нам шанс получить точные прогнозы. Однако командам из Питтсбурга и Чикаго приходится принимать во внимание множество довольно разнообразных переменных. И это необходимо делать всякий раз, когда вы пытаетесь оценивать поведение каждого жителя большой популяции. Работа часто заставляет их изучать вопросы когнитивной психологии, поведенческой экономики, этнографии и даже антропологии: модели, основанные на агентах, используются для изучения ВИЧ-инфекции в различных сообществах – от жителей джунглей Папуа – Новой Гвинеи{531} до завсегдатаев гей-баров Амстердама{532}. И в этом случае нужны довольно глубокие знания местных обычаев и привычек.
Учитывая вышесказанное, стоит заметить: агентное моделирование – исключительно смелое занятие, и в группах, работающих в этой области, часто собраны звезды из лучших и ярчайших представителей различных дисциплин. Однако даже при наличии всей этой интеллектуальной элиты их усилия часто подрываются нехваткой данных. «Даже в случае H1N1 довольно сложно получить детальные географические данные о том, кто, когда и где заболел, – жалуется Грефенстетте. – И вы не поверите, насколько сложно получать данные о всплесках болезни, имевших место в прошлом».
Во время разговора с участниками команд в Чикаго и Питтсбурге я иногда вспоминаю о красивых новых торговых центрах в Китае. Центрах, в которых есть невероятные интерьеры – римские колонны, американские горки и венецианские каналы, – но нет посетителей или магазинов-арендаторов. Исследователи из обеих команд уже пришли к некоторым невероятно полезным и действенным заключениям. Например, доктор Грефенстетте вычислил, что закрытие школ может приводить к неблагоприятным последствиям, если происходит слишком быстро или слишком ненадолго, а команда из Чикагского университета пришла к выводу, что необычно большое количество случаев заболеваний MRSA-инфекцией в центральной части Чикаго было вызвано перемещением людей в окружную тюрьму Кук и из нее. Однако по большей части модели заточены под создание прогнозов на будущее и готовы использовать данные, которых еще нет.
Модели, основанные на методах агентного моделирования, в отличие от методов, используемых при создании прогноза погоды, которые могут уточняться ежедневно, сложно протестировать. Вспышки серьезных заболеваний возникают не так уж часто. И даже хорошие модели могут пасть жертвой собственного успеха из-за присущего им свойства самоотмены. В данном случае правильное предсказание будущего способно изменить ход событий: будущее станет значительно более благоприятным. Представьте себе, что модель говорит о том, что некое действие – например, закрытие школ в одном графстве – может оказаться очень эффективным. И это действие срабатывает! Распространение болезни в условиях реального мира замедляется. Но это же заставляет модель выглядеть в ретроспективе слишком пессимистичной.
Именно поэтому команды из Питтсбурга и Чикаго не решаются использовать свои модели для создания конкретных предсказаний. Другие ученые были менее осторожны в преддверии всплеска свиного гриппа 2009 г., и кое-кто выдал достаточно плохие предсказания{533}, иногда значительно недооценивая масштабы распространения гриппа.
В настоящее время работа команд ограничена в основном тем, что коллега доктора Даума Чип Масал называет «моделирование для глубокого понимания». Иными словами, агентное моделирование может помочь нам проводить эксперименты, позволяющие больше узнать об инфекционном заболевании, но пока что маловероятно, что они помогут предсказать их всплеск.
Что делать, когда прогнозы неутешительны
Итак, оказалось, что две последние и значительные волны страхов, вызванных гриппом в Соединенных Штатах, оказались достаточно беспочвенными. В 1976 г. не наблюдался всплеск заболеваний, вызванных вирусом N1H1, за исключением случаев в Форт-Дикс, а программа массовой вакцинации президента Форда начала казаться чрезмерной. В обоих случаях прогнозы правительства относительно масштабов вспышки заболевания были достаточно неточными.
Но при этом нет никакой гарантии, что ошибка не повторится в следующий раз, когда придет грипп. Адаптировавшийся к человеческому организму штамм птичьего гриппа H5N1 мог убить сотни миллионов людей. Он распространялся так же легко, как и H1N1 версии 2009 г., однако его расчетная смертность была вполне сопоставима с версией 1918 г., и могло бы погибнуть 1,4 млн американцев. Имеются также потенциальные угрозы со стороны других вирусов, например вируса атипичной пневмонии SARS и даже оспы, уничтоженной в мире к 1977 г., но которая теоретически может вновь оказаться среди нас (например, в виде биологического оружия, примененного террористами) и способна убить миллионы. По определению, самые серьезные эпидемии могут прогрессировать крайне быстро. В 2009 г. штамму H1N1 потребовалось около недели, чтобы из болезни, не замечаемой медицинским сообществом, превратиться в болезнь, потенциально способную убить миллионы людей.
Эпидемиологи, с которыми я общался перед написанием этой главы, – в отличие от своих коллег в других областях – отлично представляют себе ограничения, присущие их моделям. «Было бы глупо заниматься предсказаниями, основываясь на трех точках данных, – сказал мне Марк Липсиц, имея в виду пандемии гриппа в 1918, 1957 и 1968 гг. – Все, что вы можете сделать, – это распланировать различные сценарии». Если вы не можете создать хороший прогноз, то будет крайне неправильным притворяться, что это вам под силу. Я подозреваю, что эпидемиологи и другие представители медицинского сообщества понимают это благодаря своей приверженности клятве Гиппократа. Primum non nocere – Прежде всего не навреди.
Представители медицинской профессии выполнили большое количество работ, касающихся правильного и неправильного использования статистических моделей и надлежащей роли прогнозов{534}. Я не хочу сказать, что прогнозы экономистов (в отличие от прогнозов эпидемиологов) не основаны ни на чем. Однако вследствие довольно тесной связи медицины с вопросами жизни и смерти врачи склонны к осторожности. В области их деятельности глупые модели способны привести к смерти людей. И знание этого факта обладает отличным отрезвляющим эффектом.
Кое-что стоит сказать и об идее «моделирования для глубокого понимания» Чипа Масала. Философия этой книги состоит в том, что предсказание – это средство, а не цель. К примеру, оно играет крайне важную роль при тестировании гипотез, а значит, и в развитии науки в целом{535}.
Когда-то статистик Джордж Э. П. Бокс написал: «Все модели неправильны, но некоторые модели полезны»{536}. Он имел в виду, что все модели представляют собой упрощение Вселенной, как и должно быть. Еще один ученый, математик, сказал: «Лучшая модель кошки – это кошка»{537}. Все остальное предполагает, что мы исключаем какие-то детали. Степень уместности каждой детали будет зависеть от проблемы, которую мы пытаемся решить, и от того, насколько точный ответ нам требуется.
Статистические модели – не единственные инструменты, которые мы используем для созданий аппроксимаций, позволяющих получить какое-либо представление о Вселенной. Например, язык представляет собой тип модели или аппроксимацию, которую мы используем для общения друг с другом. В каждом языке есть слова, не имеющие прямых аналогов в других, хотя все они пытаются объяснить одну и ту же Вселенную. Свой специализированный язык есть и в технических областях деятельности. Для вас и для меня цвет обложки этой книги – желтый, а графический дизайнер будет использовать более специфический термин, например Pantone 107.
Но, как писал Бокс, модели могут быть полезны. Мне представляется, что работа, которую проделывают команды из Чикаго или Питтсбурга со своими имитационными моделями, в высшей степени полезна. Понимание того, что думают о вакцинации различные этнические группы, как передается болезнь в разных районах города или как реагируют люди на сообщения о гриппе, важно само по себе.
Хорошая модель может оказаться полезной даже в случае неудачи. «Нужно принимать за данность, что каждый создаваемый нами прогноз неверен, – рассказал мне Озонофф. – Так что дело состоит в том, насколько именно он неверен, что делать, когда он неверен, и как минимизировать связанные с ним убытки».
Самое главное – это помнить, что модель представляет собой инструмент, помогающий нам понимать всю сложность окружающего мира, а не заменяет собой этот мир. И это важно не только когда мы создаем предсказания. Некоторые нейробиологи, такие как Томассо Поджио из МТИ, считают, что создание серии аппроксимаций – это основной способ, который используют наши мозги для обработки информации.
Вот почему, если мы хотим улучшить свои прогнозы, нам так важно научиться понимать себя и то, как мы искажаем и интерпретируем получаемые сигналы. Первая половина этой книги была во многом связана с описанием тех случаев, где аппроксимации служат нам хорошую службу, а где подводят нас. Оставшаяся часть книги посвящена тому, как понемногу делать их лучше.
Глава 8
Все меньше, и меньше, и меньше неточностей[102]
Харалабос «Боб» Вулгарис, человек, для которого держать пари на результат спортивных состязаний стало профессией, живет в районе Голливудских холмов в Лос-Анджелесе в блестящем модернистском доме из металла и стекла и с бассейном на заднем дворе, доме, чем-то напоминающем картины Дэвида Хокни. Каждый вечер с ноября по июнь он проводит, наблюдая одновременно за пятью матчами Национальной баскетбольной ассоциации (НБА). Для этого он приобрел пять плоских телеэкранов Samsung (пожалуй, таких нет и у ребят из телекомпании DirecTV). Когда ему нужно немного отдохнуть, он едет в свой кондоминиум в Палмс-плейс в Лас-Вегасе, а когда ему нужно отдохнуть как следует – на сафари в Африку. В неудачный для него год Боб зарабатывает миллионы долларов, а в хороший – в три или четыре раза больше.
Боб искренне наслаждается некоторыми атрибутами роскошной жизни. Однако он совсем не похож на стереотипного азартного игрока в выходном костюме, нервно жующего сигару. Он не зависит ни от подсказок инсайдеров, ни от подкупленных судей, ни от других хитростей, позволяющих сделать удачную ставку. Нет у него и никакой «системы». Хотя он и использует компьютерное моделирование, но никогда не полагается только на него.
Успешным его делает тот метод, при помощи которого он анализирует информацию. Боб не просто выискивает некие шаблоны. Напротив, он совмещает свое знание статистики с пониманием особенностей баскетбола, выявляя осмысленные связи в имеющихся данных.
Для этого требуется много и упорно трудиться, а иногда – и проявить немалое мужество. Чтобы достигнуть того положения, что у него есть, Бобу потребовалось играть по-крупному и с хорошим расчетом.
Вулгарис вырос в Виннипеге, штат Манитоба, городе, расположенном в 145 км к северу от границы Миннесоты, в котором живут трудолюбивые, но холодные люди. Его отец когда-то был достаточно богат – его капитал на пике карьеры составлял примерно 3 млн долл., – однако он растратил их на азартные игры. Когда Бобу исполнилось 12 лет, его отец полностью обанкротился. А к 16 годам Боб понял, что, если он хочет выбраться из Виннипега, ему нужно получить хорошее образование, за которое платить придется ему самому. Поэтому в годы учебы в университете штата Манитоба он пытался заработать денег везде, где только мог.
Летом он отправлялся далеко на север в Британскую Колумбию и собирал там орехи, залезая на деревья. В те времена за каждое дерево платили по 7 центов. А когда он учился в школе, ему приходилось работать грузчиком в порту, перетаскивая сумки жителей Виннипега, направлявшихся в Торонто, Миннеаполис или еще дальше.
Со временем Вулгарис скопил достаточно средств и выкупил долю в компании, занимавшейся перевозкой грузов в аэропорту, а вскоре стал ее единственным владельцем. К 1999 г., когда он учился в старших классах колледжа, его капитал составлял уже около 80 тыс. долл.
Однако эта сумма, по мнению Вулгариса, была не такой уж и большой – ему доводилось видеть, как его отец выигрывал и проигрывал куда большие деньги. А перспективы работы для специалиста по философии из Университета штата Манитоба были не особенно многообещающими. Он пытался найти способ изменить свою жизнь, когда ему попалось на глаза объявление, мимо которого просто невозможно было пройти.
В тот год команда Los Angeles Lakers наняла на работу тренером дерзкого и критически настроенного Фила Джексона, который перед этим выиграл с командой Chicago Bulls шесть чемпионатов. В Lakers играло немало своих талантливых сортсменов: центральный нападающий, рослый Шакил О’Нил был на пике своих способностей, а 20-летний защитник Коби Брайант, закончивший школу лишь четырьмя годами ранее, активно обретал свою уникальную форму. Связка О’Нила и Брайанта считалась классической формулой успеха в НБА, особенно под руководством такого сильного тренера, как Джексон, который мог справляться с их невероятно раздутым эго.
При этом общественное мнение было не на стороне Lakers. Команда так и не смогла войти в ритм в предыдущем году. Сезон 1998/99 г. оказался для нее крайне неудачным. Она сменила трех тренеров подряд, итоговый счет поражений и побед составил 31:19, а после второго раунда плей-офф команда выбыла из дальнейшего соревнования, четыре раза подряд проиграв команде San Antonio Spurs. О’Нил и Брайант постоянно враждовали. Так, О’Нил крайне ревниво относился к тому, что Брайант, находившийся еще в том возрасте, когда официально нельзя пить спиртное, был готов занять его место в рейтинге популярности, а майки с его номером продавались в спортивных магазинах Лос-Анджелеса куда активнее, чем майки с номером самого О’Нила{538}. В те времена Западная Конференция[103] обладала немалой силой. В ее состав входили такие сплоченные и опытные команды, как San Antonio и Portland, и пошли слухи, что Lakers еще «недостаточно созрела», чтобы справиться с ними.
Когда Lakers проиграли команде Portland в третьей игре регулярного сезона (во время игры O’Нил даже утратил свое обычное хладнокровие и был удален с поля), казалось, что все самые пессимистичные прогнозы экспертов и комментаторов начинают сбываться. Даже газета Los Angeles Times из родного для Lakers города поставила ее всего лишь на седьмое место в списке команд НБА{539} и изрядно отчитала букмекеров из Вегаса за слишком оптимистичный прогноз шансов команды на выигрыш титула НБА (1 к 4).
Уже через пару недель после начала регулярного сезона 1999/2000 г. букмекеры Лас-Вегаса начали поддаваться скепсису. Они понизили ставки на победу Lakers до 6 к 1. В результате любой человек, который был готов поспорить с мнением большинства, мог заработать неплохие деньги. Вулгарис никогда особенно не верил в общепринятое мнение – во многом тот стиль жизни, что он имеет сейчас, стал возможен именно благодаря недостаткам коллективного мышления, – и происходившее казалось ему настоящим безумием. Авторы колонок в газетах и букмекеры делали слишком высокую ставку на небольшую выборку данных, игнорируя более полную картину и окружавший ее контекст.
По мнению Вулгариса, Lakers играли не так уж плохо. Команда уже одержала победу в пяти из первых семи матчей, несмотря на жесткое расписание, притирку к новому тренеру и проблему с травмой Брайанта, повредившего запястье перед началом сезона и еще не выходившего на поле после этого. СМИ сфокусировались на довольно неудачном сезоне 1998/99 г., прерывавшемся то забастовкой, то сменой тренера, игнорируя при этом рекордный результат 61:21, достигнутый при нормальных обстоятельствах в сезоне 1997/98 г. Вулгарис смотрел многие игры Lakers – ему нравилось то, что Джексон делал с клубом. Поэтому он поставил 80 тыс. долл. – все свои накопления за вычетом небольшой суммы, оставленной на питание и обучение, – на то, что Lakers выиграют чемпионат НБА. Выигрыш этой ставки принес бы ему полмиллиона долларов. А потеря заставила бы вернуться к работе в аэропорту по две смены в день.
Поначалу казалось, что природное чутье не обмануло Вулгариса. Начиная с этого момента в сезоне, Lakers выиграли 52 из остававшейся им 71 игры, в том числе 19, 16 и 11 игр подряд. Итоговый результат побед и поражений, составивший 67:15, оказался одним из лучших рекордов регулярного сезона в истории НБА. Однако в плей-офф ситуация изменилась: команды Западной Конференции сражались как звери, и даже высокая доля игр на домашнем поле – награда за выдающийся сезон – не особо способствовала тому, чтобы Lakers выиграли четыре серии игр кряду.
Игроки из Лос-Анджелеса пережили настоящий испуг, сражаясь против команды Sacramento Kings в первом круге плей-офф, а затем легко одержали победу над командой из Финикса[104] в полуфинале матчей Западной Конференции. Однако в следующем круге им противостояла Portland Trail Blazers – зрелая команда, во главе которой стоял бывший коллега Майкла Джордана – и бывший ученик Джексона – Скотти Пиппен. Выиграть у Portland было бы непросто – хотя команде и недоставало таланта Lakers, ее упрямство и физический стиль игры зачастую выбивали соперников из привычного ритма{540}.
Lakers довольно легко выиграли первую игру в серии «best-of-seven»[105], однако затем начались настоящие американские горки. Команда провалила вторую игру в Лос-Анджелесе, уступив в третьем тайме команде Portland 20 очков{541} и проиграв со счетом 106:177 (это было самое позорное поражение за весь сезон){542}.
Следующая игра происходила на стадионе Роуз-Гарден в Портленде. К третьему тайму Lakers смогли собраться после того, как проигрывали по итогам первого 13 очков. Брайант совершил в последние секунды тайма великолепный бросок, закрепивший победу с перевесом в 2 очка{543}. В следующей игре команда вновь смогла нарушить законы гравитации, преодолев отставание на 11 очков после того, как О’Нил, обычно плохо исполнявший штрафные броски, смог забить 9 мячей во всех представившихся ему попытках{544}. Проиграв по итогам серии со счетом 1:3, команда Trail Blazers, по хвастливому замечанию Джексона, «начала стучаться в двери ада»{545}.
Однако в пятой игре, происходившей в «Стейплз-Сентер» в Лос-Анджелесе, игроки Lakers опять не смогли взять игру в свои руки. Из 79 бросков удачными оказались лишь 30, и команда проиграла со счетом 88:96. В шестой игре, снова происходившей в Портленде, она потеряла темп и так и не смогла настроиться на нужный лад, и Blazers успешно победили со счетом 103:93. Решающим должен была стать седьмой матч в Лос-Анджелесе.
Для тех, кто делал ставки, самым разумным в такой ситуации было бы подстраховаться. Например, Вулгарис мог поставить 200 тыс. долл. на то, что команда Portland (ставки на которую принимались с коэффициентом 3 к 2) выиграет седьмой матч. Это гарантировало бы ему прибыль. В случае выигрыша Blazers он заработал бы значительно больше, чем потерял на начальной ставке в 80 тыс. долл., и остался бы с весомой суммой в 220 тыс. долл.{546}. Если бы выиграли Lakers, его первоначальная ставка все равно бы сыграла. Да, он потерял бы вторую поставленную сумму, однако чистый итог от двух ставок составил бы 320 тыс. долл.[106].
Конечно, это значительно меньше, чем полмиллиона, но все равно неплохо.
Но возникла одна небольшая проблема: у Вулгариса не было 200 тыс. долл. Более того, он не знал ни одного человека, который мог бы одолжить ему такую сумму (по крайней мере, среди тех, кому можно было бы доверять). Он был всего-навсего 23-летним грузчиком в аэропорту, проживавшим в Виннипеге в подвале дома своего брата. Так что на карту он поставил практически все.
В самом начале игры его шансы были не особенно хорошими. Игроки Blazers преследовали O’Нила при каждой возможности. Они поняли, что могут либо вынудить его бросать с линии штрафного броска с совершенно не гарантированным результатом, либо провоцировать его нарушать правила. К середине второго тайма эта стратегия сработала – O’Нил получил три фола и не смог совершить ни одного удачного броска с поля.
Затем игроки Portland пошли в атаку, которая завершилась 3-очковым броском Пиппена. Он не только принес команде перевес в 16 очков но и заставил загудеть весь зал «Стейплз-Сентра»{547}. К этому моменту шансы Вулгариса упали до нуля. Случаи, чтобы команда в том положении, в котором тогда оказалась Lakers{548}, – c отставанием в 16 очков за две минуты до конца третьего тайма – смогла бы выиграть, были крайне редки; шансы на выигрыш составляли примерно 1 из 15{549}, и казалось, что ставка Вулгариса – и мечта выбраться из Виннипега – обречена на провал{550}. Однако в четвертом тайме внезапно проявилась слабая сторона жесткого стиля игры Portland. Игроки команды устали, и им уже не хватало сил и адреналина. Lakers играли перед своей публикой, а как считают физиологи, это часто способствует выбросу тестостерона в самые нужные для игроков моменты{551}. Кроме этого, Lakers была более молодой командой, способной быстрее восстанавливать запасы энергии.
Внезапно игроки Portland перестали попадать в корзину. В четвертом тайме они не смогли увеличить счет в течение целых шести минут, а Lakers начали набирать темп. Сначала разрыв сократился до 6 очков, потом до 5, потом до 4, и, наконец, Брайан Шоу сравнял счет с помощью 3-очкового броска за четыре минуты до конца тайма. После этого Брайант вколотил еще два 3-очковых мяча, обеспечив своей команде перевес. Хотя в последние несколько минут игроки Portland вновь стали чаще бросать мяч в кольцо, было уже слишком поздно. Lakers показали свое преимущество, продемонстрировав целый ряд комбинаций, идеально разыгранных тандемом своих суперзвезд – Брайантом и O’Нилом.
Еще через две недели Lakers эффектно расправились с командой Indiana Pacers и выиграли свой первый титул чемпиона НБА со времен эры Мэджика Джонсона. Грузчик Боб оказался на полпути к тому, чтобы стать миллионером.
Насколько хорошо думают азартные игроки
Откуда Вулгарис мог узнать, что его ставка на Lakers выиграет? Конечно же, это было ему неизвестно.
Успешные игроки – а также успешные прогнозисты любого рода – не рассчитывают на то, что в дальнейшем их ожидают беспроигрышные ставки, а сами они будут иметь дело только с безукоризненными теориями или пользоваться результатами невероятно точных измерений. Все это – иллюзии простака, которого искушает собственная чрезмерная уверенность в себе. Напротив, успешные игроки рассматривают будущее как крупицы вероятностей, растущих и снижающихся, подобно тикеру на фондовом рынке, в ответ на каждый новый элемент информации. Когда проведенные ими расчеты показывают, что вероятность выиграть значительно превышает вероятность проиграть, они могут сделать ставку.
Например, когда Вулгарис сделал ставку, предполагалось, что вероятность выиграть титул НБА командой Lakers составляет 13 %. Вулгарис не считал, что вероятность победы – 100 % или даже 50 %, он просто был уверен, что в реальности она выше 13 %. Возможно, он допускал, что ее значение даже превышает 25 %. И если расчет Вулгариса был верным, ставка теоретически могла принести ему прибыль на уровне 70 тыс. долл. (табл. 8.1).
Таблица 8.1. Оценка Вулгарисом возможных последствий ставки на LAKERS
Если будущее для прогнозиста имеет разные оттенки серого, то настоящее рассматривается только в черно-белых красках (рис. 8.1). Теоретическая прибыль Боба (70 тыс. долл.) оценивалась с учетом 25 %-ной вероятности выиграть 520 тыс. долл. и 75 %-ной вероятности проиграть 80 тыс. долл. В долгосрочной перспективе победы и поражения взаимно сведутся на нет. Для хорошего прогнозиста будущее и прошлое больше похожи друг на друга, чем каждое из них похоже на настоящее – поскольку все будущие события могут быть выражены через значения их долгосрочных вероятностей. Однако в данном случае речь шла об одной ставке. Вулгарису необходимо было получить достаточно большой перевес (и у него имелось немало причин считать, что букмекеры недооценивали Lakers). Ему потребовался и недюжинный ум, чтобы понять это.
Рис. 8.1. Мир глазами успешного азартного игрока
Теперь, когда Вулгарис заработал достаточно денег, он может позволить себе работать с меньшим напряжением. В настоящее время он делает по три-четыре ставки на регулярные матчи в рамках чемпионата НБА. Хотя эти ставки невероятно велики по любым нормальным стандартам, они малы по сравнению с его капиталом – настолько малы, что он может вести себя по отношению к их исходу довольно индифферентно. Вечером, когда я пришел к нему в гости, он, не моргнув глазом, воспринял новость о том, что команда Utah Jazz выпустила на поле высокого и агрессивного украинского игрока Кирилла Фесенко – а это значило, что команда, скорее всего, выиграет матч, а Вулгарис потеряет свою ставку в 30 тыс. долл.
Самый большой секрет Вулгариса состоит в том, что у него нет большого секрета. Вместо этого у него имеется тысяча небольших секретов, квантов информации, которые он рассматривает в конкретный момент времени. Например, у него есть программа, позволяющая рассчитать исход каждой игры. Однако он полагается на ее выводы либо в тех случаях, когда считает, что у него есть серьезный перевес, либо когда ее выводы подкрепляются другой информацией. Он смотрит почти каждую игру НБА – иногда вживую, иногда в записи – и формирует собственное мнение о том, какие команды играют в полную силу, а какие нет. Он даже создал некое подобие аналитической службы, наняв ассистентов для создания графиков перемещений каждого игрока в каждой игре. Результаты этой работы обеспечивают ему преимущество, которого нет у многих команд НБА.
Он следит за тем, что пишут в Twitter десятки игроков НБА, и анализирует каждое 140-символьное сообщение. Игрок, пишущий о том, что он собирается зайти в ночной клуб, может хуже проявить себя в игре в следующий день. Вулгарис обращает много внимания на то, что говорят тренеры на пресс-конференции, и на слова, которые они используют: например, если тренер говорит, что ждет от команды «умелой защиты» или хочет, чтобы она играла «в хороший классический баскетбол», это может означать, что тренер хочет замедлить темп игры.
Все, за чем наблюдает Вулгарис, может показаться тривиальным большинству людей. В каком-то смысле так оно и есть – большие и очевидные перевесы будут замечены другими азартными игроками, а следовательно, это отразится на ставках. Поэтому ему нужно копнуть немножко глубже.
Например, в конце сезона 2002 г. Вулгарис заметил, что счет, с которым оканчивались игры с участием команды Cleveland Cavaliers, постоянно не соответствовал прогнозам. Стоит сказать, что в баскетболе принимают два вида ставок: на разницу в очках и на общий счет, то есть на количество очков, заработанных обеими командами. Внимательно проследив за ходом пары игр, он быстро выявил причину: Рики Дэвис, довольно эгоистичный разыгрывающий защитник команды, должен был стать в конце года профессионалом, не связанным контрактом, и поэтому он делал все, что только мог, чтобы улучшить свою статистику и повысить свою цену на рынке. Он отчаянно помогал нападавшим Cavaliers создать как можно больше возможностей зарабатывать очки и результативные подачи. Было совсем не важно, хороший это баскетбол или нет, – Cavaliers практически не имели шансов выйти в плей-офф{552}. Часто или нет, но соперники Cavaliers, которые находились в столь же плачевном положении и хотели взять реванш, заключали с ними негласное соглашение. Обе команды переставали обращать внимание на защиту и принимались обмениваться результативными бросками в корзину, пытаясь улучшить статистику друг друга{553}. В последние три недели сезона в играх с участием Cavaliers средний результат внезапно вырос с 192 очков за игру до 207{554}. Конечно, никто не мог гарантировать, что ставка на то, что счет окажется выше среднего, была беспроигрышной – гарантировать вообще нельзя ничего, – однако подобная ставка могла оказаться достаточно прибыльной.
Закономерности такого рода иногда кажутся очевидными в ретроспективе. Разумеется, итог игр Cavaliers должен был быть выше, поскольку им не оставалось ничего другого, кроме как улучшать статистику нападений. Однако и этот факт часто ускользает от внимания азартных игроков, которые слишком ограниченно понимают статистику и не учитывают контекст. Даже если команда заработала больше очков, чем ожидалось, в течение одной-двух или трех-четырех игр, то это обычно ничего не значит. Сезон игр НБА очень продолжительный: каждая из 30 команд играет по 82 игры, и поэтому подобные случаи наблюдаются почти постоянно{555}. Но не стоит слишком сильно на это рассчитывать. Причина возникновения таких результатов не имеет ничего общего с вероятностью. Букмекеры тоже замечают возникновение таких закономерностей, и это отражается на размере ставок, которые они предлагают рынку. И порой эти ставки выглядят так, что игроку стоит сделать ставку на противоположный исход.
Поэтому Вулгарис не просто выявляет закономерности – сделать это в любой среде с большими массивами данных несложно; именно так и поступают посредственные азартные игроки. Самое главное – это понять, что представляет собой данная закономерность – шум или сигнал.
Но, хотя я и не могу поделиться с вами каким-либо основным и единственным доводом, на основании которого Вулгарис делает или не делает ставку, его решения направляются определенным типом мыслительного процесса, называемого рассуждениями Байеса.
Невероятное наследие Томаса Байеса