Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет Сильвер Нейт
Томас Байес был английским священником, родившимся то ли в 1701, то ли в 1702 г. О жизни его известно довольно мало, хотя он подарил свое имя целому направлению в статистике и, возможно, самой знаменитой ее теореме. Неясно даже, как выглядел Байес на самом деле, его портрет, который часто приводят в энциклопедиях, может принадлежать другому лицу{556}.
Нам известно, что Байес, скорее всего, родился в зажиточной семье, проживавшей в юго-восточном английском графстве Хартфордшир. Он был вынужден отправиться в далекое путешествие и поступил в Эдинбургский университет, поскольку принадлежал к церкви нонконформистов, а не англиканской и ему был закрыт доступ в учебные заведения типа Оксфорда и Кембриджа{557}.
Тем не менее Байес был все равно избран членом Королевского научного общества, несмотря на незначительное количество публикаций. Там он обычно выполнял роль своего рода внутреннего критика или был посредником в ходе интеллектуальных дебатов. Одной из работ, которые ученые приписывают Байесу (несмотря на ее публикацию под псевдонимом Джон Нун{558}), является трактат под названием «Божественная доброта»{559}. В этом трактате Байес рассматривал извечный теологический вопрос о том, как могут существовать в мире страдания и зло, несмотря на безграничную доброту Господа. В сущности, ответ Байеса на этот вопрос состоит в том, что мы ошибочно принимаем наше собственное несовершенство за несовершенство Бога, чей замысел в отношении нашей Вселенной мы не можем понять в полной мере. В письме другому теологу Байес писал «довольно странно… для человека, видящего лишь нижнюю часть шкалы, говорить о всеобъемлющем поражении счастья в мире»{560}.
Более знаменитая работа Байеса «Очерки к решению проблемы доктрины шансов»{561} была опубликована только после его смерти и после того, как была представлена вниманию Королевского общества в 1763 г. другом Байеса по имени Ричард Прайс. В работе рассматривался вопрос о том, как мы формулируем вероятностные представления о мире, сталкиваясь с новыми данными.
В описании эссе Байеса Прайс приводит пример человека, попадающего в наш мир (например, Адама или человека из платоновской пещеры) и впервые наблюдающего восход солнца. Поначалу он не знает, обычное ли это событие или из ряда вон выходящее. Однако он видит восход солнца каждый последующий день и начинает все сильнее верить, что это – постоянное свойство природы. Постепенно, основываясь лишь на этой, в чистом виде статистической форме взаимодействия с природой, он присваивает своему прогнозу о том, что солнце вновь встанет на следующий день, вероятность, максимально близкую (хотя и никогда не достигающую) к 100 %.
Суть идеи Байеса и Прайса состоит не в том, что мир всегда оценивается в вероятностях или степенях неопределенности. Байес верил в небесное совершенство; он также выступал сторонником взглядов Исаака Ньютона, согласно которым природа следует регулярным и предсказуемым законам. Скорее, Байес говорил – с математической и философской точек зрения – о том, как нам следует изучать Вселенную. Мы учимся новым представлениям о ней с помощью аппроксимаций, оказываясь ближе и ближе к истине по мере того, как мы собираем все больше свидетельств.
Это заключение прямо противоположно более скептичной точке зрения шотландского философа Дэвида Юма{562}, который считал, что, поскольку мы не можем быть уверены в том, что солнце взойдет, наш прогноз относительно этого события не может считаться более рациональным, чем обратное заключение{563}. Напротив, байесовская точка зрения рассматривает рациональность как вероятностное событие. По сути, Байес и Прайс говорят Юму: не обвиняйте природу, поскольку вы слишком глупы, чтобы ее понять, и если вы вылезете из своей скептической раковины и сделаете прогнозы ее поведения, то, возможно, сможете приблизиться к истине.
Вероятность и прогресс
Стоит отметить, насколько это утверждение напоминает слова Байеса, приведенные в трактате «Божественная доброта» («Divine Benevolence»), где утверждалось, что нам не стоит относить собственное несовершенство на ошибки Бога. Однако в философии Байеса, по сути, нет ничего религиозного{564}.
Нужно отметить, что самое точное математическое выражение того, что в наши дни считается теоремой Байеса, было разработано человеком, который с высокой долей вероятности был атеистом{565}, – французским математиком и астрономом Пьером-Симоном Лапласом.
Лаплас, как вы, возможно, помните из главы 4, был ярким представителем человека, стоящего на позициях научного детерминизма. Он считал, что мы могли бы идеально спрогнозировать нашу Вселенную, если бы знали положение каждой частицы в ней и могли бы достаточно быстро рассчитать ее движение. Так почему же Лаплас так увлекся теорией, основанной на вероятности?
Причина заключается в разрыве между совершенством природы и нашим человеческим несовершенством в измерении и понимании ее. Лапласа изрядно расстраивали астрономические наблюдения, свидетельствовавшие об аномалиях в орбитах Юпитера и Сатурн – по их предсказаниям, Юпитер должен был врезаться в Солнце, а Сатурн – вылететь за края Солнечной системы{566}.
Разумеется, эти предсказания были в корне неверными, Лаплас посвятил значительную часть своей жизни тому, чтобы более точно определить орбиты этих планет{567}. Уточнения, которые внес Лаплас, были основаны на вероятностных заключениях{568}, а не на результатах более точных измерений, поскольку инструменты того времени (например, телескопы) были достаточно грубыми. Лаплас начал рассматривать вероятность как срединную точку между невежеством и знанием. Ему казалось очевидным, что для достижения научного прогресса важно уделять вопросам вероятности значительно больше внимания{569}.
Таким образом, Байес и Лаплас уже в XVIII в. отлично понимали, что существует некая тонкая связь между вероятностью, предсказанием и научным прогрессом. И это было еще в тот период, когда человечество только начало сталкиваться с взрывообразным ростом объемов информации, ставшим возможным благодаря изобретению печатного пресса несколькими столетиями ранее и способствовавшим развитию устойчивого научного, технического и экономического прогресса. Эта связь крайне важна – как для предсказания орбит планет, так и для угадывания победителя в матче с участием Lakers. Как мы увидим ниже, наука зашла в тупик позже, когда в XX в. начала доминировать иная статистическая парадигма, лишившая предсказание былой значимости и пытавшаяся рассматривать неопределенность как результат несовершенства наших измерений, а не как ошибку наших суждений.
Простая математика теоремы Байеса
Если философская подоплека теоремы Байеса удивительно глубока, то ее математика потрясающе проста. В своей базовой форме это всего лишь алгебраическое выражение с тремя известными переменными и одной неизвестной. Однако эта простая формула способна привести к инсайтам в предсказаниях.
Теорема Байеса прямо связана с условной вероятностью. Иными словами, она позволяет рассчитать вероятность какой-либо теории или гипотезы, если произойдет какое-либо событие. Представьте себе, что вы живете с партнером и, вернувшись домой из командировки, обнаруживаете незнакомую пару нижнего белья в своем гардеробе. Возможно, вы зададитесь вопросом: какова вероятность того, что ваш партнер вас обманывает? Условие состоит в том, вы найдете белье; гипотеза состоит в том, что вы заинтересованы оценить вероятность того, что вас обманывают. Хотите – верьте, хотите – нет, но теорема Байеса способна дать вам ответ на вопрос такого рода – при условии того, что вы знаете (или хотите оценить) три качества.
• Прежде всего вы должны оценить вероятность появления белья как условие правильности гипотезы – то есть при условии того, что вам изменяют.
Для решения этой проблемы давайте предположим, что вы женщина, а ваш партнер – мужчина, а предметом спора выступает пара трусиков. Если он вам изменяет, то несложно представить себе, как в ваш гардероб могли попасть чужие трусики. Но, даже если (или даже особенно в том случае если) он вам изменяет, вы можете ожидать, что он ведет себя достаточно осторожно. Давайте скажем, что вероятность появления трусиков при условии того, что он вас обманывает, составляет 50 %.
• Во-вторых, вы должны оценить вероятность появления белья при условии того, что гипотеза неверна.
Если муж вам не изменяет, должны быть другие, более невинные объяснения появления трусиков в вашем гардеробе. Некоторые из них могут оказаться довольно неприятными (например, это могли бы быть его собственные трусики). Возможно, что его багаж был по ошибке перепутан с чужим. Возможно, что в его доме по каким-то причинам вполне невинно заночевала какая-то ваша подруга, которой вы доверяете. Трусики могли бы быть подарком вам, который он забыл упаковать. Ни одна из этих теорий не лишена изъянов, хотя порой объяснения в стиле «мое домашнее задание съела собака» действительно оказываются правдой. Вы оцениваете их совокупную вероятность в 5 %.
• Третье и самое важное, что вам нужно, – это то, что байесовцы называют априорной вероятностью (или просто априори). Как вы оценивали вероятность его измены до того, как нашли белье? Разумеется, вам сложно сохранять объективность оценки сейчас, после того как эти трусики появились в поле вашего зрения (в идеале вы оцениваете эту вероятность до того, как начинаете изучать свидетельства). Но иногда оценивать вероятность подобных событий можно эмпирически. Например, в ряде исследований было показано, что в течение любого случайным образом взятого года своим супругам изменяет около 4 % женатых партнеров{570}, так что мы возьмем эту цифру за априорную вероятность.
Если вы произвели оценку всех этих значений, то можете применить теорему Байеса для оценки апостериорной вероятности[107]. Именно в этой цифре мы и заинтересованы больше всего – насколько велика вероятность того, что нам изменяют, при условии что мы нашли чужое белье?
Расчет и простая алгебраическая формула, позволяющая его сделать, приведены в табл. 8.2.
Таблица 8.2. Пример расчета вероятности измены по теореме Байеса
Оказывается, что вероятность измены все равно достаточно мала – 29 %. Это может показаться нелогичным: разве трусики не являются достаточно весомой уликой? Возможно, такой результат связан с тем, что вы использовали слишком низкое априорное значение вероятности его измены.
Хотя у невиновного человека может быть значительно меньше вариантов разумных объяснений появления трусиков, чем у виновного, вы изначально посчитали его невиновным, и это оказало большое влияние на результат расчета по уравнению.
Когда мы априорно в чем-то уверены, мы можем проявить удивительную гибкость даже при появлении новых свидетельств. Одним из классических примеров таких ситуаций является выявление рака груди у женщин в возрасте старше 40 лет. К счастью, вероятность, что у женщины в возрасте после 40 лет разовьется рак груди, довольно невелика и составляет примерно 1,4 %{571}. Однако чему равна вероятность положительного результата на ее маммограмме?
Исследования показывают, что даже если у женщины нет рака, то маммограмма ошибочно покажет его наличие в 10 % случаев{572}. С другой стороны, если у нее есть рак, маммограмма выявит его примерно в 75 % случаев{573}. Увидев эту статистику, вы можете решить, что положительный результат маммограммы означает, что все очень плохо. Однако расчет по теореме Байеса с использованием этих цифр позволяет сделать иное заключение: вероятность наличия рака груди у женщины в возрасте за 40 при условии, что у нее положительная маммограмма, все еще составляет примерно 10 %. В данном случае такой результат расчета по уравнению обусловлен тем, что довольно немного молодых женщин имеют рак груди. Именно поэтому многие врачи рекомендуют женщинам не начинать регулярно делать маммограммы до 50-летнего возраста, после достижения которого априорная вероятность рака груди значительно увеличивается{574}.
Проблемы такого рода, вне всякого сомнения, сложны. Во время недавно проводимого исследования статистической грамотности американцев им приводили этот пример с раком груди. И оказалось, что всего 3 % из них смогли правильно рассчитать значения вероятности{575}. Иногда, немного замедлившись и попробовав визуализировать эту проблему (как показано на рис. 8.2), мы можем легко проверить реальностью свои неточные аппроксимации. Визуализация помогает нам легче увидеть общую картину – поскольку рак груди встречается у молодых женщин крайне редко, сам факт положительного результата маммограммы еще ни о чем не говорит.
Рис. 8.2. Графическое изображение исходных данных для теоремы Байеса на примере с маммограммой
Однако мы обычно склонны ориентироваться на самую новую или самую доступную информацию, и общая картина начинает теряться. Умные игроки вроде Боба Вулгариса научились умело пользоваться подобными недостатками нашего мышления. Вулгарис сделал выгодную ставку на Lakers отчасти потому, что букмекеры уделили слишком много внимания нескольким первым играм Lakers и изменили ставки на выигрыш командой титула с 4 к 1 до 65 к 1. Однако на самом деле команда играла ничуть не хуже, чем могла играть хорошая команда в случае травмы одного из ее звездных игроков. Теорема Байеса требует от нас более внимательно продумывать проблемы такого рода. Она может оказаться крайне полезной для выявления случаев, когда наши аппроксимации, основанные на чутье, оказываются слишком грубыми.
Но я не хочу сказать, что наши априорные ожидания всегда доминируют над новыми свидетельствами или что теорема Байеса всегда приводит к нелогичным, на первый взгляд, результатам. Иногда новые свидетельства оказываются настолько значимыми для нас, что перевешивают все остальное, и мы можем практически моментально изменить свое мнение и стать полностью уверенными в событии, вероятность которого считали почти нулевой.
Давайте рассмотрим более мрачный пример – атаки 11 сентября. Большинство из нас, проснувшись в тот день утром, присваивало практически нулевое значение вероятности того, что террористы примутся разбивать самолеты о небоскребы на Манхэттене. Однако мы признали очевидную возможность террористической атаки после того, как первый самолет врезался во Всемирный торговый центр. И у нас исчезли любые сомнения в том, что на нас было произведено нападение, после того как самолет врезался во вторую башню. Теорема Байеса способна отобразить этот результат.
Допустим, до столкновения первого самолета с башней наши расчеты вероятности террористической атаки на высотные здания Манхэттена составляли лишь 1 шанс из 20 тыс., или 0,005 %. Однако мы также должны были считать достаточно низкой вероятность ситуации, при которой самолет столкнулся бы с башней Всемирного торгового центра по ошибке. Эта цифра может быть рассчитана эмпирически. За период длительностью 25 тыс. дней до событий 11 сентября, в течение которых осуществлялись полеты над Манхэттеном, произошло всего два подобных случая{576}: столкновение с Эмпайр-стейт-билдинг в 1945 г. и с башней на Уолл-стрит, 40, в 1946 г. Следовательно, возможность подобного инцидента составляла примерно 1 шанс из 12 500 в любой случайный день. Если по этим цифрам сделать расчеты с использованием теоремы Байеса (табл. 8.3a), то вероятность террористической атаки повышалась с 0,005 до 38 % в момент столкновения первого самолета со зданием.
Таблица 8.3а. Пример расчета вероятности террористической атаки по теореме Байеса
Однако идея, заложенная в теорему Байеса, заключается в том, что мы не корректируем свои расчеты вероятности только один раз. Мы делаем это постоянно по мере появления новых свидетельств. Таким образом, наша апостериорная вероятность террористической атаки после столкновения первого самолета, равная 38 %, становится нашей априорной возможностью столкновения со вторым.
И если вы еще раз проведете расчеты после столкновения второго самолета с башней Всемирного торгового центра, то увидите, что вероятность террористической атаки 99,99 % сменяется почти полной уверенностью в этом событии. Один несчастный случай в яркий солнечный день в Нью-Йорке был крайне маловероятен, но второй практически не мог не произойти (табл. 8.3б), как мы внезапно и с огромным ужасом поняли.
Таблица 8.3б. Пример расчета вероятности террористической атаки по теореме Байеса
Я сознательно выбрал в качестве примеров довольно сложные случаи – террористические атаки, рак, супружеская измена, – поскольку хочу продемонстрировать масштаб проблем, к решению которых может быть применено байесовское мышление. Теорема Байеса – это не волшебная формула. В ее самой простой формуле, которую мы приводим в этой книге, используются простые арифметические действия по сложению, вычитанию, делению и умножению. Но для того, чтобы она дала нам полезный результат, мы должны снабдить ее информацией, в частности нашими расчетами априорных вероятностей.
Однако теорема Байеса заставляет нас думать о вероятности событий, происходящих в мире, даже когда речь заходит о вопросах, которые мы не хотели бы считать проявлением случайности. Она не требует, чтобы мы воспринимали мир как внутренне, метафизически неопределенный: Лаплас считал, что все, начиная от орбит планет и заканчивая движением мельчайших молекул, управляется упорядоченными ньютоновскими правилами. И тем не менее он сыграл важную роль в развитии теоремы Байеса. Скорее можно сказать, что эта теорема связана с эпистемологической неопределенностью – границами наших знаний.
Проблема ложноположительного срабатывания[108]
Когда мы не можем думать подобно истинным байесовцам, ложноположительное срабатывание начинает представлять собой проблему не только для маммографии, но и для всей науки. В введении я упомянул работу врача-исследователя Джона П. А. Иоаннидиса. В 2005 г. Иоаннидис опубликовал влиятельный труд под названием «Почему самые широко публикуемые выводы исследований неверны»{577}, в котором процитировал множество статистических и теоретических аргументов, подтверждавших, что (как и следует из названия) большинство гипотез, признанных истинными в медицине и большинстве других научных профессий, являются, по сути, ложными.
Гипотеза Иоаннидиса, как мы уже сказали, кажется одной из немногих истинных. Так, сотрудники компании Bayer Laboratories обнаружили, что не могут повторить в ходе собственных экспериментов до двух третей положительных заключений, опубликованных в медицинских журналах{578}. Еще один способ проверить правдивость выводов исследования состоит в том, чтобы понять, насколько точными являются результаты предсказаний в реальном мире, И, как мы видим на множестве примеров, приведенных в этой книге, часто выводы не выдерживают испытание реальностью. Судя по всему, частота появления неудачных предсказаний во множестве областей, от сейсмологии до политических наук, оказывается невероятно высокой.
«За последние 20 лет благодаря геометрическому росту доступной информации, развитию геномики и других технологий мы получили возможность измерять миллионы и миллионы потенциально интересных переменных, – рассказал мне Иоаннидис. – Можно ожидать, что мы сможем использовать эту информацию для того, чтобы заставить предсказания работать на нас. Я не говорю, что мы не достигли никакого прогресса. Принимая во внимание наличие миллионов научных работ, признать это было бы крайне стыдно. Однако совершенно очевидно, что мы не сделали миллионов открытий. Большинство работ не вносят реального вклада в развитие знания».
Вот почему наши предсказания могут оказаться более подверженными неудаче в эру Больших данных. С экспоненциальным ростом объема доступной информации по той же экспоненте растет и количество гипотез, требующих изучения. Например, правительство США в настоящее время публикует сведения о 45 тыс. экономических статистических показателей. Если вы захотите протестировать связи между всеми комбинациями из пар этих показателей – есть ли, допустим, причинно-следственная связь между ставкой банковского кредитования и уровнем безработицы в Алабаме? – то вам потребуется протестировать не меньше миллиарда гипотез[109]. Однако количество осмысленных связей в данных, говорящих о наличии причинно-следственной связи, а не о корреляции, и позволяющих протестировать то, каким образом мир работает по-настоящему, на много порядков ниже. Истина не растет теми же темпами, что и информация; по сути, в мире сейчас не больше истины, чем было до появления интернета или печатного пресса. Основная часть данных – всего лишь шум, так же как основная часть Вселенной заполнена вакуумом.
Тем не менее, как мы знаем из теоремы Байеса, в случаях, когда реальная вероятность возникновения какой-либо болезни в популяции низка (рак груди у молодых женщин; истина в море данных), ложноположительное срабатывание может доминировать в результатах, если только мы не будем достаточно внимательны и осторожны. На рис. 8.3 представлено графическое отображение этой картины. Так, 80 % истинных научных гипотез вполне справедливо признаются истинными, а около 90 % неверных гипотез совершенно справедливо отвергаются. Тем не менее, поскольку истинные открытия возникают крайне редко, оказывается, что около двух третей выводов, которые мы считаем правильными, на самом деле оказываются ложными!
Рис. 8.3. Графическое отображение ложноположительного срабатывания
К сожалению, как выяснил Иоаннидис, состояние опубликованных исследований в большинстве областей, по которым проводилось статистическое тестирование, напоминает ту картину, что можно увидеть на рис. 8.3[110].
Почему же доля ошибок так велика? До определенной степени вся данная книга представляет собой ответ на этот вопрос. Причин можно назвать много: отчасти они связаны с нашими психологическими предубеждениями, отчасти – с распространенными методологическими ошибками, а отчасти – с неправильно выстроенными стимулами.
Однако основная проблема лежит в том, что тип статистического мышления, который используют различные исследователи, является ошибочным по своей сути.
Когда статистика отклонилась от принципов Байеса
Английский статистик и биолог по имени Рональд Эймлер (Р. A.) Фишер был, возможно, основным интеллектуальным соперником Томаса Байеса, несмотря на то что он родился в 1890 г., почти через 120 лет после его смерти. Он проявил себя еще более яркой личностью, чем Байес, и таким же олицетворением английской интеллектуальной традиции своего времени, каким в наши дни стал Кристофер Хитченс. Он был миловидным, но неопрятно одетым человеком{579}, постоянно курил трубку или сигареты и вел непрекращающийся бой с реальными и вымышленными соперниками.
Посредственный лектор, но в то же время проницательный писатель, обладавший чутьем к драматическим сюжетам, он оставался отличным и востребованным собеседником за обедом. Интересы Фишера были невероятно широкими. Один из лучших биологов и генетиков своего времени, но при этом беззастенчивый сторонник элитизма, он искренне оплакивал тот факт, что у представителей бедных классов имелось значительно больше потомства, чем у интеллектуалов{580} (сам Фишер, следуя собственным убеждениям, с осознанием собственного долга дал жизнь восьмерым отпрыскам).
Возможно, Фишер в большей степени, чем кто-либо еще, отвечает за то, какими статистическими методами мы широко пользуемся в настоящее время. Он разработал терминологию проверки статистической значимости и значительную часть соответствующей методологии. Он не относился к числу больших поклонников Байеса и Лапласа, но именно он впервые использовал термин «байесовский» (Bayesian) в опубликованной статье, причем довольно уничижительным образом{581}, а в другой статье утверждал, что теория Байеса «должна быть полностью отвергнута»{582}.
Фишер и его современники не видели проблемы в формуле, называемой теоремой Байеса, как таковой, поскольку это обычное математическое выражение. Скорее, они беспокоились о том, как следует ее применять. В частности, у них вызывало вопросы понятие байесовского априорного значения{583}. Оно казалось им слишком субъективным: мы должны заранее предусмотреть, насколько вероятным мы считаем какое-то событие, прежде чем пуститься в эксперименты? Не противоречит ли это понятиям объективной науки?
Поэтому Фишер и его современники решили разработать набор статистических методов, которые, как они надеялись, освободят нас от любого возможного негативного влияния предубеждений и искажений. Это направление статистики обычно называется «фреквентизм» (frequentism), хотя также его называют «фишеровской статистикой» (в противовес байесовской){584}.
Идея фреквентизма состоит в том, что неопределенность в статистической проблеме возникает исключительно из-за того, что сбор данных производится на выборке, а не на всей популяции. Это имеет вполне разумные основания, когда мы изучаем, допустим, результаты политических опросов. Например, при проведении опросов в Калифорнии выборка составляет всего 800 человек, а не 8 млн, которые придут голосовать на очередных выборах, в результате возникает так называемая ошибка выборки. Величина ошибки, которую вы видите в описании политических опросов, измеряет именно это – насколько велика вероятность ошибки из-за того, что вы опрашиваете 800 представителей популяции из 8 млн? Методы фреквентистов как раз и призваны дать этому параметру количественную оценку.
Однако даже в контексте политических выборов ошибки выборки не всегда позволяют рассказать всю историю. В течение короткого интервала между конференцией демократической партии в Айове и первичными выборами демократической партии в Нью-Гемпшире в 2008 г. в последнем штате было опрошено около 15 тыс. человек{585} – невероятно много для столь небольшого штата, притом что предел погрешности теоретически составлял ±0,8 %. Однако реальная ошибка оказалась в 10 раз выше: Хиллари Клинтон выиграла выборы в штате с перевесом в 3 %, хотя, по данным опросов, уступала Бараку Обаме 8 %. Ошибка выборки – единственный тип ошибки, которому фреквентисты дают право на существование, – была, пожалуй, меньшей из проблем, возникшей при проведении опросов в Нью-Гемпшире.
Кроме того, некоторые организации, занимающиеся опросами, стабильно демонстрируют искажение в сторону той или иной партии{586}. С тем же успехом они могли бы опросить все 200 млн взрослых американцев и все равно получить неверные результаты. Байес разобрался с этими проблемами уже 250 лет назад. Если вы используете искаженный инструмент, то не важно, как много измерений вы произведете, вы неправильно сформулировали цель.
По сути, фреквентистский подход к статистике пытается изо всех сил утвердиться в мысли о том, что частая причина неверных предсказаний – это человеческая ошибка. Этот подход рассматривает неопределенность как нечто, присущее эксперименту, а не нашей способности понимать реальный мир. Фреквентистский метод также предполагает, что чем больше данных мы собираем, тем меньше становится ошибка. Со временем она приблизится к нулю. Таким образом, наличие данных считается необходимым и достаточным для решения любой проблемы. Многие из куда более проблемных вопросов предсказания, описанных в этой книге, связаны с областями, в которых полезные данные встречаются крайне редко, и порой их сбор действительно является важным и ценным делом. Однако неправильное использование этого метода вряд ли поставит вас на верный путь к статистическому совершенству. Как заметил Иоаннидис, эра Больших данных лишь ухудшает проблемы ложных позитивных выводов в исследовательской литературе.
Фреквентистский метод нельзя считать особенно объективным ни в теории, ни на практике. Напротив, он полагается на целый ряд предположений. Например, обычно предполагается, что неопределенность в измерении следует колоколообразной кривой или нормальному распределению. Часто это предположение достаточно хорошо описывает ситуацию, но не в случае таких вещей, как колебания на фондовом рынке. Фреквентистский подход требует определения выборки, которая будет выглядеть достаточно прямолинейно, когда дело касается политического опроса, но довольно неоднородно во многих других областях практического применения.
Какую «выборку из популяции» можно было бы выбрать в случае атаки 11 сентября?
Однако еще большая проблема состоит в том, что фреквентистские методы – в своем стремлении создать безупречные статистические процедуры, которые не могут быть испорчены предубеждениями самого исследователя, – вынуждают его герметично закрываться от реального мра. Эти методы не позволяют такому исследователю изучить глубокий контекст или ущербные черты своей гипотезы, то есть то, чего требует байесовский метод в форме априорной вероятности. В результате можно увидеть, на первый взгляд, серьезные научные работы о том, как жабы могут предсказывать землетрясения{587}, или о том, как оптовые магазины типа Target стимулируют создание нетерпимости в обществе{588}. В подобных исследованиях фреквентистские тесты применяются для создания «статистически значимых» (однако, по сути, бессмысленных и даже возмутительных) выводов.
Данные без контекста бесполезны
Ближе к концу своей карьеры Фишер смягчился и даже время от времени хвалил Байеса{589}. Некоторые из методов, разработанных им за долгие годы (хотя и не самые популярные в наши дни), представляли собой, по сути, компромиссы между байесовским и фреквентистским подходами. Однако в последние годы своей жизни Фишер допустил крайне серьезный просчет, который продемонстрировал ограничения этого подхода.
Вопрос касался курения сигарет и рака легких. В 1950е гг. в значительном количестве исследований (в некоторых из них использовались стандартные статистические методы, а в других – байесовские){590} утверждалось, что между ними существует связь, что в наши дни никого уже не удивляет.
Фишер провел последние годы своей жизни, выступая против этих выводов. Он публиковал письма в престижных изданиях типа British Medical Journal и Nature{591}, не отрицая, впрочем, что в результатах этих исследований прослеживается довольно сильная статистическая зависимость между курением и раком легких. Однако он утверждал, что в данном случае произошла путаница между корреляцией и причинно-следственными связями, сравнивая эту ситуацию с исторической корреляцией между объемами импорта яблок и количеством браков в Англии{592}. В какой-то момент он даже утверждал, что рак легких приводит к курению, а не наоборот{593}, – по всей видимости, предполагая, что люди курят, чтобы облегчить боль в легких.
Многие научные выводы, которые в наши дни ни у кого не вызывают сомнения, когда-то могли восприниматься с большим недоверием. Иногда это было вызвано существовавшими культурными табу (как в случае заявления Галилея о том, что Земля вращается вокруг Солнца), а довольно часто тем, что просто отсутствовали данные, требующиеся для анализа проблемы. Мы, может быть, и позволили бы Фишеру сорваться с крючка, если бы к 1950 г. уже не было достаточного количества убедительных свидетельств существования связи между курением сигаретам и раком легких. Ученые, изучившие данные и свидетельства из прошлого, пришли к выводу, что на тот момент уже было множество статистических и клинических тестов, проводившихся большим количеством исследователей в разных контекстах, которые наглядно показывали причинно-следственную связь{594}. Идея быстро стала научным консенсусом.
Так почему же Фишер отвергал эту теорию? Одна из причин могла быть связана с тем, что он консультировал производителей сигарет за деньги{595}. Другая – с тем, что он сам курил всю жизнь. Фишеру нравилось казаться противоречивым и демонстрировать, что он не любит все, имеющее привкус пуританства. Короче говоря, он сам был подвержен огромному количеству «искажений».
Возможно, однако, что более значимая проблема заключается в том, как статистическая философия Фишера воспринимает мир. Она уделяет особое внимание объективной чистоте эксперимента: каждая гипотеза может быть доведена до идеального заключения, если только был собран достаточный объем данных. Однако в процессе достижения такого уровня чистоты эта теория отвергает необходимость байесовских априорных значений или любого другого вида беспорядка в контексте реального мира. Этот метод не требует и не побуждает нас задуматься о некорректности нашей гипотезы – идея о том, что сигареты вызывают рак легких, ничем не отличается от предположения о том, что жабы способны предсказывать землетрясения. Но мне кажется, что стоит сказать Фишеру спасибо за то, что он признал тот факт, что корреляция не всегда предполагает наличие причинно-следственной связи.
Однако фишеровские статистические методы никоим образом не помогают нам понять, какая корреляция предполагает наличие причинно-следственных связей, а какая нет. Так что не приходится удивляться тому, что после того, как Фишер всю жизнь думал определенным образом, он утратил способность рассказать о различии между ними.
Боб – байесовец
В байесовской картине мира предсказание представляет собой критерий, с помощью которого мы оцениваем степень прогресса. Возможно, мы никогда и не будем уверены, что знаем истину на все 100 %, однако создание корректных прогнозов представляет собой отличный способ понять, приближаемся ли мы к ней.
Сторонники взглядов Байеса особенно ценят тех, кто играет в азартные игры{596}. Байес и Лаплас, да и другие теоретики, разрабатывавшие теорию вероятности на ее раннем этапе, очень любили приводить примеры из азартных игр, чтобы пояснить свои идеи. (Хотя Байес, по всей видимости, сам не увлекался этим занятием{597}, он вращался в кругах, где часто играли на деньги в карты и бильярд.) Игрок делает предсказания (хорошо), и он делает предсказания, предполагающие расчет вероятностей (отлично), а когда он готов поставить деньги на свои предсказания (еще лучше), он делится своими убеждениями о мире с остальными. Наиболее практичное определение байесовского априори может представлять собой вероятность события, на которые вы хотите сделать свою ставку[111].
Боб Вулгарис представляет собой особенно ярко выраженный байесовский тип азартного игрока. Ему нравятся ставки на баскетбол как раз потому, что они дают ему возможность протестировать самого себя и правильность своих теорий. «Представьте себе, что вы управляете спортивной командой и набираете себе игроков, – сказал он мне ближе к концу интервью. – Вы не всегда понимаете, было ли ваше решение правильным или нет. В моем же случае я знаю – в конце дня или в конце сезона, – оказался ли я прав или нет, поскольку я либо теряю деньги, либо их выигрываю. Это довольно хорошее подтверждение теории». Вулгарис впитывает так много информации о баскетболе, как только может, поскольку практически любой факт способен изменить его расчеты вероятности. Профессиональный игрок на спортивных событиях такого типа, как Вулгарис, будет размещать ставки только в том случае, если считает, что вероятность выигрыша не меньше 54 %. Этого вполне достаточно для покрытия комиссионных, которые букмекеры взимают с выигрышных ставок, и риска, связанного с этим действием. При всех своих навыках и упорном труде – Вулгарис считается одним из лучших азартных игроков в мире в наши дни – он угадывает результаты правильно лишь примерно в 57 % случаев. Добиться более высокого результата исключительно сложно.
Таким образом, вся разница связана с незначительным объемом информации, позволяющим Вулгарису увеличить вероятность с 53 до 56 %. Именно на эту небольшую прибыль и живут игроки, проводящие время как за покерным столом, так и на фондовом рынке. Предложенное Фишером понятие статистической значимости, слишком вольно отсекающее те или иные факты вне зависимости от контекста[112] для определения уровня «значительности»{598}, несколько грубовато для людей, делающих ставки на спорт.
Это не значит, что Вулгарис избегает создавать гипотезы/em> на основе данных, которые показывает ему статистика (проблема подхода Фишера к тестированию гипотез состоит не в их существовании, а в том, как Фишер рекомендует их тестировать){599}. В сущности, это критически важно для того, что делает Вулгарис. Статистические закономерности видны во всем, и рано или поздно они отражаются на ставках. Вопрос состоит в том, представляют ли они собой сигнал или шум. Гипотезы Вулгариса сформированы с учетом его знаний о баскетболе, поэтому он может увидеть разницу быстрее и точнее.
Подход Вулгариса к ставкам на баскетбол представляет собой один из чистейших примеров научного метода, который только можно найти (табл. 8.4). Он изучает мир и задает вопросы: почему команда Cleveland Cavaliers так часто получает больше очков, чем предполагалось? Затем он собирает информацию о проблеме и формулирует гипотезу: команда делает это потому, что у Рики Дэвиса заканчивается контракт и он хочет играть в быстром темпе, чтобы его личная статистика стала выглядеть лучше. Четкая граница между тем, что делает Вулгарис, и тем, что делают физики или биологи, состоит в том, что он делает ставки на результат собственных предсказаний, а ученые надеются на подтверждение своих предсказаний путем экспериментов.
Если Вулгарису удается создать достаточно сильную гипотезу о том, что он видит в данных, он делает более агрессивные ставки. Предположим, например, что Вулгарис обращает внимание на ремарку тренера команды Denver Nuggets о том, что он хочет «устроить хорошее шоу» для фанатов. Возможно, это досужая болтовня, но не исключено, что команда будет играть в более быстром темпе, чтобы повысить зрелищность и заставить аудиторию покупать больше билетов на матчи. Если эта гипотеза верна, то Вулгарис может ожидать, что Nuggets будет выигрывать 70 % времени, в отличие от статистических 50 %. Как следует из теоремы Байеса, чем выше убежденность Вулгариса в правильности его гипотезы, тем быстрее он может начинать делать прибыльные ставки на игры Nuggets. Он может начать это делать, изучив, как проходили пары игр с участием команды, и поняв, выдерживает ли его теория испытание практикой. Причем он начнет делать это раньше, чем на данную закономерность обратят внимание букмекеры в Лас-Вегасе и изменят ставки. И, напротив, он позволяет себе не отвлекаться на статистические закономерности, такие как медленный старт Lakers в 1999 г., в котором нет никакого глубокого смысла, но который другие игроки могут ошибочно принять за сигнал.
Таблица 8.4. Научный метод, используемый Вулгарисом{600}
Байесовский путь к снижению неправоты
Но какими можно считать расчеты вероятностей, которые делает Боб, – субъективными или объективными? Это довольно хитрый вопрос.
С эмпирической точки зрения, мы все имеем убеждения и предубеждения, основанные на комбинации нашего опыта, ценностей, знаний и, возможно, политических или профессиональных взглядов. Одна из полезных характеристик байесовской точки зрения состоит в том, что если мы явным образом признаем, что у нас имеются априорные убеждения (влияющие на то, как мы интерпретируем новые свидетельства), то сможем достаточно хорошо описать нашу реакцию на изменения в своем мире. Например, если, согласно априорному убеждению Фишера, вероятность, что курильщики заболеют раком легких, составляют всего 0,00001 %, это объясняет, почему его не могли убедить никакие свидетельства обратного. В сущности, согласно теореме Байеса, ничто не мешает вам оставаться убежденным в чем-то, что вы считаете совершенно правильным. Если, по вашему мнению, вероятность существования Бога – 100 % (или же, напротив, 0 %), то, согласно теореме Байеса, никакое количество доказательств не убедит вас в обратном.
Я не собираюсь ничего говорить о том, существует или нет что-то, во что вы можете верить с абсолютной и беспрекословной уверенностью[113]. Однако возможно, что нам нужно честно говорить об этом. Спор человека, считающего, что вероятность какого-то события составляет 0 %, с человеком, уверенным на 100 % в том, что оно произойдет, – дело бесполезное. Возможно, что именно из-за таких споров и возникало множество конфликтов, таких как религиозные войны в Европе в первые годы после появления печатного пресса.
Но у нас нет оснований предполагать, что все априорные убеждения в равной степени правильны. Однако я склонен считать, что наши убеждения никогда не будут идеально объективны, рациональны или истинны. Вместо этого мы стараемся быть менее субъективными, менее иррациональными и менее неправыми. Создание предсказаний, основанных на наших убеждениях, представляет собой лучший (а возможно, и единственный) способ протестировать самих себя. Если объективность предполагает выявление истины, вне зависимости от наших личных обстоятельств, а предсказание представляет собой лучший способ изучения того, насколько тесно связано наше личное восприятие с великой истиной, то самыми объективными из нас будут считаться те, кто выступает с самыми точными предсказаниями. Статистический метод Фишера, согласно которому объективность была возможна лишь в замкнутых рамках лабораторного эксперимента, пригоден для решения таких задач куда меньше, чем байесовский.
Фактически одно из свойств теоремы Байеса состоит в том, что наши убеждения должны сближаться друг с другом – и приближаться к истине – по мере того, как нам со временем предоставляется все больше свидетельств. На рис. 8.4 я показал в качестве примера, как три инвестора пытаются определить, находятся ли они на «бычьем» или «медвежьем» рынке.
Рис. 8.4. Сближение по методу Байеса
Сначала инвесторы имеют совершенно различные наборы убеждений. Один из них оптимистично настроен и верит, что вероятность того, что рынок «бычий», составляет 90 %. Другой склонен к «медвежьим» настроениям и считает, что шансы «бычьего» рынка равны лишь 10 %. Каждый раз, когда рынок движется вверх, настроение инвесторов становится чуть более «бычьим» по сравнению с априорным, а при каждом движении вниз происходит обратная ситуация. Однако я имитировал такую ситуацию, что, хотя ежедневные колебания и носят случайный характер, в долгосрочной перспективе рынок растет в течение 60 % времени. Несмотря на то что на этой дороге есть свои ухабы, со временем все инвесторы точным образом определяют, что находятся на «бычьем» рынке, с уверенностью почти 100 % (но не с абсолютной).
В теории наука должна работать именно таким образом. Понятие научного консенсуса довольно сложно, однако основная его идея состоит в том, что мнение научного сообщества идет по пути постепенного сближения, двигаясь в сторону истины в процессе обсуждения идей и появления новых свидетельств. Как и на фондовом рынке, эти шаги не всегда направлены вперед или их легко делать. Научное сообщество часто выступает слишком консервативно по вопросу адаптации существующих парадигм к новым свидетельствам{601}, хотя иногда наука и принимает новые данные с поразительной быстротой, напоминая человека, успевающего запрыгнуть в вагон уходящего поезда. Но если предположить, что мы все находимся в одном байесовском поезде[114], то даже неверные убеждения и ошибочные априорные предположения пересматриваются, и мы постепенно движемся в сторону истины.
Например, на наших глазах происходит изменение парадигмы в статистических методах, используемых учеными. Моя критика ошибок статистического подхода Фишера не является чем-то новым или радикальным – аналогичные аргументы уже много лет приводят знаменитые ученые из различных областей знаний, начиная от клинической психологии{602} и заканчивая политологией{603} и экологией{604}. Однако пока что фундаментальных изменений почти не видно.
Тем не менее недавно целый ряд уважаемых статистиков начал утверждать, что фреквентистскую статистику не нужно преподавать студентам младших курсов университетов{605}. В некоторых профессиональных изданиях было официально объявлено об отказе в публикации результатов исследований, основанных на гипотезе Фишера{606}. Фактически, если прочитать все написанное за последние 10 лет, то сложно найти материалы, не защищающие байесовский подход.
Боб также ставит свои деньги на Байеса. Дело не в том, что он буквальным образом применяет теорему Байеса в каждом случае. Однако его практика тестирования статистических данных в контексте гипотез и убеждений, основанная на его знаниях о баскетболе, является в чистом виде байесовской, равно как и его готовность признавать вероятностные ответы на его вопросы.
Для изменения наших учебников и традиций потребуется некоторое время. Однако теорема Байеса утверждает, что мы будет постепенно приближаться к лучшему из возможных исходов. Теорема Байеса предсказывает, что байесовцы одержат победу.
Глава 9
Восстание против машин
Как и многие другие, 27-летний Эдгар Аллан По, был очарован «Механическим турком» (рис. 9.1) – хитроумным изобретением, которому удалось обыграть в шахматы Наполеона Бонапарта и Бенджамина Франклина. Машина, сконструированная в Венгрии в 1770 г., то есть еще до рождения По или Соединенных Штатов Америки, была доставлена в Балтимор и Ричмонд в 1830е гг. после того, как в течение десятилетий собирала огромные аудитории по всей Европе. По предположил, что это – довольно сложный розыгрыш. Он считал, что за винтиками и шестеренками машины скрывался высококлассный шахматист. И именно он управлял рычагами, обеспечивая перемещение фигур по доске и кивок головой куклы в тюрбане каждый раз после того, как она делала шах оппоненту.
Рис. 9.1. Механический турок
По считают создателем детективного жанра{607}, и действительно, в некоторых своих произведениях он очень хорошо вскрывал мистификации. Тот факт, что некий человек (впоследствии оказавшийся немецким гроссмейстером Вильгельмом Шламбергером) всегда находился рядом с машиной при ее распаковке и упаковке, но всегда отсутствовал во время игры, вполне оправданно показался ему подозрительным. («Ага! – подумал По. – Он и сидит в ящике».)
Однако самые интересные и пророческие мысли, изложенные По в эссе о Механическом турке, связаны с его представлением о том, что мы теперь называем «искусственным интеллектом» (сам термин появился только через 120 лет). В эссе выражалась очень глубокая и довольно привычная для наших дней обеспокоенность тем, что «компьютеры» смогут имитировать высшие функции человека или даже превзойти их.
По признавал, насколько впечатляющим был сам факт, что машины вообще могут играть в шахматы. Едва ли кто задумывался о первом механическом компьютере, который Чарльз Бэббидж называл «вычислительной машиной», в то время, когда По делился своими мыслями. Предложенный Бэббиджем компьютер, так и не достроенный при его жизни, мог в лучшем случае рассчитывать значения некоторых элементарных функций типа логарифмических в дополнение к операциям сложения, вычитания, умножения и деления. О работе Бэббиджа По отзывался как о достаточно впечатляющей. Однако в машину вводили предсказуемые значения на входе, затем в ней крутились несколько шестеренок, и машина выдавала предсказуемые значения на выходе. Эта машина не обладала никаким интеллектом – работа, выполняемая ею, была в чистом виде механистической. С другой стороны, компьютер, который мог играть в шахматы, казался почти чудом, поскольку для хорошей игры ему нужно было делать собственные суждения. По заявлял, что если бы машины, играющие в шахматы, действительно существовали, то они должны были бы, по определению, играть безупречно – машины не допускают ошибок при вычислении. Он подчеркивал тот факт, что «Турок» не играл в шахматы идеально – машина выигрывала большинство игр, но иногда проигрывала, – как еще одно доказательство того, что это была не машина, а аппарат, находившийся под контролем человека и обладавший человеческим несовершенством.
Хотя логика По не вполне корректна, подобное почитание машин осталось с нами до сих пор. Мы воспринимаем компьютеры как удивительные изобретения, одно из самых ярких выражений человеческого гения. Согласно опросам, Билла Гейтса считают одним из наиболее уважаемых людей в Америке{608}, а Apple и Google – одними из самых значимых компаний{609}. Мы ожидаем, что компьютер будет вести себя безупречно и изыщет возможность преодолеть человеческие недостатки своих создателей.
Более того, мы считаем расчеты компьютерных программ безукоризненно точными и, возможно, даже пророческими. В 2012 г. двум британским подросткам было предъявлено обвинение в обмане инвесторов на сумму более миллиона долларов – они предлагали легковерным вкладчикам «робота» под названием MARL{610}, занимавшегося подбором акций для инвестирования. По словам подростков, робот мог производить «1 986 832 математических операций в секунду» и при этом не быть подверженным человеческим эмоциям, что якобы позволяло инвесторам удваивать вложенные ими денежные средства каждые несколько часов, следуя рекомендациям MARL, касающимся дешевых акций{611}.
Но даже когда предсказания, выданные компьютерами, не внушают нам доверия, они способны развить в нас страхи. Например, компьютеры, рассчитывающие шансы на выживание пациентов больниц, о которых иногда пишут в новостях{612}, начинают считать собратьями HAL 9000, компьютера из фильма «Космическая одиссея 2001», решившего, что он больше не нуждается в астронавтах, и пытавшегося их удушить, лишив подачи кислорода.
Поскольку мы входим в эру Больших данных, а объемы информации и вычислительной мощности растут в геометрической прогрессии, пришло время выработать более здоровое отношение к компьютерам и к тому, что они могут для нас сделать. Технология имеет свои плюсы, поскольку позволяет нам повысить эффективность работы, но не следует ждать, что машины будут думать за нас.
Рождение шахматного компьютера
Испанский инженер Леонардо Торрес де Киведо в 1912 г. изготовил версию Механического турка, которую назвал El Ajedrecista (шахматист). Хотя El Ajedrecista иногда и называют первым компьютерным игровым компьютером{613}, функциональность этого устройства была очень ограничена, в частности, он мог разыгрывать лишь позиции в эндшпиле, когда на доске оставалось всего три фигуры. (Кроме этого, у El Ajedrecista не было примечательной особенности «Турка» – кукольной головы в тюрбане.)
Отцом современного шахматного компьютера был Клод Шэннон из МТИ, математик, считающийся основоположником теории информации. В 1950 г. Шэннон опубликовал работу под названием «Программирование компьютера для игры в шахматы», где были представлены некоторые алгоритмы и техники, которые легли в основу сегодняшних шахматных программ{614}. Он также признал, что именно шахматы представляют собой столь интересную задачу, решение которой позволит тестировать мощности машин, обрабатывающих информацию.
Шэннон понимал, что игра в шахматы имеет исключительно ясную и понятную цель – мат сопернику. Более того, она следует сравнительно простому набору правил, и в шахматах отсутствует элемент удачи или случайности. И тем не менее, как знают все, кто когда-либо играл в шахматы (лично я не такой уж хороший игрок), даже простые правила по достижнию простой цели еще не означают, что эта задача окажется легкой. Шахматы требуют глубокой концентрации, позволяющей выжить после пары десятков ходов, не говоря уже о том, чтобы выиграть. Шэннон воспринимал шахматы как своего рода лакмусовый тест мощности компьютеров и способностей, которые они могли бы обрести в какой-то момент.
Однако Шэннон, в отличие от своих последователей, не был склонен романтизировать идею о том, что компьютеры могут играть в шахматы так же, как люди. И он не считал неминуемой их победу над людьми на шахматном поле боя.
При этом он отмечал четыре потенциальных преимущества компьютеров, которые:
1) способны очень быстро производить расчеты;
2) не допускают ошибок, если только эти ошибки не зашиты в самой программе;
3) не ленятся и не отказываются от полного анализа происходящего или всех возможных шагов;
4) не будут играть эмоционально и слишком сильно верить в очевидно выигрышное положение, которое может быть упущено, или слишком расстраиваться в сложной ситуации, когда ее еще можно спасти.
По мнению Шэннона, компьютерам противостоят четыре явно выраженных преимущества, которыми обладают только люди, а именно:
1) гибкость и способность переключаться, решая проблему, а не следовать закодированному набору последовательностей;
2) способность к воображению;
3) способность к разумному размышлению;
4) способность обучаться.
Шэннон считал такое противостояние вполне честным. Однако оно обрело более-менее реальную форму лишь в середине 1990х гг., когда российский гроссмейстер Гарри Каспаров – лучший шахматист всех времен – решил выступить против одного из самых передовых компьютеров из когда-либо созданных – компьютера Deep Blue производства IBM.
До начала этого матча люди постоянно выигрывали борьбу, и казалось, что компьютерам их не догнать. Однако постепенно компьютеры взяли верх, и теперь это будет так продолжаться, пока мы живы.
Шахматы, предсказания и эвристика
В соответствии с теоремой Байеса предсказание представляет собой, по сути, тип деятельности по обработке информации: использование новых данных для тестирования гипотез об объективном мире с целью создать более истинные и более точные концепции о нем.
Шахматы можно считать неким аналогом предсказания. Игроки должны обрабатывать информацию о положении 32 фигур на доске и их возможные действия. Они используют эту информацию для разработки стратегий, позволяющих поставить своему оппоненту мат. Эти стратегии, в сущности, представляют собой различные гипотезы о том, как выиграть игру. Можно сказать, что любой человек, выигравший игру, имел лучшую гипотезу.
Шахматы обладают свойством детерминизма – в них отсутствует реальный элемент удачи. Однако теоретически это справедливо и в отношении погоды, как мы видели в главе 4. Наше знание обеих систем несовершенно. Что касается погоды, то в метеорологии значительная часть проблемы связана с тем, что у нас нет полных данных изначальных условий. Даже если мы очень хорошо представляем, по каким правилам работает погодная система, у нас нет полной информации о положении всех молекул, образующих облака, штормы и ураганы. Поэтому лучшее, что мы можем сделать, – это дать вероятностные прогнозы.
В шахматах известны все правила и имеется идеальный набор информации – количество шахматных фигур конечно, и они располагаются на доске в ясной последовательности. Однако игра все равно невероятно сложна для нас. Шахматы способны многое сказать о нашей способности обрабатывать информацию – и продемонстрировать нам некоторые лучшие стратегии принятия решений. Необходимость предсказания появляется не только потому, что мир сам по себе наполнен неопределенностью, но и потому, что его понимание находится за пределами наших способностей{615}.
Поэтому и компьютерные программы, и шахматисты допускают ряд упрощений, чтобы спрогнозировать исход игры. Мы можем называть эти упрощения «моделями», однако при изучении компьютерного программирования и процессов принятия решений чаще используется термин эвристика. Это слово происходит от того же греческого слова, что и слово «эврика»{616}. Эвристический подход к решению проблемы состоит в использовании эмпирических правил в ситуациях, когда детерминистическое решение проблемы находится вне наших практических способностей.
Эвристика – очень полезная вещь, однако она всегда приводит к возникновению искажений и слепых пятен{617}. Например, правило эвристики «Когда вы сталкиваетесь с опасным животным, то убегайте!» часто действительно представляет собой полезное руководство, но не в случаях, когда вы встречаетесь с медведем-гризли; своим движением вы можете привлечь его внимание, а затем он запросто может вас догнать (напротив, служба национальных парков рекомендует вам в случае встречи с медведем-гризли вести себя максимально тихо и спокойно и даже притворяться мертвым, если это необходимо{618}). Люди и компьютеры используют в процессе игры в шахматы разную эвристику. Игра друг против друга в таких случаях обычно сводится к тому, чтобы найти слепые пятна оппонента быстрее, чем он найдет ваши.
Неудачное предсказание Каспарова
В январе 1988 г. Гарри Каспаров, один из самых лучших шахматистов мира с 1986 г. до своего ухода на пенсию в 2005 г.{619}, предсказал, что никакая компьютерная программа не может обыграть человека на уровне гроссмейстера по шахматам по крайней мере до 2000 г.{620}. «Если какому-то гроссмейстеру сложно играть против компьютеров, – заявил он на пресс-конференции в Париже, – я буду счастлив поделиться своим советом»{621}. Но чуть позже в том же году датский гроссмейстер Бент Ларсен потерпел поражение от программы Deep Thought, созданной несколькими выпускниками Университета Карнеги – Меллон в качестве дипломной работы.
Однако Бент Ларсен – далеко не Каспаров, а когда Deep Thought попытался выступить против Каспарова в 1989 г., то потерпел решительное поражение.
Каспаров всегда уважал роль компьютерных технологий в шахматах и уже давно использовал компьютеры для улучшения своей игры. Однако он довольно скромно отозвался о способностях Deep Though и публично высказал надежду, что в один прекрасный день может появиться компьютер, который потребует от него «использовать для победы все 100 % своих способностей»{622}.
Команду программистов во главе с Фэн Сюн Сю и Мюрреем Кэмпбеллом, стоявшую за разработкой Deep Thought, со временем наняла компания IBM, и их система постепенно была преобразована в Deep Blue. Новый Deep Blue победил Каспарова в первой игре матча в Филадельфии в 1996 г., однако Каспаров восстановился и довольно легко выиграл все остальные игры матча. В следующем году, в матче-реванше, проходившем в Нью-Йорке, случилось невероятное: Гарри Каспаров, лучший шахматист в истории, которого боялись все остальные, сам испугался компьютера.
В начале было…
Игра в шахматы, как и все остальное, состоит из трех этапов: начала, середины и конца. Небольшая особенность шахмат заключается в том, что на каждом из этих этапов требуются различные интеллектуальные и эмоциональные навыки, что превращает игру в некий умственный триатлон скорости, силы и выносливости.
В начале шахматной партии центр доски пуст, а пешки, ладьи и слоны аккуратно выстроены в первых двух рядах в ожидании инструкций от своих хозяев. Возможности почти безграничны. Белые могут начать игру 20 различными способами, а черные могут ответить 20 собственными ходами, создавая 4000 возможных вариантов действий уже после первого хода.
После второго хода каждой стороны количество возможных вариантов вырастат до 71 852; после третьего – до 9 132 484. Количество вариантов действий во всей шахматной партии, сыгранной до конца, настолько велико, что даже рассчитать его – немалая проблема, однако некоторые математики оценивают его в 10 10^50 степени. Это – астрономически огромные числа: как писал Диего Расскин-Гутман, «количество возможных вариантов шахматной партии превышает количество атомов во Вселенной»{623}.
Может показаться, что в начале игры, когда все фигуры еще стоят на доске, а количество возможностей безгранично, компьютеры находятся на пике своих величайших возможностей. На сайте IBM перед матчем с Каспаровым было размещено хвастливое утверждение о том, что Depp Blue способен рассчитать 200 млн позиций в секунду.
«А Гарри Каспаров, к сожалению, может рассчитать всего около трех положений в секунду», – ехидно писалось в статье{624}. Были ли у Каспарова хоть какие-то шансы?
Однако шахматным компьютерам многие годы не удавались удачные дебюты. Хотя количество возможностей и максимально, в этот момент цели выглядят наименее ясными. При наличии 10 в 10 10^50 ветвей на дереве игры[115] расчет 3 или 200 млн операций в секунду будет одинаково бесплодным, если только вы не направляете свою силу в одном, четко определенном направлении.
И компьютеры, и люди должны разбить шахматную партию на три промежуточные цели: допустим, захват пешки оппонента или шах королю. В середине игры, когда фигуры начинают прямое противостояние и угрожают друг другу, возникает огромное количество подобных стратегических целей. Достижение их требует разработки определенной тактики, и правильное прогнозирование может оказать самое сильное влияние на оставшуюся часть игры. Цели первых шагов сравнительно абстрактны. Компьютерам приходится сражаться с абстрактными и открытыми проблемами, а люди формулируют эвристические правила, такие как «контроль центра доски» и «сохранение нужной организации пешек», и формулируют неограниченное количество творческих способов по их исполнению.
Более того, поскольку первые ходы более привычны для игроков, чем позиции, с которыми они могут столкнуться позже, люди могут полагаться на многолетний опыт, позволяющий выбрать лучшие ходы. Хотя теоретически белые могут выбрать для начала игры 20 ходов, более чем 98 % серьезных шахматных партий начинаются с одного из четырех лучших{625}.
Проблема людей в том, что компьютерные программы могут систематизировать это знание путем изучения статистики. Шахматные базы данных содержат результаты сотен тысяч партий, и с помощью этих данных вполне можно сделать целый ряд глубоких выводов и прогнозов. Программисты IBM изучали, насколько часто разыгрывалась каждая последовательность первых ходов и насколько сильными были игроки, их разыгрывавшие. Они считали, насколько часто каждая серия шагов приводит к победам, поражениям и ничьим для сторон{626}. Эвристика компьютера, необходимая для анализа этой статистики, позволяла, в принципе, достаточно эффективно противостоять человеческой интуиции и опыту, а то и переигрывать их. «Каспаров играет не против компьютера, а против духов гроссмейстеров прошлого», – говорилось на сайте IBM при описании баз данных Deep Blue{627}.
Таким образом, цель Каспарова в первой из шести игр матча против Deep Blue в 1997 г. состояла в том, чтобы извлечь программу из «страны баз данных» и заставить ее работать в условиях нулевой видимости». Он начал партию с довольно распространенного первого хода, переместив коня на клетку доски, известную игрокам под названием f3. Deep Blue ответил продвижением вперед слона, поставившего коня Каспарова под угрозу, – вне всякого сомнения, потому что его базы данных показали, что этот ход исторически снижал возможность выигрыша белых с 56 до 51 %[116].
Однако эти базы данных строились вокруг предположения о том, что Каспаров должен был ответить на это тем же, что делают почти все другие игроки в такой ситуации{628}, то есть отодвинуть коня назад. Вместо этого он проигнорировал угрозу, посчитал, что Deep Blue блефует{629}, и предпочел двинуть вперед одну из своих пешек, чтобы позволить своему слону контролировать центр доски.
Ход Каспарова, хотя и осмысленный со стратегической точки зрения, позволил добиться и еще одной цели. Он сделал всего три хода, а Deep Blue – всего два, однако позиция, к которой они пришли (рис. 9.2), ранее возникала в профессиональных соревнованиях всего один раз{630} из сотен тысяч игр, имеющихся в базе данных Deep Blue.
Рис. 9.2. Расположение фигур после третьего хода Каспарова в первой партии
Даже когда разыгрываются популярные шахматные ходы, количество возможных ответвлений на дереве настолько велико, что базы данных становятся бесполезными примерно после 10–15 ходов. В любой достаточно длинной шахматной партии со временем вполне может возникнуть ситуации, с которой никогда не сталкивался никто из шахматистов в истории человечества. Однако Каспаров смог «отключить» базу данных после всего лишь трех ходов. Как мы постоянно видим в этой книге, исключительно статистические подходы к прогнозированию оказываются в лучшем случае неэффективными при отсутствии достаточной выборки данных для работы. Deep Blue пришлось «думать» за себя.
Дилемма шахматиста: ширина против глубины
Середина шахматной партии (обычно называемая миттельшпиль) потенциально позволяет использовать сильные стороны компьютера. Когда у фигур есть возможность сдвинуться в центр доски, то в среднем существует около 40 возможных ходов вместо 20{631}. Это может показаться не особенно большой разницей, однако из-за того, что древо возможностей разрастается в геометрической прогрессии, количество возможных вариантов ходов быстро увеличивается. Предположим, например, что вы хотите рассчитать всего три следующих хода (точнее, по три хода ваших и вашего противника, то есть всего шесть ходов). В начале партии значение этой функции рассчитывается примерно как 20 в шестой степени – то есть существует 64 млн позиций, и это уже гигантское число. Однако в середине игры вам уже нужно рассчитать 40 в 50й степени комбинаций, или 4,1 млрд возможностей. Deep Blue мог бы рассчитать все эти положения всего за 20 секунд. А Каспарову для этого потребовалось бы буквально 43 года, даже без перерывов на еду, сон или туалет.
Великие игроки типа Каспарова не обманывают себя и не верят в то, что им под силу рассчитать все эти варианты. Именно это и отличает лучших игроков от любителей. В своем знаменитом исследовании шахматистов голландский психолог Адриаан де Гроот обнаружил, что любители при столкновении с шахматной проблемой часто начинают напряженно искать идеальный ход и в итоге не могут сделать ни одного{632}.
Мастера игры в шахматы, напротив, ищут хороший ход – и, по возможности, лучший ход в любой позиции, – однако они скорее прогнозируют, как этот ход изменит их положение, а не пытаются оценить любую возможность. Было бы «чистой фантазией», писал американский гроссмейстер Рейбен Файн{633}, предполагать, что люди-шахматисты заранее рассчитывают каждую позицию перед тем, как сделать 20 или 30 шагов.
Но сказать, что «идеальное – враг хорошего», просто. Если вы хотите серьезно освоить такой вид искусства как шахматы, то порой вам нужно шагнуть за пределы простой эвристики. Тем не менее мы все равно неспособны создавать идеальные решения, когда нам поступает больше информации, чем м можем обработать в ограниченный промежуток времени. Признавая свое несовершенство, мы обретаем свободу, что позволяет нам находить лучшие решения и в шахматах, и в других областях, вовлекающих прогнозирование.
Я не хочу сказать, что таким гроссмейстерам, как Каспаров, не нужно ничего рассчитывать. Как минимум Каспаров должен разработать тактику, точную последовательность трех-пяти ходов для захвата фигуры соперника или достижения другой краткосрочной цели. Для каждого из этих ходов он должен продумать возможную реакцию оппонента – все возможные вариации – и оценить, способен ли какой-нибудь из ходов оппонента свести его тактику на нет. Также ему нужно удостовериться в том, что соперник не устроил ему никаких ловушек; если король игрока не защищен, то самая сильная позиция может привести к мату буквально за несколько ходов.
Для того чтобы научиться, на чем именно стоит сосредоточиться во время игры, необходимы и память, и опыт. Иногда для этого требуется пройти по многим ветвям дерева, но лишь на пару ходов вглубь; в других случаях шахматисты концентрируются лишь на одной ветке, но производят более глубокие расчеты. Такой тип компромисса между шириной и глубиной возникает каждый раз, когда мы сталкиваемся со сложной проблемой. Например, Министерство обороны США и ЦРУ должны решить, отслеживать ли им широкий спектр сигналов для предсказания и предотвращения возможных террористических атак или сконцентрироваться на том, что они считают наиболее вероятной угрозой. Лучшим мировым шахматистам отлично удается метапознание – осознание того, как они мыслят, – и способность откорректировать этот процесс, когда им кажется, что в их мышлении нарушен баланс.
Стратегия против тактики
До некоторой степени шахматные компьютеры развиваются в двух направлениях. Они используют эвристику для того, чтобы «обрезать» свои деревья поиска, направляя свою вычислительную мощность на самые многообещающие ветви, а не просчитывая каждую с одинаковой степенью глубины. Однако поскольку скорость обработки информации у них высока, им не нужно идти на серьезные компромиссы – они могут понемногу оценивать каждую возможность и изучать в деталях те из них, которые кажутся самыми важными.
Однако компьютерные шахматные программы не всегда могут увидеть общую картину и думать стратегически. Они хороши для расчета тактики достижения какой-то ближайшей цели, однако значительно менее успешны в определении самой значимой из них в более масштабной схеме игры.
Каспаров попытался воспользоваться слепыми пятнами в эвристике Deep Blue, вынуждая его бездумно следовать планам, которые не улучшают стратегическую позицию.
Компьютерные шахматные программы часто предпочитают краткосрочные цели, которые могут быть разделены и квантованы и для достижения которых не требуется анализировать шахматную доску как целостный организм. Классический пример искажения в работе компьютера – это его готовность принять жертвы; компьютер часто соглашается, когда хороший игрок предлагает обменять более сильную фигуру на более слабую.
Эвристическое правило «Принимать обмен, когда противник отказывается от более сильной фигуры» обычно оказывается правильным – но не всегда в случаях, когда вам противостоит игрок вроде Каспарова, готовый сознательно ослабить свою позицию. Он знает, что тактическая потеря перевешивается стратегическим преимуществом. В ходе первой игры Каспаров предложил Deep Blue на 30м ходу обменять ладью на слона, и, к его радости, Blue согласился[117]. Возникла позиция (рис. 9.3а), которая помогает проиллюстрировать идею слепых пятен, появляющихся вследствие отсутствия у компьютера стратегического мышления.
Рис. 9.3а. Расположение фигур после 32-го хода Каспарова в первой партии
У Каспарова и Deep Blue были свои способы упростить позицию, показанную на рис. 9.3a. Компьютер разбивал сложную проблему на отдельные элементы. Например, для Deep Blue позиция могла напоминать ситуацию, представленную на рис. 9.3б, при которой каждой фигуре присваивалось определенное значение в баллах. Если вы сложите баллы, то увидите, что Deep Blue имел преимущество над Каспаровым, эквивалентное одной пешке, что в большинстве случаев приводит к победе или ничьей{634}.
Рис. 9.3б. Поэлементная оценка позиции
Рис. 9.3 в. Целостная оценка позиции
Люди же способны в большей степени концентрироваться на самых важных элементах и видеть стратегическое целое, которое иногда представляет собой нечто большее, чем сумма частей. Для Каспарова позиция ассоциировалась с ситуацией, которая показана на рис. 9.3в, и казалась ему достаточно хорошей. Каспаров видит, что три его пешки продвигаются в направлении к недостаточно защищенному королю Deep Blue.
Королю придется уйти со своего места – и в этом случае Каспаров сможет продвинуть свои пешки до последнего ряда обороны Deep Blue и превратить их в ферзей[118] – или оказаться под угрозой мата. Кроме этого, ферзь и слон Каспарова, хотя и находятся в левом нижнем углу доски, способны практически беспрепятственно перемещаться по диагонали; тем самым они могут усилить натиск своих пешек на уязвимого короля. Каспаров пока что еще не знает, как именно будет поставлен мат королю Deep Blue, однако понимает, что при таком давлении шансы оказываются на его стороне. Сила позиции Каспарова скоро стала понятна и Deep Blue, который через 13 ходов признал свое поражение.
«В этом и заключается типичная слабость компьютера, – позднее сказал Каспаров. – Я уверен, что ему очень нравилась позиция, однако последствия были слишком глубоки для того, чтобы он мог правильно все оценить»{635}.
«Человек переиграл компьютер», – гласил заголовок статьи в New York Times{636}. На следующий день после игры газета опубликовала целых четыре статьи, посвященных ей. Однако в конце игры произошел определенный поворот, который остался без внимания комментаторов, но впоследствии изменил всю историю шахмат.
Начало конца
В финале шахматной партии, эндшпиле, количество фигур на доске значительно меньше, чем в начале, и удачные комбинации рассчитываются без особых усилий. Тем не менее на этой фазе партии необходима особая точность, поскольку реализация выигрышного положения часто требует безошибочного проведения десятков ходов. Например, в позиции, которую вы видите на рис. 9.4, белые выиграют вне зависимости от действий черных, однако для этого белые должны безукоризненно сделать 262 последовательных хода[119].
Человек почти гарантированно не сможет найти выход в ситуации, показанной на рис. 9.4. Однако у людей имеется немалая практика в управлении эндшпилями, когда для завершения партии требуется 10, 15, 20 или 25 ходов.
Рис. 9.4. Победа белых… после 262 ходов
Эндшпиль может считаться одновременно и благом, и проклятием для компьютеров. На этой стадии игры у них остается немного промежуточных тактических целей, однако компьютер может иногда не «увидеть леса за деревьями». С другой стороны, у шахматных компьютеров есть базы данных не только для дебюта партии, но и для эндшпиля. Решения имеются практически для всех позиций, в которых на доске остается шесть или меньше фигур. Почти завершена работа с позициями из семи фигур – причем некоторые решения достаточно сложны и требуют не меньше 517 ходов – однако компьютеры уже сейчас хорошо помнят, какие шаги можно считать выигрышными, проигрышными или ведущими к ничьей.
Соответственно, на этой стадии игры возникает нечто, напоминающее черную дыру – точку, преодоление которой неотвратимо перевешивает дерево игры. Тогда компьютер осмысливает все позиции, то могут быть осмыслены, и выигрывает те из них, которые должен выиграть. Абстрактные цели этой завершающей фазы шахматной партии заменяются набором конкретных: королевская пешка должна оказаться здесь, и тогда вы точно выиграете; убедите черных переместить свою ладью вот сюда, и вы добьетесь ничьей.
Поэтому у Deep Blue имелись определенные стимулы продолжать борьбу с Каспаровым в первой игре. Хотя программа и говорила ему, что эта позиция проигрышная, но даже великие игроки типа Каспарова совершают серьезные промахи примерно один раз за 75 ходов{637}. Одного неверного шага Каспарова было бы достаточно, чтобы активировать сенсоры Deep Blue и обеспечить ничейную позицию. Ситуация для компьютера была отчаянной, но не полностью безнадежной.
Однако вместо этого Deep Blue сделал кое-что странное, по крайней мере с точки зрения Каспарова. На своем 44м ходу Deep Blue переместил одну из своих ладей в первый ряд белых вместо более удобного хода, при котором королю Каспарова был бы поставлен шах. Ход, сделанный компьютером, казался совершенно бессмысленным. В момент, когда ему со всех сторон угрожали, компьютер, по сути, пропустил ход, что позволило Каспарову продвинуть вперед одну из своих пешек во второй ряд черных, где у нее значительно выросли шансы превратиться в ферзя. Еще более странным было то, что Deep Blue сдался уже на следующем ходу (рис. 9.5).
Рис. 9.5. Странный ход Deep Blue
«О чем думает компьютер?» – удивился Каспаров. Он привык, что Deep Blue допускает стратегические ошибки – например, он может принять обмен слон – ладья – в сложных позициях, где он просто не может думать достаточно глубоко, чтобы оценить все последствия. Однако это было нечто иное, чем тактическая ошибка в сравнительно простой позиции, то есть именно та ошибка, которую компьютеры не делают.
«Неужели компьютер может покончить с собой таким образом?» – спросил Каспаров Фредерика Фриделя, немецкого шахматного журналиста, а также своего друга и специалиста по вычислительной технике, когда они в гостинице «Плаза» анализировали, как проходила партия, после ее окончания{638}. Никакие объяснения произошедшего особенно не порадовали Каспарова.
Возможно, Deep Blue действительно «покончил с собой», поняв, что проиграет в любом случае, и не пожелал показать Каспарову, как он мог бы играть дальше? А возможно, это стало частью более замысловатой игры? Возможно, был запрограммирован отвлекающий маневр, нацеленный на то, чтобы Каспаров слишком переоценил свои эвристические способности после победы в первой партии?
Каспаров сделал то, что было для него наиболее естественно: погрузился в данные. С помощью Фриделя и компьютерной программы Fritz он выяснил, что стандартный розыгрыш позиции – перемещение черными ладьи и шах королю белых – был совершенно невыгоден для Deep Blue: он приводил к неминуемому мату, хотя для этого Каспарову пришлось бы сделать более 20 ходов.
Однако это и пугало больше всего. Каспаров предположил, что единственный способ противостоять его натиску состоял для компьютера в том, чтобы заставить его сделать мат не в 20 ходов, а за значительно большее их количество. И было похоже, что он нашел решение. Как вспоминал Фридель, Deep Blue смог рассчитать позицию до конца и просто предпочел более простой вариант завершения партии. «Возможно, он увидел мат через 20 и более ходов», – добавил Гарри, искренне довольный тем, что в результате своих расчетов пришел к правильному выводу{639}.
Однако до этого считалось, что просчитать 20 ходов вперед в такой сложной игре, как шахматы, невозможно как для людей, так и для компьютеров. По словам самого Каспарова, он искренне гордился тем, как во время одного матча в Нидерландах в 1999 г. он смог представить себе выигрышную позицию за 15 ходов{640}.
Считалось, что Deep Blue в большинстве случаев ограничивается расчетом шесть-восемь будущих ходов. Каспаров и Фридель не были полностью уверены в том, что именно происходит, однако то, что казалось сторонним наблюдателям случайной и необъяснимой ошибкой, содержало в себе, судя по всему, огромную мудрость. И после этого Каспарову уже не удалось ни разу обыграть Deep Blue.
Эдгар Аллан Каспаров
Во второй партии компьютер играл более агрессивно, не позволяя Каспарову занять выгодную позицию. Самый главный момент наступил где-то после 35-го хода. Силы сторон были примерно равны: у каждого игрока оставались ферзь, по одному слону, по две ладьи и по семь пешек. Однако Deep Blue, игравший белыми, обладал преимуществом следующего хода, а у его ферзя было много места для маневра. Положение (рис. 9.6) было не особенно угрожающим для Каспарова, однако существовала угроза угрозы – уже через несколько ходов могло проясниться, есть ли у Deep Blue шанс выиграть или же игра неминуемо движется к ничьей.
Рис. 9.6. Варианты действий Deep Blue на 36м ходу второй партии
Deep Blue нужно было поразмышлять над парой ходов. Он мог переместить ферзя на более угрожающую позицию; и это было бы хорошо с точки зрения тактики. Он мог обменяться пешками с белыми, открывая левый угол доски, что привело бы к созданию более открытой, элегантной и стратегически интересной позиции.
Гроссмейстеры, комментировавшие матч, ожидали, что Deep Blue воспользуется первым вариантом и продвинет вперед ферзя{641}. Этот ход казался довольно очевидным и более соответствовавшим характеру игры Deep Blue – компьютеры предпочитают сложные и требующие множества расчетов позиции. Однако после необычайно долгого «размышления» Deep Blue предпочел обмен пешками{642}.
Каспаров тут же расслабился, поскольку размен пешек делал его позицию менее напряженной. Однако чем больше он оценивал происходившее, тем меньше оно ему нравилось. Он кусал кулаки и отчаянно хватался за голову; одному из зрителей даже показалось, что в какой-то момент Каспаров заплакал{643}. Почему же Deep Blue решил не двигать своего ферзя вперед? Этот ход вряд ли можно ли считать слабым: на самом деле, его вполне мог бы совершить кто-то из соперников Каспарова из плоти и крови, таких как Анатолий Карпов.
Однако подобный ход компьютера должен был быть обусловлен тактическими «соображениями». Каспаров никак не мог понять, в чем они состояли, – если только его подозрения не оказались верными и Deep Blue не был способен предсказать 20 и более следующих ходов.
Каспаров и Deep Blue сделали еще восемь ходов. Для репортеров и экспертов, наблюдавших за игрой, стало очевидно, что у Каспарова, игравшего в обороне с самого начала, нет никаких шансов на выигрыш. Однако он все же мог бы свести игру к ничьей. Тем не менее, к немалому удивлению публики, Каспаров сдался после 45-го хода. Он решил, что компьютер не может допустить ошибку в расчетах, если он способен просчитать ситуацию на 20 ходов вперед. Он знал, что Deep Blue выиграет, – так зачем тратить энергию, когда впереди оставалось еще четыре партии?
Публика в аудитории разразилась аплодисментами{644}. Эта игра была хорошо сыграна, гораздо лучше первой. И даже если собравшимся мат, который поставил Deep Blue, казался не столь очевидным, как Каспарову, они не могли просчитать ситуацию так же глубоко, как он. Однако основные симпатии в этот раз были на стороне Deep Blue – компьютер играл как человек.
«Отличный стиль! – воскликнула чемпионка мира среди женщин Сьюзен Полгар в беседе с журналистом New York Times{645}. – Компьютер играл в стиле чемпиона типа Карпова». С ней согласился Джоэль Бенджамин, гроссмейстер, помогавший команде Dep Blue: «Это была не игра в компьютерном стиле, а настоящие шахматы!»
Каспаров быстро покинул зал, не вступая в беседу с журналистами, однако принял комментарии своих коллег-гроссмейстеров близко к сердцу.
Возможно, Deep Blue был человеком в буквальном, а не в экзистенциальном смысле. Не исключено, что, как и в случае с «Механическим турком» двумя столетиями ранее, какой-то гроссмейстер, находившийся «за сценой», тайно контролировал происходившее. Возможно, Бенджамин, сильный игрок, когда-то сыгравший вничью с Каспаровым, не просто регулировал работу Deep Blue, но и фактически вмешивался от имени компьютера в ход игры.
Столь мощные умы, какими обладают шахматные чемпионы, заточены на выявление закономерностей, и их иногда считают немного параноидальными. В ходе пресс-конференции на следующий день Каспаров обвинил IBM в обмане. Об игре компьютера он выразился словами «Марадона называл это рукой Господа»{646}, намекая на гол, который забил великий аргентинский футболист Диего Марадона в печально известном матче на Кубок мира 1986 г. с командой Англии. Запись показала, что он направил мяч в сетку ворот не головой, а левой рукой.
Марадона заявил, что он забил гол «un poco con la cabeza de Maradona y otro poco con la mano de Dios» – то есть немного воспользовался своей головой и немного – рукой Бога. Каспаров же считал, что параноидальность в поведение Deep Blue была внесена чужим интеллектом.