Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет Сильвер Нейт
В июле, через два месяца после отчета Лоу, Педройя вошел в состав «Звездной команды» Американской лиги. В октябре он помог Red Sox стать победителями ежегодного чемпионата – World Series[36] – во второй раз с 1918 г. В ноябре того же года он был назван «Новичком года». А в следующем сезоне 24-летний Педройя получил награду «Самый ценный игрок» как лучший в Американской лиге. Теперь он уже был не запасным игроком, а суперзвездой. Скауты серьезно его недооценили.
Я отправился в Фенвей, поскольку хотел понять, что же заставило Педройю так измениться. Я подготовил целый список вопросов, а Red Sox выдала мне пресс-карту и обеспечила доступ на поле. Я знал, что это будет непросто. Игровое поле основной лиги – это настоящее святилище для игроков и уж точно не лучшее место для проведения интервью. Игроки Red Sox после неудачных игр были напряженными и раздраженными.
Я стал наблюдать за тренировавшимся на поле Педройей. Он ловил мячи Кевина Юкилиса, неповоротливого игрока третьей базы, и перебрасывал их новому подающему – игроку первой базы Кейси Кочману. Мне стало ясно, что в нем что-то изменилось. Движения Педройи были точными, в отличие от Юкилиса и Кочмана, внимание которых казалось рассеянным. Но главное отличие проявлялось в его отношении к происходившему – Педройя раздраженно бросал мяч по всему внутреннему полю и выглядел недовольным отсутствием сосредоточенности на игре у своих товарищей по команде.
Прошло примерно 15 минут, тренировка закончилась, и Red Sox уступила внутреннее поле своим соперникам – команде Toronto Blue Jays. Я стоял около первой базы, в паре метров от дагаут[37] Red Sox, и Педройя проел прямо мимо меня. Скауты были правы, когда говорили о его осанке. Официальный рост Педройи – около 178 сантиметров (примерно, как и мой), однако он казался на несколько сантиметров ниже. Скауты были правы, и когда отмечали его совершенно не атлетическое сложение. В свои 25 лет Педройя уже начал заметно лысеть, и на его груди было практически столько же волос, что и на голове, а из-под майки выступало заметное брюшко. Встретив его на улице, вы могли бы принять его за сотрудника видеопроката.
Педройя прошел в дагаут и сел там на скамейку в одиночестве. Это показалось мне идеальным моментом, чтобы начать разговор, поэтому я собрался с силами и подошел:
«Привет, Дастин, у вас найдется минутка?»
Педройя подозрительно смотрел на меня в течение пары секунд, а затем заявил – максимально снисходительно и выделяя каждое слово: «Нет. Не найдется. Я готовлюсь к серьезной игре».
Я несколько минут побродил по полю, пытаясь утешить оскорбленное самолюбие, а затем направился в ложу для прессы, чтобы понаблюдать за игрой.
На следующий день, после того как действие моих «верительных грамот» истекло, я вернулся в Нью-Йорк и отправил своего друга Дэвида Лаурилу, моего бывшего коллегу по Baseball Prospectus и опытного интервьюера, с разведывательной миссией. Я хотел понять, сможем ли мы вытащить из Педройи что-нибудь полезное. Педройя был не особенно разговорчив, однако подарил Лаурилу отличную фразу для цитирования. «Знаете что? Меня нисколько не беспокоят цифры и статистика, – заметил он в беседе с Лаурилой. – Все, что меня интересует, – это победы и поражения. Все остальное не важно».
Педройя научился использовать в разговоре подобные клише после того, как когда-то решил отойти от политики, чем и вызвал немалые проблемы на свою голову. Это произошло, когда он назвал свой родной город Вудленд, штат Калифорния, «свалкой»{196}. «Можете так и написать, – сказал Педройя репортеру журнала Boston. – Мне это по фигу».
Ему было по фигу. Я понял, что если бы Педройя относился к жизни как-то иначе, то стал бы думать о том, что напишут о нем скауты в своих отчетах, и никогда не смог бы пробиться в основную лигу.
Создание системы прогнозирования для бейсбола
Сколько я себя помню, я всегда был фанатом бейсбола и бейсбольной статистики. Когда мне было шесть лет, команда из моего города – Detroit Tigers – выиграла World Series в 1984 г. Будучи маленьким математическим вундеркиндом, я очень интересовался цифрами, связанными с игрой. В семилетнем возрасте я купил свою первую бейсбольную карточку, в 10 – прочитал первый выпуск Elias Baseball Analyst, а в 12 лет начал создавать свои собственные статистические таблицы (довольно странные – по моим данным выходило, что не полностью проявивший себя игрок Red Sox Тим Найринг был чуть ли не лучшим по итогам нескольких игр).
Мой интерес достиг своего пика в 2002 г. В это время Майкл Льюис напряженно работал над книгой «Moneyball», которой было суждено вскоре стать национальным бестселлером. В этой книге приводилась хроника жизни команды Oakland Athletics и рассказывалось о ее умеющим использовать статистические данные менеджере Билли Бине.
Примерно в то же время на должность консультанта Red Sox был приглашен Билл Джеймс, который 25 годами ранее открыл эру «Sabermetric»[38], начав публиковать альманах под названием «Bill James Baseball Abstract». Нездоровая одержимость бейсбольной статистикой внезапно оказалась чем-то большим, чем простое хобби, – и как только я это понял, то сразу же принялся искать новую работу.
В течение двух лет после окончания колледжа я жил в Чикаго и работал консультантом по трансфертному ценообразованию в бухгалтерской компании KPMG. Работа довольно неплохая. Мои начальники и коллеги оказались дружелюбными и профессиональными, зарплата вполне достойной, и я чувствовал себя в безопасности.
Однако мое личное представление о по-настоящему вдохновляющей работе заключалось отнюдь не в том, чтобы рассказывать клиентам, как устанавливать цены на фабрике по производству телефонов в Малайзии, чтобы снизить размер налогов, или отправляться в шесть часов утра на самолет в Сен-Луи, чтобы оценить качество контрактов, использовавшихся в работе горнодобывающей компанией.
В этой работе было слишком мало риска, она оказалась чересчур разумной и рутинной для неугомонного 24-летнего человека, и мне стало скучно как никогда. Однако одно из ее преимуществ состояло в том, что у меня оставалась куча свободного времени. Поэтому в свое свободное время я начал создавать разноцветную таблицу, заполняя ее бейсбольной статистикой. Впоследствии именно она легла в основу PECOTA.
Во время учебы в колледже я также начал читать ежегодник «Baseball Prospectus», основанный в 1996 г. Гэри Хакебеем. Этот рыжий человек с неимоверными запасами энергии и сарказма пригласил на работу команду авторов новостной группы newsgroup rec.sport.baseball (бывшей в первые годы интернета авангардом статистического анализа спорта). Хакебей почуял возможность, которую предоставлял в то время рынок: Билл Джеймс перестал публиковать свои Abstracts в 1988 г., а большинство продуктов, призванных его заменить, либо были недостаточно хороши, либо прекратили свое существование во время длительных забастовок бейсболистов в 1994–1995 гг. Первый выпуск «Baseball Prospectus», опубликованный в 1996 г., распечатывался на лазерном принтере, из него по ошибке исчезла вся информация о клубе St. Louis Cardinals, и продано было всего 75 экземпляров. Однако у «Baseball Prospectus» быстро появились свои поклонники, а продажи начали расти в геометрической прогрессии практически каждый год.
«Baseball Prospectus» был настоящей сладостной мечтой любого фаната статистики. В нем собиралось неимоверное количество цифр, не только по игрокам основной лиги, но и по потенциальным игрокам, игравшим во второстепенных командах.
Тексты в бюллетене порой носили эзотерический характер, там часто упоминались герои мультсериала «Симпсоны», допускались шутки о полузабытых порнофильмах 1980х гг. и даже саркастические оценки нелюбимых издателем менеджеров различных команд.
Однако самыми важными публикациями этого издания были предсказания о том, как будет играть каждый игрок в следующем сезоне. Для этого Хакебей использовал созданную им самим систему под названием Vladimir. Казалось, что она будет следующим шагом в начатой Джеймсом революции.
Хорошая система бейсбольных прогнозов должна выполнять три основные задачи.
1. Принимать во внимание текущий статус статистики игрока.
2. Разделять навыки и удачу.
3. Понимать, каким образом изменяется результативность игрока по мере его взросления – эта закономерность известна под названием кривой старения.
Первая задача сравнительно проста. Бейсбольные соревнования, наиболее уникальные из основных американских видов спорта, всегда проводились на полях с нестандартными размерами. Среднему игроку значительно проще показывать хорошие результаты в уютном квадратном Фенвей-парке (контуры которого заданы компактными улицами Новой Англии), чем на напоминающем пещеру стадионе «Доджер», окруженном огромными парковками. Наблюдая за тем, как ведут себя игроки при игре дома и в гостях, мы можем рассчитать так называемый фактор парка, позволяющий учитывать степень сложности, с которой сталкивается игрок. Например, Фред Линн, основной игрок Red Sox в 1970е гг., добивался результата 0,347 во время игр в Фенвей-парке, но его результат на любом другом стадионе был равен лишь 0,264. Аналогичным образом, наблюдая за результатами игроков после перехода из Национальной лиги в Американскую лигу, мы можем довольно четко сказать, какая лига лучше, и оценить силу конкурентной позиции игрока.
Самый масштабный набор данных в мире
Решить вторую задачу – то есть разделить навыки и удачу – намного сложнее. Бейсбол выстроен таким образом, что в краткосрочной перспективе удача играет большую роль – дае лучшие команды проигрывают до трети матчей, и даже лучшие подающие не могут добраться до базы каждые три раза из пяти. Иногда удача не позволяет распознать подлинный уровень навыков игрока даже за целый год. Во время любого сезона бьющий, объективный результат которого 0,275, с вероятностью 10 % может добиться результата 0,300 и, соответственно, с той же вероятностью иметь результат 0,250. И это зависит только от одной лишь удачи{197}.
Хорошо продуманная система прогнозирования может оценить, какие статистические показатели сильнее зависят от удачи. Например, среднее количество попаданий битой по мячу более подвержено влиянию ошибок, чем количество хоумранов. Это особенно важно для питчеров[39], статистика которых невероятно непоследовательна. Если вы хотите предсказать, насколько успешной будет игра питчера, то вам стоит смотреть на количество страйкаутов[40] и уолков[41], а не на данные о его выигрышах и проигрышах в предыдущем сезоне, поскольку первый набор статистических данных выглядит более последовательным от года к году.
Как и при разработке любого прогноза, цель в данном случае состоит в выявлении основополагающей причины – выбивание в аут не позволяет отбивающим игрокам команды соперника добраться до базы, что, в свою очередь, не дает им получить дополнительные очки, а значит – и выиграть матч. Однако чем глубже вы копаете, тем больше шума окажется в системе: результаты питчера определяются не только качеством его ударов, но и факторами, которые он не в состоянии контролировать. Так, отличный питчер команды Seattle Mariners Феликс Эрнандес имел по итогам 2009 г. показатель выигрышей и поражений на уровне 19:5, а в 2010 г. этот показатель был 13:12 – и не потому, что Эрнандес плохо делал свою работу, а потому, что у Mariners’ в 2010 г. был на редкость неудачный состав подающих.
Подобные случаи происходят довольно часто, и если вы уделите изучению данных достаточно времени, то сможете найти их и сами. Пожалуй, именно бейсбол предлагает самый объемный массив данных в мире – практически все, происходившее на игровых полях основной лиги в течение последних 140 лет, скрупулезно и точно записывалось, а в крупных лигах играют сотни спортсменов. При этом, хотя бейсбол и считается командной игрой, матч строится в соответствии с четкой процедурой: питчеры по очереди сменяют друг друга, подающие «выходят к бите» один за другим. Поэтому игроки в значительной степени сами несут ответственность за свою личную статистику[42]. В игре возникает сравнительно немного проблем, связанных с чем-то комплексным и нелинейным. В ней просто выявить причинно-следственные связи.
Это значительно упрощает жизнь человеку, занимающемуся прогнозами в мире бейсбола. Гипотезы обычно можно проверить эмпирическим путем, что позволяет подтвердить или опровергнуть их с высокой степенью статистической достоверности. Что же касается прогнозирования в таких областях, как экономика или политика, где данные появляются значительно реже, – президентские выборы происходят один раз в четыре года, и нет возможности получать сотни новых данных ежегодно – вы не можете похвастаться столь же высокой степенью точности, и ваши прогнозы могут оказаться неверными значительно чаще.
Берегитесь – кривая старения!
Однако все, о чем шла речь выше, основывалось на предположении, что способности игрока не меняются год от года – и если бы мы только могли отделить сигнал от шума, то узнали бы все, что нам нужно. Но в реальной жизни навыки бейсболиста постоянно изменяются, и в этом кроется немалая проблема.
Изучив статистику по нескольким тысячам игроков, Джеймс обнаружил, что игра типичного из них{198} год от года совершенствуется до тех пор, пока его возраст не приблизится к отметке примерно в 30 лет, а начиная примерно с этого возраста навыки обычно начинают атрофироваться, что особенно заметно проявляется примерно к 35 годам{199}. И этот факт позволил Джеймсу сделать одно из самых значительных своих открытий – выявить кривую старения.
Гимнастки-олимпийки достигают пика своей карьеры в подростковом возрасте, поэты – после 30 лет; шахматисты – после 30{200}; экономисты – после 40{201}, а средний возраст CEO компаний из списка Fortune 500 равен 55 годам{202}. Игрок в бейсбол, как обнаружил Джеймс, достигает своего спортивного пика в возрасте 27 лет. У 60 % игроков из списка, включающего 50 самых известных бейсболистов, отмеченных наградами в период между 1985 и 2009 гг., возраст колебался в интервале между 25 и 29 годами, а возраст 20 % из них составлял ровно 27 лет. Именно в этом возрасте, судя по всему, возникает идеальное соотношение между физической и умственной формой, необходимой для игры (рис. 3.1).
Рис. 3.1. Кривая старения для подающего
Осознание этого факта – существование кривой старения – могло бы стать невероятно ценным для любой команды, ознакомившейся с работой Джеймса. В соответствии с принятыми правилами бейсболист не может стать профессиональным игроком, не связанным контрактом, до достаточно поздних этапов своей карьеры. Он получает право на этот статус, отыграв не менее шести полных сезонов в основной лиге (до этого момента он находится под полным контролем своего первого клуба и не может требовать у него полной оплаты по рыночным ставкам).
Поскольку типичный новичок оказывается в крупных лигах в возрасте 23 или 24 лет, он не может стать свободным игроком до 30-летнего возраста – то есть до того периода, когда пик его результативности уже минует. Команды платили многим профессиональным игрокам большие суммы в расчете на то, что они смогут оставаться столь же производительными, что и в возрасте до 30 лет; в реальности же их результаты обычно ухудшались, а поскольку контракты в главной бейсбольной лиге имеют определенные гарантии, у команды были связаны руки.
Однако кривая старения Джеймса рисовала слишком гладкую картину. Разумеется, средний игрок достигает пика в возрасте 27 лет. Но, как скажет вам любой человек, внимательно изучавший в детстве обратные стороны бейсбольных карточек, игроки стареют с разной скоростью. Боб Хорнер, третий бейсмен команды Atlanta Braves в 1980е гг., получил награду «Новичок года» в возрасте 20 лет и вошел в команду «Всех звезд», когда ему было 24 года; в то время многие считали, что он точно попадет в Зал бейсбольной славы. Однако к 30 годам, вследствие череды травм и неудачного перехода в команду Yakult Swallows японской лиги, он полностью покинул мир профессионального бейсбола. С другой стороны, великий Эдгар Мартинез из Seattle Mariners не имел постоянного контракта в крупных лигах до 27 лет. Однако ему все равно удалось пережить период расцвета своей спортивной карьеры, хотя и достаточно поздно – после 30 лет: и даже в 40 лет он возглавлял список лиги по количеству RBI[43].
Хотя случаи с Хорнером и Мартинезом и могут считаться исключением из правила, крайне редко уровень игры других бейсболистов изменяется в точном соответствии с гладкой траекторией кривой старения; скорее, нормой для них оказывается периодически нарушаемое равновесие взлетов и падений.
Реальные кривые старения наполнены шумом – причем значительным (рис. 3.2). В среднем они могут выглядеть довольно гладкими. Однако среднее подобно семье, имеющей 1,7 ребенка, – это всего лишь статистическая абстракция. Возможно, полагал Гэри Хакебей, в шуме есть сигнал, который не учитывала кривая Джеймса. Возможно, у игроков на сложных с точки зрения физических сил позициях навыки пропадают быстрее, чем у других. А возможно, карьера игроков, оладающих более атлетическим сложением, продолжительнее, чем у игроков, имеющих лишь один-два сильно развитых навыка.
Рис. 3.2. Вид кривых старения, на которых отражаются шумы, для различных подающих
На основе системы Хакебея была выдвинута гипотеза, согласно которой имеется 26 различных видов кривых старения, причем каждый из них применим к разным типам игроков{203}. Если Хакебей был прав, то появлялась возможность оценить, какая кривая в большей степени подходит для каждого игрока, и тем самым предсказать, как будет развиваться его карьера. Если кривая старения игрока была похожа на соответствующую кривую Боба Хорнера, то можно было бы ожидать, что пик его карьеры придется на более ранний возраст, а затем наступит раннее угасание. Если же его кривая больше напоминала кривую Мартинеза, то лучшие сезоны этого бейсболиста наступят в более зрелом возрасте.
Хотя системе Vladimir Хакебея и удалось сделать ряд правильных прогнозов, в целом она все же была ненамного более точной, чем медленные и устойчивые прогнозы Джеймса{204}, согласно которым одна и та же кривая старения применялась к каждому игроку. Отчасти проблема заключалась в том, что число 26 для количества категорий Хакебея было выбрано случайным образом, а для того, чтобы определить, к какой группе относится игрок, требовалось скорее искусство, а не наука.
Но, чтобы войти в число элитных игроков в бейсбол, человек должен обладать широким диапазоном физических и ментальных навыков: мышечной памятью, физической силой, координацией между глазами и руками, скоростью удара битой, распознаванием направления полета мяча и силой воли, позволяющей сохранять концентрацию даже в сложные для команды периоды. Понятие о существовании различных видов кривых старения, вытекающее из созданных системой Vladimir, казалось, более точно отражало всю сложность, присущую человеческой природе.
При разработке PECOTA я попытался заимствовать некоторые элементы у Хакебея, а некоторые – у Билла Джеймса. В выпуске Baseball Abstract за 1986 г. Джеймс представил так называемые оценки подобия, которые (как и предполагает их название) были призваны выявить статистическое подобие между статистикой карьеры любых двух игроков основной лиги. Концепция была сравнительно простой. Для начала каждому из двух игроков присваивалось по 1000 баллов, а затем при наличии между игроками различий по тому или иному параметру соответствующие баллы вычитались{205}. У игроков с высокой степенью подобия итоговый балл мог составлять 950 или даже 975, однако в других случаях расхождения накапливались достаточно быстро.
Оценки подобия могут оказаться невероятно полезными любому человеку с хорошим знанием истории бейсбола. Вместо того чтобы изучать статистику игрока в вакууме, специалисты могут оценить исторический контекст происходящего. Например, статистические результаты Педройи до достижения им возраста 25 лет были идентичны результатам Рода Кэрью, великого игрока из Панамы, возглавлявшего Minnesota Twins в 1970х, или результатам Чарли Герингера, звезде команды Tigers времен Великой депрессии. Оценки подобия Джеймса позволяют проводить ретроспективный анализ, предоставляя возможность оценивать прошлые события. Например, с его помощью можно проанализировать, насколько игрок заслуживает, чтобы его приняли в Зал славы.
Если вы считали, что ваш любимый игрок действительно заслуживает это, и могли увидеть, что это удалось 9 из 10 игрокам с идентичной статистикой, то у вас были все шансы верить в успех.
Но можно ли использовать оценки подобия и для предсказания? Например, если мы могли выявить сотню игроков, наиболее сопоставимых с Педройей по возрастным критериям, то в какой степени результаты этих игроков за всю карьеру могли подсказать нам, как будет развиваться карьера Педройи?
Меня заинтересовала эта идея, и так, понемногу, PECOTA начала свое существование в те долгие дни, которые я проводил в KPMG в 2002 г. Она приобрела форму гигантской и разноцветной электронной таблицы Excel. Этот выбор был довольно случайным, поскольку именно Excel был одним из моих основных рабочих инструментов в KPMG (каждый раз, когда мимо моего стола проходил кто-то из начальников, он предполагал, что я усердно тружусь над какой-то особенно сложной моделью для одного из наших клиентов{206}).
Постепенно, отнимая пару часов от работы и по нескольку часов от сна, я смог разработать базу данных, включавшую более чем 10 000 позиций «игрок – сезон» (я учел каждый сезон основной лиги, начиная со времен Второй мировой войны{207}). Кроме этого, я разработал алгоритм, позволяющий сравнивать любого игрока с другим. Алгоритм был чуть более сложным, чем алгоритм Джеймса, и предполагалось, что он сможет в полной мере воспользоваться изобилием данных, присущих бейсболу. В нем был заложен иной метод сравнения набора игроков, метод, называемый на техническом языке метод ближайшего соседа[44]. Также он учитывал более широкий набор факторов, включая рост и вес игрока, которые обычно принимаются во внимание лишь скаутами.
Как и система Хакебея, PECOTA предполагала, что различные типы игроков могут стареть по-разному. Однако я не стремился сопоставить игру каждого бейсболиста с одной из 26 кривых развития; более того, сопоставление происходило естественным образом с помощью поиска похожих игроков где-то далеко в статистической галактике бейсбола.
Если, допустим, обнаруживалось, что очень многие игроки, статистические параметры игры которых сопоставимы с данными Дастина Педройи, становились сильными игроками основной лиги, то это давало основания надеяться на успех и самого Педройи.
Однако чаще всего мне не удавалось найти однозначно сопоставимые результаты; пути игроков, имевших одинаковую статистику в определенные периоды их карьеры, могли значительно расходиться после этого. Я уже упоминал, что по оценкам подобия, созданным Джеймсом, Педройя был идентичен Чарли Гейгеру и Роду Кэрью, двум игрокам, имевшим долгую и яркую карьеру и попавшим в конце концов в Зал славы. Однако статистика Педройи за этот период была также идентична статистическим данным Хосе Видро, ничем не примечательного игрока второй базы команды Montreal Expos.
Еще сильнее различия могут проявляться у игроков низших лиг[45]. В 2009 г. среди игроков, которые выявила PECOTA для сопоставления с Джейсоном Хейвардом, 19-летним кандидатом на позицию в команде Atlanta Braves, можно было найти и участника Зала славы, и жертву убийства. Чиппер Джонс, один из близких по показателям к Хейварду игроков, был примером первого варианта. Это один из величайших игроков Atlanta Braves за все времена, он отыграл с клубом 17 сезонов, и его показатель результативности за всю карьеру в среднем составил 0,304. Он принес команде более 450 хоумранов. С другой стороны, система выдала мне имя Дернелла Стенсона, многообещающего молодого человека, чьи показатели были также идентичны цифрам Хейварда. В 2003 г. после одной из тренировочных игр в Аризоне неизвестные связали его, а потом застрелили, угнав при этом его внедорожник. Судя по всему, произошел случайный акт насилия.
Все сопоставимые с Хейвардом игроки были крупными, сильными спортсменами; они обладали множеством талантов, имели отличные задатки и демонстрировали развитие навыков при играх в небольших лигах. Однако судьба их сложилась совершенно по-разному. Инновационный характер PECOTA был призван признать этот факт: система выдавала диапазон возможных исходов для каждого игрока, основанный на прецедентах с сопоставимыми игроками. По сути, это были наилучший, наихудший и наиболее вероятный сценарий. Но нужно помнить, что каждый раз при попытках предсказать развитие человека нам придется сталкиваться с бесконечным диапазоном возможных исходов.
Пока что для Хейварда все складываось ни шатко ни валко. После удачного для него 2009 г., когда он был назван «Игроком года в низшей лиге», Хейвард дебютировал в команде Braves в 2010 г. и обеспечил своей команде восемь хоумранов в первых 30 играх в основной лиге. После этого он вошел в состав «Звездной команды», превзойдя все ожидания. Однако сезон 2011 г. оказался для него более сложным, и его результат не превысил 0,227. Хорошая система статистического прогнозирования позволяет сохранять оптимизм даже после выступления Хейварда в сезоне 2011 г. – все его показатели были, по сути, теми же, если не считать результативности ударов по мячу, а этот показатель зависит от удачи значительно больше, чем другие.
Но может ли статистика сказать вам все, что вы хотите узнать об игроке? Десять лет назад эта тема была одной из самых обсуждаемых в мире бейсбола.
Можем ли мы все ужиться?
Довольно поверхностное, но распространенное мнение о книге «Moneyball» состоит в том, что это рассказ о конфликте между двумя конкурирующими группами – «статистиками» и «скаутами». Каждая из них полагалась при оценке результативности игроков на свою собственную парадигму (разумеется, статистики полагались на статистические методы, скауты – на «инструменты»).
В 2003 г., когда книга «Moneyball» была впервые опубликована, читатели Майкла Льюиса вполне могли оценить, насколько враждебными были отношения между двумя группами (нужно сказать, что и сама книга подливала масла в огонь). Когда я в том же году посетил ежегодное «Зимнее собрание» специалистов по бейсболу в гостинице Marriott в Новом Орлеане, мне показалось, что я вновь вернулся в школу. В одном углу можно было увидеть скаутов, которые, подобно буйволам в оазисе, цедили виски и обменивались историями о холодной войне, сгрудившись у стойки бара в гостинице. Часто они уходили в гостиничные номера и принимались за переговоры. Эти люди навсегда связали себя с миром бейсбола. Им было уже за 40, а то и за 50, многие из них были в прошлом спортсменами, которые внесли свой вклад в игру и теперь постепенно продвигались вверх в организационной иерархии.
В другом углу располагались «ботаники» – ребята в возрасте 20–30 лет, вооруженные ноутбуками и цветными распечатками. Они ходили кругами по холлу и пытались уговорить кого-нибудь из профессионалов старой школы взять их на работу. Между двумя лагерями практически не происходило никакого общения, и каждая сторона считала другую слишком высокомерной и косной.
Возможно, подлинный источник конфликта состоял в том, что представители старой школы воспринимали молодежь как угрозу своей работе, способную лишить скаутов значительной доли заработка. «Сейчас существует невероятно сильная конкуренция, – рассказывал Эдди Бейн, директор по скаутингу команды Anaheim Angels на круглом столе в рамках одной конференции, посвященной “Moneyball”{208}. – Некоторые из наших старых коллег теряют работу, которую, по нашему мнению, они должны были сохранить. Возможно, что сокращение штатов вызвано денежными проблемами. Однако мы связываем происходящее с влиянием разных компьютерных штук, и это нас возмущает».
До конца неизвестно, как много команд в реальности урезало бюджеты на скаутинг. Одной из них была Toronto Blue Jays, и она заплатила за это высокую цену, перенеся череду неудач в 2002–2005 гг. Однако урезание бюджета было вынужденной мерой, вызванной спецификой работы корпоративного спонсора команды, компании Rogers Communications. Та пыталась противостоять ослаблению канадского доллара, поэтому случившееся отнюдь не было прихотью генерального менеджера компании, ученика Бина по имени Дж. П. Риккарди.
После публикации «Moneyball» прошло десять лет, и пламя прежней борьбы давно потухло. Успех Red Sox, выигравшей в 2004 г. титул чемпиона ежегодного чемпионата США по бейсболу впервые за 68 лет, был основан на подходе, уделявшем внимание как статистике, так и скаутингу. Команды, которые в 2003 г. можно было назвать исключительно «скаутинговыми» (например, команда St. Louis Cardinals), приняли на вооружение более аналитический подход и являются сейчас одними из лидеров в области спортивных инноваций. Команды со «статистическим» уклоном, такие как Oakland A’s, значительно увеличили свои скаутинговые бюджеты{209}.
Экономическая рецессия, продолжавшаяся с 2007 по 2009 г., способствовала дальнейшему развитию аналитических методов. Хотя бейсбол довольно хорошо перенес рецессию, внезапно буквально все прониклись идеями «Moneyball» и начали пытаться оптимизировать свои возможности в условиях ограниченных бюджетов{210}. На рынке не было дефицита в дешевой рабочей силе среди статистиков. Выпускники Гарварда и Йеля, специализировавшиеся на экономике и вычислительной технике, которые незадолго до этого времени планировали работать в инвестиционном банке и получать по 400 тыс. долл. в год, теперь с радостью отправлялись в Тампу или Кливленд и круглосуточно работали за десятую часть от этой суммы. Зарплата «компьютерного ботаника» в 40 тыс. долл. казалась куда лучшей инвестицией, чем 40 млн долл., выплачиваемых свободному агенту[46], прежние выдающиеся результаты которого постепенно снижались до средних.
Однако случившееся не было свидетельством безоговорочной победы статистиков. Если им и удалось доказать свою ценность, то это же удалось и скаутам.
PECOTA против скаутов – победа остается за скаутами
Изначально название PECOTA представляло собой аббревиатуру, расшифровывавшуюся как Эмпирическое сравнение питчеров и тестовый алгоритм оптимизации (Pitcher Empirical Comparison and Optimization Test Algorithm). Кроме того, эта аббревиатура повторяла имя Билла Пекоты, довольно среднего игрока внутреннего поля[47] команды Kansas City Royals, игравшего в 1980х гг. и доставившего немало неприятностей моей любимой команде Detroit Tigers[48].
Поначалу программа должна была оценивать результативность питчеров, а не подающих. Предсказать этот параметр невероятно сложно, поэтому после пары лет экспериментов с системой под названием WFG Baseball Prospectus оставил попытки и начал публиковать пустые поля для своих прогнозов по этой группе игроков. Я почуял возможность и показал PECOTA Хакебею. К моему удивлению, система понравилась и ему, и сотрудникам Baseball Prospectus; они предложили мне выкупить PECOTA в обмен на долю в Baseball Prospectus и при условии, что я создам аналогичную систему для бьющих (хитеров){211}. Я это сделал, и зимой 2003 г. в Baseball Prospectus был опубликован первый ряд прогнозов PECOTA.
По окончании сезона 2003 г. мы обнаружили, что PECOTA сработала немного лучше, чем другие коммерческие системы прогнозирования{212}. Фактически ежегодно с 2003 по 2008 г. наша система была не хуже конкурентов. Это демонстрировалось по итогам тестов – как наших, так и сторонних{213}. При этом нам удавалось показывать более четкие результаты, чем те, что использовались букмекерами в Вегасе{214}. Несколько успешных прогнозов помогли существенно укрепить репутацию системы. Например, в 2007 г. PECOTA предсказала, что Chicago White Sox – всего за два года до выигрыша титула в чемпионате – обеспечит себе по итогам сезона лишь 72 победы. Этот прогноз чикагских СМИ и руководство White Sox пытались опротестовать{215}. Однако он оказался правдивым – сезон для White Sox завершился именно так: 72 победы против 90 поражений.
Но уже к 2009 г. другие системы начали догонять, а то и опережать прогнозы PECOTA. Подобно тому как я заимствовал некоторые элементы системы у Джеймса и Хакебея, другие исследователи заимствовали ряд инноваций уPECOTA и добавляли к ним какие-то свои идеи. Некоторые из этих систем оказались очень хорошими. Если вы попытаетесь проранжировать лучшие прогнозы года по тому, насколько хорошо они предсказывали результаты игроков основной лиги, то разница между результатами лучших систем не будет превышать долей процента{216}.
Меня давно интересовала и еще одна цель, с которой можно использовать PECOTA, – прогнозирование результатов игроков низшей лиги, таких как Педройя. Это значительно сложнее. А поскольку в то время очень мало систем разрабатывалось с подобной целью, единственным реальным конкурентом были скауты.
В 2006 г. я впервые опубликовал список 100 лучших потенциальных игроков, по версии PECOTA, а также сравнил его со списком, созданным на основе работы скаутов и опубликованным в это же время в Baseball America. Игроки в списке PECOTA были проранжированы по величине возможного вклада в результат в течение следующих шести сезонов после вхождения в состав команд высшей лиги{217}.
Сезон 2011 г. стал шестым годом после публикации прогнозов, поэтому я мог провести корректное сравнение прогнозов и реальности. Хотя игроки в этом списке были сравнительно молодыми, данные давали довольно четкое представление о том, удалось ли им стать звездами, либо же они просидели основную часть сезонов на скамейке запасных или вообще покинули мир большого спорта.
По данным моего списка, Педройя оказался на четвертом месте в списке потенциальных звезд. Это был не единственный успешный прогноз PECOTA. Система дала высокую оценку Иену Кинслеру, который вообще отсутствовал в списке Baseball America; в реальности он вошел в состав двух команд «Всех звезд» и стал одним из ведущих нападавших команды Texas Rangers. PECOTA высоко оценила и Мэтта Кемпа, суперзвезду команды Dodgers, который в 2011 г. получил редкую награду – бейсбольную Тройную корону[49] (оценка, данная ему Baseball America, была значительно ниже моей).
Но доводилось ли вам слышать о Жоэле Гузмане? Дональде Мерфи? Йосемиро Пети? Возможно, нет, если только вы не подлинный фанатик бейсбола. PECOTA же посчитала этих игроков достаточно перспективными.
Свои упущения были и у Baseball America – скауты проявляли чрезмерный оптимизм в отношении Брэндона Вуда, Ластингса Милледжа и Марка Роджерса. Однако были и успешные прогнозы. Так, Baseball America отметила питчера Red Sox Йона Лестера, шорт-стопа[50] Rockies Троя Туловицки и аутфилдера[51] Baltimore Orioles Ника Маркакиса, все они имели довольно скромные статистические результаты в низшей лиге и вообще не были включены в список PECOTA.
Для статистического сравнения систем имеется достаточно большой объем данных. В частности, мы можем посмотреть на количество побед игроков в составе команд в каждом списке – например, на показательWARP[52]{218}. Этот показатель призван оценить, какой вклад вносит игрок любыми действиями: хитингом, питчингом и ловлей.
В течение 2011 г. игроки из списка PECOTA обеспечили 546 побед своим командам высшей лиги (рис. 3.3). Однако игроки из списка Baseball America показали еще более высокие результаты, обеспечив 630 побед. Хотя суждение скаутов иногда бывает искаженным, в данном случае оно оказалось полезным – их прогнозы оказались на 15 % лучше тех, что были сделаны на основе одной лишь статистики. Хотя такое различие может показаться не очень значительным, однако это не так. Бейсбольные команды готовы платить по 4 млн долл. за каждую удачную находку на рынке спортсменов-профессионалов, не связанных контрактом{219}. Таким образом, скауты обошли нас за этот период примерно на 336 млн долл.[53].
Рис. 3.3. Достижения кандидатов из списков 100 лучших потенциальных игроков, составленных в 2006 г. системой PECOTA и Baseball America, к 2011 г.
Предубеждения скаутов и статистиков
Конечно, было бы здорово, если бы список PECOTA оказался более точным, чем тот, что был составлен на основе мнений скаутов, но я не ожидал, что так может произойти. Через некоторое время после их публикации я написал{220}:
«Несмотря на то что мне было бы интересно взглянуть на противостояние скаутов и статистиков под новым углом, я не жду, что ранжирование, выполненное системой PECOTA, будет столь же точным, как рейтинги… создаваемые Baseball America».
Исходным «сырьем» для любой системы ранжирования служит информация – а если у вас была возможность изучить и скаутинговую, и статистическую информацию, значит, вы получили больше такого «сырья». Единственная возможность для чисто статистического подхода переиграть смешанный заключается в том, что вызываемые смешанным подходом предубеждения порой оказываются настолько сильными, что перевешивают преимущества.
Иными словами, скауты используют смешанный подход. Они имеют доступ к широкой информации, не ограничивающейся статистикой. И скауты, и PECOTA могут без проблем изучать личные достижения, или ERA[54] игрока; не имеющая предубеждений система типа PECOTA может немного лучше отсеивать какую-то часть шумов из этих данных и выдавать их в более правильном контексте. Однако скауты имеют доступ к огромным массивам информации, о которой PECOTA не имеет ни малейшего представления. Допустим, вместо того чтобы гадать о том, насколько велика сила броска питчера, они могут просто достать лазерный радар и замерить скорость мяча или же использовать секундомер, чтобы оценить, насколько быстро он перебегает с базы на базу.
Этот тип информации позволяет нам сделать еще один шаг в сторону глубинных причин того, что мы пытаемся предсказать. В низших лигах питчеры даже со слабой силой броска могут нащупать успешную зону; большинство противостоящих ему подающих довольно неумелы, поэтому он вполне может их переиграть. В высших лигах, где отбивающие способны парировать мяч, летящий со скоростью до 120 км/ч, шансы таких питчеров невелики. PECOTA может быть дезинформирована подобными данными, но это никогда не произойдет с умелым скаутом. И наоборот, скаут может выявлять игроков, обладающих талантом на уровне высшей лиги, для развития которых может потребоваться время.
Нужно, впрочем, отметить, что каждый раз, когда в процесс вовлекается человеческое суждение, возникает и потенциал для предубеждения. Как мы видели в главе 2, увеличение объема информации способно лишь ухудшить ситуацию для тех, кто неправильно относится к прогнозам и пытается навязать свою точку зрения на то, как устроен мир, вместо того чтобы попытаться познать истину.
Возможно, в эре, предшествовавшей «Moneyball», эти предубеждения играли на руку скаутам. Они могли уделять больше внимания эстетике игры, чем таланту игрока. Если свежие списки Baseball America можно считать очень хорошими, то списки начала 1990-х{221} были переполнены огромным количеством несбывшихся прогнозов – достаточно вспомнить таких превозносившихся игроков, как Тодд Ван Поппел, Рубен Ривера и Браен Тейлор, которым так и не удалось добиться серьезных результатов.
Однако свои предубеждения могут иметься и у статистиков. Одним из самых пагубных может считаться предположение о том, что все, что не поддается количественной оценке, не имеет большого значения. Например, в бейсболе измерять результативность защиты всегда было намного сложнее, чем эффективность броска или отбития мяча. В середине 1990х команда Oakland A’s не обращала особого внимания на защиту, и ее деятельность во внешнем поле направлялась довольно медлительными и неуклюжими игроками типа Матта Стрейерса, который,однако, мог считаться прирожденным подающим. По мере улучшения анализа действий защиты стало очевидным, что плохая защита команды стоила ей от восьми до десяти побед за сезон{222}. Это не позволяло им занимать достойные позиции в чемпионате вне зависимости от статистики удачных ударов по мячу. Бин уловил суть проблемы, и его новые и успешные команды имеют сравнительно хорошую защиту.
Подобные слепые места могут привести к еще большим проблемам, когда речь заходит о прогнозировании результатов игроков низшей лиги. Когда мы говорим об игроке высшей лиги, главный вопрос состоит в том, сможет ли он показывать такие же хорошие результаты, как в прошлом. Самые толковые системы статистического прогнозирования могут выявить восходящий или нисходящий тренд величиной всего в несколько процентных пунктов{223}. Однако если вы просто предположите, что игрок покажет примерно те же результаты, что и в два предшествовавших сезона, то несильно ошибетесь.
Однако бейсбол уникальным образом отличается от других основных профессиональных видов спорта – у него невероятно разветвленная система команд низшей лиги. Если у Национальной футбольной лиги официально вообще нет низшей лиги, а в состав низшей лиги NBA[55] входят всего несколько команд, то в бейсболе их 240 – по восемь для каждой родительской команды из высшей лиги. Кроме этого, если баскетболисты или футболисты могут стать видными профессионалами сразу же после колледжа или даже старших классов школы, то в бейсболе подобный мгновенный рост проявляется крайне редко. Даже самые талантливые игроки чаще всего играют в течение какого-то времени в Billings, Bakersfield или Binghamton перед тем, как перейти в команды основных лиг.
Довольно сложно предсказывать результаты этих игроков, поскольку мы надеемся, что они со временем смогут сделать что-то, на что пока не способны, – показывать хорошие результаты, играя в высших лигах. Можно легко представить себе, что уникальный по своему потенциалу игрок типа Брюса Харпера, лучшего подающего в стране, играющего в школьной лиге, попросту не выжил бы в противостоянии с питчером высшей лиги. Для игры на новом уровне ему нужно подрасти, стать сильнее, умнее и дисциплинированнее – а все это требует определенной комбинации упорного труда и удачи. Представьте себе, что вы заходите в обычный школьный класс, несколько дней наблюдаете за учащимися, а потом вас просят предсказать, кто из них станет успешным врачом, юристом и предпринимателем, а кто будет вынужден всю жизнь сводить концы с концами. Думаю, что вы изучили бы их оценки и посмотрели на то, у кого из них больше друзей, но в целом любые ваши выводы будут высосаны из пальца.
Тем не менее от многих скаутов-любителей (и любой статистической системы, имитирующей их действия) ожидается именно это. Хотя некоторые бейсболисты приходят в команды после колледжей, кое-кто попадает в них и во время учебы в школе, а процесс скаутинга начинается, когда те еще находятся в подростковом возрасте. Как и в любой другой группе молодых людей, в них будут играть гормоны и юношеский задор. Тела их продолжают расти и развиваться, а сами они постоянно подвергаются искушениям, связанным с выпивкой и влечением к противоположному полу. Только представьте себе, что вам нужно доверить весь свой бизнес кучке 19-летних парней.
Не только «Пять инструментов»[56]
Как писал Льюис в книге «Moneyball», Билли Бин был одним из тех игроков, кто имел потрясающий талант, но не смог этого понять; впервые попав в серьезную команду в 1980 г., он сыграл в высшей лиге всего 148 игр, а его средний результат за карьеру составил 0,219. Тем не менее Бин все равно попал в Зал славы, в отличие от других потенциальных кандидатов – типа Джона Сандерса, работающего в настоящее время скаутом для Los Angeles Dodgers.
Сандерсу удалось сыграть в серьезном матче, но лишь однажды, как это произошло и с Мунлайтом Грэмом, героем фильма «Поле его мечты» («Field of Dreams»). 13 апреля 1965 г., когда Сандерсу было 19 лет, команда Kansas City Athletics использовала его в качестве пинчраннера[57] в седьмом иннинге[58] игры против Detroit Tigers. Сандерсу не удалось сделать ничего особенного – последние два подающих внезапно покинули поле, и его заменили перед началом следующего иннинга{224}. Больше ему так и не довелось сыграть в высшей лиге.
Сандерс был достаточно талантлив. В годы учебы в школе в Небраске он входил в состав «звездной» команды по американскому футболу (1963), команды штата по баскетболу (1964), а также стал золотым призером в соревнованиях штата по метанию диска{225}. Возможно, что бейсбол даже не был его любимым видом спорта. Однако ему удавалось играть достаточно хорошо, и после выпуска из школы летом 1964 г. он получил, кроме диплома, и профессиональный контракт с командой A’s.
Однако дальнейшему развитию Сандерса помешало правило «Bonus Baby». До появления в 1965 г. новых правил формирования команд высшей лиги все игроки-любители были свободными спортсменами, и команды могли платить им любую сумму, которую бы только захотели.
Чтобы не позволить самым богатым командам перехватывать всех перспективных игроков, правило налагало серьезное ограничение – игроки, получившие значительную сумму при подписании контракта, должны были провести первые два профессиональных сезона в составе команды высшей лиги, даже если не были готовы при этом играть на соответствующем уровне{226}.
Это правило стало настоящим наказанием для блестящих новичков типа Сандерса. Большинство игроков, попавших под действие правила, были вынуждены почти все время сидеть на скамейке запасных и крайне редко выходили на поле в матчах высшей лиги.
Им не позволялось играть и приобретать опыт в то самое время, когда это было им более всего необходимо. Кроме того, им редко удавалось найти сочувствие у болельщиков и других членов команды, не понимавших, почему 19-летнему парню, сидящему на скамейке запасных, платят такие большие деньги. Хотя некоторым игрокам из команды Bonus Babies, например Сэнди Коуфаксу и Хармону Килбрю, удалось, завершив карьеру, попасть в Зал славы, многие другие талантливые игроки той эры так и не смогли сыграть в полную силу.
История Сандерса, возможно, лучшего спортсмена-любителя в штате Небраска, заслужившего упоминания в Baseball Encyclopedia, обеспечивает ему уникальное по своей глубине понимание души молодых игроков. Мне удалось поговорить с ним по телефону в момент, когда он направлялся из Северной Каролины в Джорджию, чтобы посмотреть матч одной из дочерних команд клуба Braves.
Если бы я встретил Сандерса на «Зимней встрече» 2003 г., проходившей в Новом Орлеане, то отнес бы его к группе «спортсменов». После завершения своей (недолгой) игровой карьеры он посвятил жизнь спорту. Однако сам Сандерс никогда не воспринимал игру как противостояние спортсменов и статистиков.
«Я люблю считать, – рассказал он мне. – Я всегда наслаждался статистическими выкладками еще в те дни, когда мы использовали калькуляторы или даже счеты».
Сандерс рассказал мне историю, которая произошла с ним: «Один из скаутов как-то сказал мне: “Давайте признаемся сами себе. Что мы делаем сразу после приезда на стадион? Мы идем в пресс-центр и получаем там статистику. Что в этом плохого? Именно так нам и надо работать”».
В реальности статистика была частью бейсбола с самого начала. Первые результаты матчей в газете с пятью категориями статистических данных для каждого игрока – количеством переходов, ударов, создания положений «вне игры», удачных передач и ошибок – были опубликованы Генри Чедвиком в 1859 г.{227}, за 12 лет до создания первой профессиональной лиги 1871). Многие споры в эпоху «Moneyball» были связаны не с тем, нужно ли использовать статистику, а с тем, какие именно данные следует принимать в расчет.
Например, такой показатель, как коэффициент попаданий на базу (OBP), которым на протяжении многих лет оперировали аналитики типа Джеймса, больше коррелирует с количеством пробежек, приносящих компании очки (а следовательно, и с выигрышами игр), чем среднее количество попаданий битой по мячу. Однако этот вывод очень долго не признавался представителями традиционных взглядов в этой сфере{228}.
Подобные споры обычно разворачивались на территории статистиков. Тот факт, что OBP содержит более полезную информацию, чем среднее количество попаданий по мячу, или что ERA питчера представляет собой более справедливый индикатор его успеха, чем соотношение побед и поражений, – это такие же научные факты, как тот, что Земля вращается вокруг Солнца. Разумеется, статистики были однозначно правы в своем отношении к этому показателю. Однако наличие сильного выигрышного аргумента заставило статистиков почивать на лаврах и слишком пренебрежительно относиться к другим, не столь очевидным разногласиям.
Чем дальше вы отходите от основных показателей – то есть чем больше вы пытаетесь предсказать, а не измерить результаты игрока, – тем менее полезной может оказаться статистика. Статистическая обработка показателей игроков более продвинутых уровней низшей лиги (таких как Double-A и Triple-A) позволяла делать прогнозы с почти той же степенью точности, что и для спортсменов высшей лиги.
Однако статистическая обработка данных участников, играющих на более низких уровнях низшей лиги, становится менее надежной, а цифры, полученные для игроков, учащихся в колледжах или школах, практически не имеют ценности с точки зрения предсказаний.
Традиционная альтернатива статистике, которой пользуются скауты, называется «Пять инструментов»: способность нанести особенно сильный удар, средняя результативность попаданий, скорость, сила рук и диапазон защиты. Этот список вызывал и вызывает изрядную критику. Так, в нем совершенно не учитывается так называемая Plate discipline, которая включает в себя уолки и страйкауты. Применение «Пяти инструментов» иногда приводит к тому, что создается обманчивое впечатление их одинаковой важности. В то же время в реальности возможность сделать по-настоящему сильный удар значительно важнее силы рук для игроков всех игровых позиций, кроме шорт-стопа и кэтчера[59].
Есть также основания считать, что «Пять инструментов» сами по себе не способны сказать нам слишком много. По мере того как игрок продвигается вверх по лестнице низшей лиги, эти инструменты должны все чаще отражаться в его статистике – либо ему не будет суждено двинуться еще выше. На самом деле некоторые из категорий как раз и являются статистикой – так, «средняя доля удачных ударов» представляет собой результат арифметического расчета; «способность нанести мощный удар» определяется количеством хоумранов и ударов, после которых бэттер успешно достигает второй базы. Если скаут говорит вам, что определенный игрок оценивается в 70 баллов по 80-балльной скаутинговой шкале с точки зрения потенциальной мощности удара, однако ему не удается сделать десять хоумранов в год для команды Altoona Curve, то сильно ли вы будете верить словам этого скаута?
Сандерс, подлинный ветеран спортивной индустрии, достаточно скептично относится к тому вниманию, которое уделяется «Пяти инструментам». «Влияние этого набора инструментов очевидно для всех. Они показывают, что некий игрок быстро бегает, хорошо бросает и все такое. Скауты могут прийти на стадион и увидеть все своими глазами, – рассказывал он мне. – Я думаю, что вопрос состоит в следующем – используются ли навыки достаточно эффективным образом для того, чтобы игроки выиграли матч? Превращаются ли результаты применения инструментов в полезные навыки? Разумеется, мы можем быстро понять, насколько велика скорость владения битой. Но если человек с высокой скоростью работы с битой не верит в себя, то от этого навыка нет никакой пользы».
Сандерс фокусируется скорее не на физических инструментах, а на более полезных для игры навыках. Та мера, в которой эти навыки могут быть переданы другим игрокам, зависит от того, что он называет ментальной панелью инструментов игрока. Ментальные инструменты часто развиваются медленнее, чем физические. Жена Сандерса, занимающаяся обучением детей с особыми потребностями, рассказала ему об исследовании, согласно которому большинство людей остается в ментальном подростковом возрасте примерно до 24 лет{229}. До наступления этого возраста Сандерс готов давать игроку определенное послабление, если замечает сигналы, свидетельствующие о развитии их ментальных инструментов. Но после достижения этого возраста ему нужны результаты. Интересно отметить, что 24 года – это примерно тот возраст, когда игрок оказывается в команде группы Double-A и его результаты становятся более предсказуемыми с точки зрения статистики.
У Сандерса нет никакого формального определения того, что именно должна включать ментальная панель инструментов игрока, однако в ходе нашего с ним разговора мне удалось выявить пять различных интеллектуальных и психологических способностей, которые, по мнению Сандерса, помогают предсказать успех на уровне высшей лиги.
• Готовность и преданность своему делу. Бейсбол не похож ни на какие другие профессиональные виды спорта, игры в которые происходят шесть или семь раз в неделю. Бейсболист не может «настроиться» на игровой день, как это делает футболист или баскетболист; он должен быть готов к работе на профессиональном уровне каждый день. Иными словами, ему необходим определенный уровень дисциплины. Сандерс любит приходить на стадион до начала матча, поскольку считает, что может лучше понять игрока во время предыгровых ритуалов, чем во время самой игры. Например, совершенно очевидно, что в тот сентябрьский вечер в Фенвей-парке Педройя был более сконцентрированным на игре, чем его коллеги. У него был свой метод подготовки, и он предпочитал не отвлекаться ни на что постороннее, в том числе и на какого-то неизвестного ему репортера, желавшего взять интервью.
• Концентрация и сосредоточенность. Хотя эти категории и связаны с готовностью, они имеет отношение к манере, в которой игрок ведет себя во время игры. Бейсбол представляет собой спорт, основанный на рефлексах. У подающего имеется примерно три десятых секунды, чтобы решить, в какую сторону закрутить мяч{230}; а игрок на внутреннем поле должен быстро реагировать на движение мяча сразу же после касания биты. «Если игрок не наполнен энергией, то я даже не знаю, что из него может получиться, – говорит Сандерс. – Я хочу, чтобы шорт-стоп, средний игрок на внутреннем поле, умел концентрировался при каждом ударе, а это умение не отражается в статистике».
• Конкурентоспособность и уверенность в себе. Хотя тот факт, что любой профессиональный спортсмен будет естественным конкурентом для других, и кажется само собой разумеющимся, бейсболисты должны преодолеть сомнения в себе и другие психологические препятствия на ранних этапах своей карьеры. Сегодня они – короли школы, а завтра уже колесят в автобусах между Каннаполисом и Гринсборо, читая в интернете статьи о своих неудачах сразу же после окончания игр. Видя, как талантливый игрок не выкладывается на полную, Сандерс постоянно задается вопросом: «Не пропадает ли желание игрока добиться успеха под действием неудач? Готов ли он потерпеть поражение? Имеется ли у него достаточно желания преуспеть для того, чтобы преодолеть страх неудачи?»
• Управление стрессом и принятие ситуации. В мире бейсбола даже лучшие подающие время от времени допускают ошибки, и каждый игрок так или иначе «спотыкается и падает» в течение сезона. Способность справиться с этой неудачей требует умения забывать и некоторой доли чувства юмора. Одна из излюбленных техник скаутинга Сандерса состоит в наблюдении за реакцией игрока после сложной или неудачной игры. «Я люблю наблюдать за подающим, когда он промахивается при броске. Для зрителей это кажется ужасным, но я радуюсь, видя улыбку на его лице. Потому что в следующий раз – бам! – он отправит мяч на расстояние в четыреста футов!» Эти навыки обретают особую важность, как только игрок попадает в высшую лигу, а значит, становится объектом пристального внимания со стороны болельщиков и СМИ.
• Адаптивность и обучаемость. Насколько эффективно может игрок обработать новую информацию во время игры? Слушает ли он советы тренеров? Как он адаптируется к изменениям жизненной ситуации? Что происходит, когда он переходит в другую команду или когда его просят поиграть на незнакомой позиции? Путь между любительскими и главными лигами редко бывает прямым, даже для самых потенциально талантливых игроков, поэтому ментальный подход великого игрока не может быть слишком жестким. «Игроки, добившиеся успеха в этой игре, – это люди, которые, поворачивая за угол здания, не просто срезают угол, а совершают еще и разворот на месте, – замечает Сандерс. – Это своего рода контролируемая интенсивность».
Разумеется, подобные навыки необходимы и представителям многих других профессий, о которых мечтают люди. Некоторые из них даже могут быть особенно важными для прогнозистов – особенно тот, который Сандерс называет адаптивностью. Как вы реагируете на новую информацию, когда она к вам поступает? Если вы слишком нервничаете и чрезмерно активно реагируете на изменение обстоятельств или, напротив, не желаете отказаться от своих привычных представлений, когда этого требуют объективные свидетельства, то дело неминуемо закончится плохими прогнозами.
При этом мало найдется таких профессий, в которых столь высок уровень конкуренции, как в бейсболе. Из многих тысяч профессиональных бейсболистов и сотен тысяч любителей лишь 750 человек могут играть в командах главных лиг в любой момент времени, а из них лишь несколько десятков войдет в «Звездную команду». Работа Сандерса состоит в поиске тех исключительных людей, которые не подчиняются законам вероятности. Его работа ненамного проще работы самих игроков, и он почти каждый день своей жизни проводит в пути (несмотря на то что ему уже почти 70).
Однако именно Сандерс обеспечивает команду Dodgers самой ценной информацией – информацией, которой нет у других.
«Информация» как новое название игры
Билли Бин, главный герой «Moneyball», считает неустанный сбор информации главным секретом хорошего скаутинга. «Кого мы называем хорошим скаутом? Того, кто способен раздобыть информацию, которую не могут найти остальные, – рассказывал он мне. – Познакомиться с парнем. Познакомиться с его семьей. Это лишь два из множества остальных действий, которые вы должны предпринять, чтобы больше узнать об этом человеке».
Бин знает, о чем говорит. Во многом успех его команды стал результатом хорошей статистической оценки игроков команды. Однако не менее важным для успеха был и скаутинг игроков-любителей. Мигель Техада, Джейсон Джамби, Барри Зито, Тим Ху, Эрик Чавес – иными словами, большинство звезд команды в начале 2000х годов (периода, описанного в «Moneyball») – были найдены клубом и получили в нем должное развитие.
Бин рассказал мне, что бюджет команды на скаутинг в наши дни выше, чем когда-либо прежде. Более того, по его словам, руководство команды увеличило его именно благодаря увлечению статистическим анализом. Как мы уже говорили выше, бейсболисты не могут приобрести статус свободного агента – профессионала, не связанного контрактом, – до конца полного шестого сезона, то есть до тех пор, пока им не исполняется по меньшей мере 30 лет.
Как показал проведенный Биллом Джеймсом анализ кривых старения, зачастую клубы тратят на свободных агентов слишком много денег – причем тогда, когда их лучшие годы уже оказываются позади.
Однако у этой медали есть и другая сторона – игрок может быть чрезвычайно полезным для клуба и до того, как ему исполнится 30 лет. Более того, экономика бейсбола структурирована таким образом, что более молодые игроки с хорошим потенциалом могут быть куплены за довольно небольшие деньги{231}.
Если рассматривать бейсбольную команду как любой другой бизнес, то есть с точки зрения прибыли и убытков, то почти вся ценность в нем создается в процессах скаутинга и дальнейшего развития. Если система прогнозирования в команде исключительно хороша, то команда может себе позволить платить по 10 млн долл. в год игроку, истинная ценность которого составляет 12 млн долл. Однако если скаутинг выстроен в команде по-настоящему хорошо, то появляется возможность найти хорошего игрока, которому можно платить всего 400 тыс. долл. И именно таким образом и строится конкуренция на небольшом рынке типа Окленда.
Поэтому не приходится говорить, что команде A’s недостает уважения к роли, которую в ней играют скауты. Более того, Бин четко дает понять, что, принимая решение о приглашении игрока в команду, менеджеры не стесняются изучать его психический склад.
Организация до сих пор в значительной степени верит в тщательный анализ. Однако тщательность и дисциплина проявляются в том, как организация обрабатывает ту информацию, что у нее имеется, а не в том, чтобы объявлять те или иные типы информации ненужными или неприменимыми.
«Пропорция объективного и субъективного анализа определяется в различных организациях по-разному, – пояснил мне Бин. – С нашей точки зрения, мы вынуждены принимать объективные решения, а не полагаться на свои чувства. Если мы, живущие в Окленде, примем правильное решение, основываясь на эмоциях, то лично я буду считать это случайностью. И мы просто не можем позволить себе принимать случайные решения и надеяться, что нам повезет. Если бы мы играли в блек-джек, у нас было бы шесть очков, а у дилера четыре, то мы точно знали бы, что для выигрыша нам понадобятся дополнительные карты».
Как мы заметили в главе 2, чтобы составить хороший прогноз, нам не стоит ограничиваться одной лишь количественной информацией. Скорее, мы должны уметь хорошо и правильно взвешивать информацию. В этом и состоит суть философии Бина – собрать максимально возможный объем информации, а затем очень тщательно и дисциплинированно проанализировать ее.
Лакмусовой бумажкой, позволяющей понять, насколько вы компетентны как прогнозист, является изменение качества ваших прогнозов: становятся ли ваши предсказания лучше при увеличении объема информации? Если же они становятся хуже, то можно сказать, что у вас имеются некоторые плохие привычки (как у политологов, прогнозы которых изучал Фил Тэтлок). Если Кандидат А имеет результат 0,300 с 20 хоумранами и раздает в свободные дни еду бездомным, а Кандидат B имеет результат 0,300 с 20 хоумранами, но при этом тусуется в свободное время в ночных клубах и употребляет кокаин, вы не сможете дать количественную оценку различиям между ними. Однако можете не сомневаться, что хороший прогнозист обязательно примет эту информацию к сведению.
Как показывает практика, преобразовать качественную информацию в количественную вполне реально[60]. Фактически скауты оценивают игроков по четкой цифровой шкале, варьирующейся от 20 до 80 в каждой категории. Нет никаких препятствий к тому, чтобы включить ее в статистическую модель вместе со средним количеством удачных попаданий битой по мячу{232} и посмотреть, повышает ли это качество прогноза. Некоторые команды, например Cardinals, уже это делают.
На самом деле грань между статистикой и скаутингом, а также качественной и количественной информацией в бейсболе стала довольно расплывчатой. Взять, например, внедрение Pitch f/x – системы трехмерных камер, которые сейчас уже установлены на каждом стадионе высшей лиги. Эти камеры способны измерять не только скорость полета мяча (это можно было сделать и раньше при помощью лазерных устройств), но и степень его колебаний в горизонтальной и вертикальной плоскостях, когда он подлетает к кнечной цели. Например, мы можем, воспользовавшись статистикой, сказать, что Зак Грейнке, питчер из Milwaukee Brewers, ставший в 2009 г. лучшим молодым питчером в своей лиге, имеет лучшую скользящую подачу (слайдер) в бейсболе{233} или что Мариано Ривера действительно отбивает самые закрученные и быстро летящие мячи так хорошо, как говорят легенды{234}. Традиционно все эти вопросы считались вотчиной скаутинга; теперь же они представляют собой еще одну переменную, которую можно добавить в систему прогнозирования.
Мы совсем недалеки от того времени, когда в нашем распоряжении будет иметься трехмерная запись всего, что происходит на бейсбольном поле. Вскоре мы сможем в точности измерить, насколько высоко готов подпрыгнуть Джейкоби Эллсбери, чтобы поймать летящий над его головой мяч. Мы будем знать, насколько быстро Ичиро Сузуки бежит от одной базы к другой, или с какой скоростью Ядир Модина успевает перебросить мяч на вторую базу.
Эта новая технология неспособна будет убить скаутинг, как это не удалось и «Moneyball». Скорее, мы станем уделять больше внимания вещам, которым еще сложнее дать количественную оценку и в которых такая информация, как, допустим, ментальные способности игрока, оказывается еще более эксклюзивной. Но толковые скауты, к числу которых относится и Сандерс, уже находятся впереди.
Почему предрекали, что Педройю постигнет неудача…
Но почему же скауты так сильно ошибались, когда высказывали предположения о том, как будет развиваться спортивная карьера Дастина Педройи?
Мнения скаутов, основанные на базовой информации о нем, совпадали. Все знали, что Педройя был в среднем неплохим подающим, что он довольно толково ведет себя на поле и что его ментальные способности довольно «нестандартны». Все знали, что он обладает длинным свингом; что его защита стабильна, но в ней нет ничего выдающегося; что бегает он со скоростью не выше средней; что он – коротышка, обладающий не самым лучшим телосложением.
Однако это был довольно специфический набор качеств для молодого игрока, и многие скауты не знали, что с ним можно сделать. «При оценке игрока скауты примерно представляют, что хотят увидеть, – рассказал мне Сандерс. – Прототипы и стандарты. А Дастин во многом им противоречил, начиная с роста и фигуры».
Когда мы не можем вставить квадратный колышек в круглое отверстие, то часто виним колышек, хотя порой неспособность решить задачу связана с чрезмерной негибкостью нашего мышления. Прежде всего, мы инстинктивно пытаемся отнести информацию к той или иной категории. И обычно у нас имеется сравнительно небольшое количество категорий, поскольку тогда их проще отслеживать (достаточно вспомнить о том, как бюро переписи США делит людей из сотен этнических групп на шесть расовых категорий или о том, как критики относят тысячи музыкантов к представителям нескольких музыкальных жанров).
Чаще всего это может сработать. Однако когда у нас возникает проблема с категоризацией какого-то объекта, то мы часто не обращаем на него внимания или неправильно его оцениваем. Именно по этой причине Бин предпочитает избегать решений, основанных на том, что он «чувствует нутром». Слишком сильно полагаясь на первые впечатления, он рискует упустить из виду потенциально ценных молодых игроков – а с учетом бюджета команды он просто не может себе этого позволить.
Система, подобная PECOTA, позволяющая осуществлять поиск среди тысяч игроков и находить среди них людей с одинаковыми профилями, имеет более строгий способ категоризации игроков. Этот способ позволяет оценивать навыки людей, подобных Педройе, в более правильном контексте.
Поиск с помощью PECOTA позволил найти несколько интересных прецедентов. Оказалось, к примеру, что приземистость Педройи может быть предпочтительной характеристикой, с учетом других его навыков.
В бейсболе принято считать зоной страйка расстояние от плеч игрока до его коленей. Чем ниже спортсмен, тем меньше размер цели у питчера. Игрок типа Педройи, умеющий хорошо работать битой, может извлечь из подобной ситуации немало пользы.
Кроме этого, невысокий рост и близость к полю могут стать отличной характеристикой для защиты игрока второй зоны. Эта позиция на поле требует особой ловкости и кошачьих рефлексов, помогающих поймать мячи, только что изо всех сил отправленные в полет ударом биты. Из истории бейсбола мы знаем, что многие лучшие игроки второй зоны были невысокими. Из 17 участников Зала славы лишь двое – Нэп Ладжойе и Ранн Сандберг – имели рост выше 180 см{235}. Рост Джо Моргана (возможно, величайшего игрока второй базы всех времен) составлял чуть больше 170 см.
Скауты отлично делают свою работу, однако в этом случае они слишком быстро и со слишком высокой степенью предубеждения отнесли игрока к определенной категории. Маленький рост Педройи был в каком-то смысле его сильной чертой.
Тем не менее никто не может ничего гарантировать. Из прогноза PECOTA не следовало, что успех Педройи – очевидный факт, речь шла о том, что у него есть определенные шансы. Скауты считали, что шансов, скорее, у него недостаточно. Отличие, однако, состояло в том, что команда Red Sox верила в Дастина Педройю. И, к счастью для команды, в себя верил и сам Педройя.
…и как он выиграл вопреки всем прогнозам
Я познакомился с Биллом Джеймсом на встрече консультантов на фестивале, организованном журналом New Yorker, в октябре 2009 г. После официальной части началась угарная вечеринка, и этот человек сильно выделялся из толпы модников. Он был облачен в невероятно яркий свитер и сабо, которые казались на пару размеров больше, чем нужно. Пока все остальные участники вечеринки пытались добиться внимания Сьюзен Сарандон, мы устроились в баре и некоторое время поболтали{236}.
В Red Sox обязанности Джеймса достаточно разнообразны – и довольно конфиденциальны (в рамках официальной беседы он всячески воздерживался от деталей). После того как он в течение четверти века изучал бейсбол со стороны, можно было сказать, что в зрелом возрасте он несколько смягчился. Теперь спорт казался ему чем-то иным, чем в годы, когда он был внутри процесса; по словам Джеймса, он быстрее других распознает ментальные аспекты игры.
«В 80е годы я писал много чего, что потом оказалось неверным, – рассказывал он мне. – Одно из первых изменений было связано с тем, что у меня появились дети. Я знаю, что это клише, однако, когда у вас появляется свой ребенок, вы начинаете понимать, что и каждый человек вокруг вас – это тоже чей-то ребенок. И это – совершенно иной взгляд на людей. Пока вы растете, то воспринимаете всех этих людей как персонажей телешоу или видеоигр или героев на бейсбольных карточках – вы даже не задумываетесь, что все они – люди, которые делают лучшее из того, на что способны».
Я был поряжен, насколько были похожи комментарии Джеймса на те, что я слышал от Бина и Сандерса, хотя все эти люди смотрели на спорт под совершенно разными углами. Так, если бы вы положили рядом записи моих разговоров с Джеймсом, Бином и Сандерсом, то вряд ли могли бы понять, какая из них относится к конкретному собеседнику (если не принимать во внимание то, что разговоры с Джеймсом были на порядок забавнее). Джеймс признаёт, что скауты Red Sox имеют определенную ценность для клуба, и проводит параллель между своей и их миссией. В бейсболе успех измеряется довольно определенным образом – соотношением показателей W и L (выигрышей и проигрышей), – поэтому найти общую точку для соприкосновения достаточно несложно. Если повышение объема информации делает ваши предсказания хуже, то вам следует заняться чем-то другим, и уж точно вы не будете пожизненно заняты в McLaughlin Group.
«На определенном уровне и я, и скауты воспринимаем бейсбол одинаково, – рассказывал мне Джеймс. – Возможно, это можно сравнить с ситуацией, когда люди с крайне правыми и крайне левыми взглядами начинают говорить по сути, об одном и том же. Скауты хотят увидеть то же, что пытаюсь увидеть я».
В 2004 г. Джеймс помогал Red Sox отбирать новых игроков. Он написал довольно положительный отчет о Педройе, однако порекомендовал команде взять кого-то другого. Тем не менее ему было приятно и то, что Педройя все же попал в команду, и то, что его результаты заставляли прежних критиков выглядеть идиотами.
Однако в самом начале карьеры Педройи было несколько моментов, когда даже самые большие его фанаты начали в нем сомневаться. Педройю пригласили для участия в играх высшей лиги в августе 2006 г. Он сыграл в 31 матче, однако его показатель попадания по мячу составил всего 0,198, и он всего шесть раз смог выбить мяч за пределы базы. Это никого не обеспокоило; Red Sox, в несколько непривычной для себя манере уже выбыла из соревнований в рамках плей-офф в последние недели сезона, и внимание всей Новой Англии переключалось на Celtics и Patriots. Однако в следующем году, когда Педройе уже была доверена вторая база, он начал сезон столь же медленно – после первого месяца игр его результат составил 0,172.
В этот момент Педройю уже могли бы выгнать из такой команды, как Cubs, до недавних времен славившейся своим довольно бессистемным процессом принятия решений. Во многих клубах каждое действие вызывает мощную и порой чрезмерную прямо противоположную реакцию. Однако Red Sox следует более дисциплинированному и систематическому подходу. И когда менеджеры Red Sox внимательно посмотрели на происходившее с Педройей в тот момент сезона, то, по словам Джеймса, они увидели кое-что, что им понравилось. Педройя не просто промахивался по мячу – он активно взаимодействовал с ним. И активность этого взаимодействия должна была рано или поздно привести к появлению какой-то новой тенденции.
«У каждого из нас возникает момент, когда мы теряем доверие к данным, – сказал мне Джеймс. – Возможно, вы это знаете и сами, но если вы посмотрите на данные предыдущего года, когда результат Дастина составил где-то около 0,180, то соотношение ударов и промахов у него находилось на уровне примерно 8–9 %. Это происходило именно в те весенние месяцы, когда ему было сложнее всего. Такой результат вполне закономерен – если вы замахиваетесь так же сильно, как он, то вы никогда в жизни не сможете обеспечить хороший контакт и показать результат выше 0,180».
Руководители команды Red Sox принимали решение о том, чтобы Педройя оставался в команде, не без сомнений. Они продолжали наблюдать за ним, чтобы понять, удается ли ему делать то, что приносило ему успех на любительском уровне. Если бы они решили оставить Педройю на скамейке запасных, то принятие его потребовало бы ничуть не меньших раздумий, чем решение о том, чтобы выпустить его на поле. Они не позволяли данным диктовать решения без рассмотрения более широкого контекста происходящего.
По словам Джеймса, единственное, что их беспокоило, было связано с тем, не начнет ли сам Педройя сомневаться в себе. И такой поворот событий был вполне вероятен для любого другого игрока, но только не Педройи, не переживающего ни из-за дураков, ни из-за критиков.
«К счастью, Дастин по-настоящему упрямый человек. Если бы он слушал всех этих людей, то почувствовал бы себя униженным, и это бы его просто уничтожило. Он же никого не слушал. Он копал свою яму, он отрабатывал замахи, и, в конечном итоге, все повернулось так, как он хотел».
Педройя обладает тем, что Джон Сандерс называет «памятью главной лиги», то есть быстро забывает то, что становится прошлым. Его не беспокоят отдельные неудачи, потому что он совершенно уверен в том, что играет правильно, а в долгосрочной перспективе значение имеет лишь это.
И он крайне нетерпим ко всему, что отвлекает его от работы. И становится не самым приятным в общении человеком, но именно это и дает ему возможность играть на второй базе за бостонскую команду Red Sox, а это – единственное, о чем заботится Педройя.
«Наши сильные и слабые стороны всегда взаимосвязаны, порой не самым явным образом, – сказал мне Джеймс. – Педройя смог превратить в силу то, что у других игроков является слабостью».
Реальные уроки «Moneyball»
«Как сказал Майкл Льюис, споры окончены», – заявил Билли Бин, когда мы с ним обсуждали «Moneyball». В течение какого-то времени «Moneyball» представлял немалую угрозу для людей, имеющих отношение к игре. Казалось, что на кон поставлена их работа и уровень жизни. Однако новая жизнь так и не наступила – компьютеры не стали полноценной заменой скаутам. В действительности спрос на знание о том, какое будущее ждет различные категории бейсболистов (знание, получаемое либо из отчетов скаутов, либо из статистических систем типа PECOTA), все же значительно превышает предложение. Каждый раз, когда команда размышляет над тем, кого брать в состав, кого обменять на другого игрока или сколько заплатить за свободных игроков, на кону стоят миллионы долларов – и исход будущего чемпионата. И чтобы принять правильные решения, команды все активнее используют все имеющиеся в их распоряжении инструменты.
Информационная революция внесла существенный вклад в мир бейсбола, при том что во многих других областях ее результаты оказались значительно более скромными. И причина тому – присущая бейсболу уникальная комбинация быстро развивающихся техник, хорошо сбалансированной системы стимулов, жесткой конкуренции и наличия огромных массивов данных.
Но это не делает жизнь Бина легче. В разговоре со мной он выразил изрядную озабоченность тем обстоятельством, что другие команды смогли скопировать лучшие трюки A’s. Например, немногие команды в наши дни не понимают всей важности OBP[61] или пренебрегают ролью защиты – но при этом у большинства из них, как и прежде, гораздо больше денег, чем у A’s.
В таких высококонкурентных областях, как спорт, лучшие прогнозисты должны постоянно использовать новые методы. Нет ничего сложного в том, чтобы поставить себе цель «пользоваться неэффективностью рынка».
Вот почему эта книга обходит стороной быстрые и легкие решения, но и не приводит план поиска примеров такой неэффективности. Они не позволят вам понять, действительно ли вам удалось нащупать что-то свежее и интересное, или же вы забрели в тупик. Маловероятно, что вы натолкнетесь на идею, которую никто другой не обдумывал. А еще сложнее – на хорошую идею, – и даже когда вы на нее натолкнетесь, пройдет совсем немного времени, и ее кто-нибудь скопирует.
Вот почему эта книга не рассказывает о быстрых решениях, в основе которых лежат лишь небольшие корректировки, дающие возможность предсказывать будущее лучше конкурентов. Хорошие специалисты в области инноваций обычно обдумывают ситуацию и масштабно, и в деталях. Порой новые идеи можно найти именно в деталях и тонкостях проблемы, на которые не обращают внимания другие. А порой их можно найти, когда вы начинаете совершенно абстрактно и философски размышлять о том, почему мир устроен определенным образом и возможна ли альтернатива для доминирующей парадигмы. Но подобное мышление сложно обрести в тех условиях, в которых живут 99 % из нас. Привычные для нашей обычной жизни способы мыслить категориями и делать приблизительные выкладки порой приводят к тому, что мы упускаем из виду информацию, способную обеспечить нам конкурентное преимущество.
Главное, что здесь можно сделать, – это развивать инструменты и привычки, помогающие вам чаще находить идеи и информацию в нужном месте, и оттачивать навыки, необходимые как при поражениях, так и в победах.
Это сложная задача. Однако бейсбол остается необычайно плодородной почвой для множества новаторов. С момента дебюта PECOTA прошло десять лет, но после нее никакая другая столь же новаторская система так и не была создана. Однако наверняка появится кто-то, способный по-умному распорядиться данными Pitch f/x или же понять, каким образом совмещать количественные и качественные оценки результативности игрока. Все это обязательно произойдет, и произойдет быстрее, чем мы думаем, – возможно, уже тогда, когда будет печататься тираж этой книги.
«Сейчас в игру вступают люди с невероятно высокими интеллектуальными и творческими способностями, – рассказывал мне Бин. – Если бы я хотел получить свою работу десятью годами позже, то не дошел бы даже до стадии собеседования».
Moneyball умер; да здравствует Moneyball.
Глава 4
Вы столько лет говорили нам, что дождь – зеленый
Во вторник 23 августа 2005 г. самолет-разведчик ВВС США уловил признаки атмосферных возмущений над Багамами{237}. Члены экипажа наблюдали «несколько небольших воздушных вихрей», вращавшихся против часовой стрелки и перемещающихся с востока на запад – от просторов Атлантического океана в сторону США. Подобное изменение в движении ветра было сложно выявить на основании данных спутников или наземного наблюдения, однако постепенно все больше экипажей грузовых лайнеров стали докладывать о нем. Национальный Центр слежения за ураганами (NHC) посчитал, что собрал достаточно свидетельств, чтобы охарактеризовать это явление как тропический циклон, получивший название «Тропическая депрессия 12»[62]. Это был «коварный» шторм, способный как развиться в нечто более серьезное, так и просто исчезнуть без следа. Примерно половина всех тропических депрессий в Атлантическом бассейне со временем перерастает в ураганы{238}.
Однако эта депрессия быстро набирала силу, и уже днем в среду на основе компьютерных расчетов в соответствии с одной из моделей Центр слежения за ураганами прогнозировал двойной удар по побережью Соединенных Штатов: один ударит по побережью южной Флориды, а второй может принять форму «циклона, движущегося в направлении к Новому Орлеану»{239}. Но шторм набрал достаточно силы, чтобы стать ураганом, и ему было присвоено имя «Катрина»{240}.
«Катрина» сначала пронеслась над территорией к северу от Майами, а через несколько часов обрушилась на национальный парк Эверглейдс во Флориде в виде урагана категории 1. Но этот ураган продолжался не так долго, чтобы угрожать множеству жизней, но не был и настолько длительным, чтобы растерять свою энергию. Напротив, «Катрина» набирала силу в теплых водах Мексиканского залива. Уже через несколько часов утром в субботу прогноз стал менее благоприятным: «Катрина» превратилась в ураган категории 3 и имела немалые шансы стать ураганом категории 5. Ее прогнозируемая траектория постепенно смещалась в западном направлении, в сторону от Пэнхэндла[63] во Флориде к Миссисипи и Луизиане. Теперь все компьютерные модели предрекали одно и то же: шторм начал угрожать Новому Орлеану{241}.
«Насколько я помню, после удара “Катрины” я участвовал в пяти слушаниях в Конгрессе», – рассказывал Макс Мэйфилд, бывший директором Центра в тот период, когда этот ураган достиг побережья. Во время нашей беседы я попросил его вспомнить, когда он впервые осознал весь масштаб угрозы. «Один из конгрессменов спросил меня, когда я впервые начал беспокоиться о Новом Орлеане, а я ответил ему “Шестьдесят лет назад”».
Сильный ураган, обрушивающийся на Новый Орлеан, – самый страшный кошмарный сон любого синоптика. В городе имелись идеальные условия, позволяющие привести к разрушениям и массовой гибели людей. С одной стороны, географическое положение – Новый Орлеан скорее не граничит с Мексиканским заливом, а утопает в нем. Основная масса горожан проживала в помещениях, расположенных ниже уровня моря, и полагалась на устаревшую систему дамб и природных барьеров, которые постепенно смывались морем{242}. С другой стороны, существует проблема, связанная с определенным типом культуры жителей Нового Орлеана. Они многое делают хорошо, но есть две вещи, которые они с гордостью отказываются делать: они никогда не двигаются быстро и не особо доверяют властям. В противном случае это просто был бы не Новый Орлеан. И, конечно, если бы не эти обстоятельства, город куда лучше подготовился бы к встрече с «Катриной», поскольку именно на эти обстоятельства стоит обратить внимание, когда возникает угроза урагана.
Национальный Центр слежения за ураганами уточнил свой прогноз, касающийся «Катрины»; ему удалось рассчитать возможность удара по городу почти за пять дней до разрушения дамб. Центр посчитал, что развитие ситуации по достаточно кошмарному сценарию вполне вероятно, причем уже через 48 часов. 20 или 30 лет назад столь заблаговременное предупреждение вряд ли было возможным, и в итоге удалось бы эвакуировать значительно меньше людей. Прогноз Центра и постоянные улучшения качества прогнозирования погоды за последние десятилетия, вне всякого сомнения, помогли спасти множество жизней.
Однако к прогнозам центра прислушались далеко не все. Примерно 80 тысяч жителей Нового Орлеана{243} – почти пятая часть населения города в то время – не смогли эвакуироваться, и 1600 из них погибли. Опросы выживших показали, что около двух третей из них не думали, что шторм будет настолько сильным{244}. Другие были в замешательстве от того, как осуществлялась эвакуация. Мэр города Рэй Нейгин ждал почти 24 часа, прежде чем объявил об обязательной эвакуации, несмотря на обращения Мэйфилда и других официальных лиц. Тем не менее некоторые жители – бедные, пожилые или не имевшие доступа к новостям – не могли покинуть город, даже если бы и захотели.
Прогнозирование погоды – одна из историй успеха, о которых рассказывает книга. Именно в этой области человек и машина способны объединить усилия, чтобы понять всю сложность окружающей природы, а то и предвидеть ее поведение. Однако тот факт, что мы можем порой предсказать поведение природы, совсем не означает, что мы можем его изменить. Кроме того, прогноз не имеет никакого смысла, если его никто не хочет слушать. История «Катрины» – это история человеческой изобретательности и человеческих ошибок.
Прогноз погоды от суперкомпьютера
Суперкомпьютеры лаборатории Национального центра атмосферных исследований (NCAR), расположенного в Булдере, штат Колорадо, создают, по сути, свою собственную погоду. Они сильно нагреваются и излучают тепловую энергию – 77 трлн вычислений, которые ежесекундно делает суперкомпьютер IBM Bluefire, вызывают значительное потепление. Они создают ветер – поскольку у страны должна всегда оставаться способность прогнозировать погоду, компьютеры нужно охлаждать, и поэтому вокруг компьютеров установлено несколько мощных вентиляторов высокого давления, постоянно обдувающих их потоком кислорода. Они настолько шумные, что в комплект спецодежды сотрудников ввели стандартные средства защиты слуха.
Bluefire разделен на 11 секций высотой примерно по 2,5 м и шириной около 50 см, по бокам каждой из которых тянется ярко-зеленый шлейф. Сзади эти шкафы напоминают типичный суперкомпьютер, каким мы его себе представляем – масса переплетенных кабелей и синих огоньков, мерцающих в «мозге» машины. Спереди же по форме и размерам они напоминают портативные туалеты, а сходство лишь усиливается благодаря двери с серебряной ручкой.
Я говорю об этом доктору Ричарду Лофту, директору NCAR по технологическому развитию, контролирующему работу суперкомпьютерной лаборатории. Метеорологи привыкли к подобному юмору. Ларри Дэвид в своем шоу Curb Your Enthusiasm («Умерь свой энтузиазм») уверяет, что метеорологи иногда предсказывают дождь, когда его не ожидается, просто для того, чтобы занять лучшие места на поле для гольфа{245}. Политические рекламные ролики часто используют погодные метафоры для атаки на своих оппонентов{246}, заявляя, к примеру, что оппоненты переменчивы, как мнение метеорологических центров. Большинство людей полагает, что специалисты по прогнозированию погоды плохо делают свою работу.
Крайне забавно разглядывать ряды жужжащих компьютеров и думать: неужели все это бесполезно? Неужели все эти сложные устройства придуманы, чтобы предсказывать? И неужели, несмотря на всю свою сложность, они так и не могут сказать нам, будет ли завтра дождь?
Лофт не удивлялся моим вопросам. Увеличение мощности компьютеров никоим образом не улучшило качество прогнозирования землетрясений или процессов в экономике. Однако в метеорологии наметился значительный и даже примечательный прогресс. И во многом он был вызван именно ростом мощности суперкомпьютеров Лофта.
Очень короткая история прогнозирования погоды
«Позвольте мне отклониться от обычного повествования, – сказал мне Лофт, сидя в своем офисе. Оказалось, что он обладает чувством юмора – необычным и неординарным, чем-то напоминавшим героя сериала “Офис” Двайта Шрута[64]. По его словам, с самых древних времен человек пытался предсказать поведение окружавшей его среды. – Вы едете в каньон Чако или Стоунхендж и понимаете, что люди каким-то образом поняли, что могут предвидеть наступление и самого короткого, и самого длинного дня в году. Движение Луны по небу предсказуемо. Однако есть вещи, предсказать которые древним людям было не под силу: внезапное нападение хищного зверя, наводнение или гроза».
В наши дни мы принимаем как данность то, что можем прогнозировать местность, на которую через несколько дней обрушится ураган, однако метеорология довольно поздно развилась в успешную науку. На протяжении столетий в этой области почти не было никакого прогресса. Вавилоняне, знаменитые астрономы, создавали прообразы прогнозов и фиксировали их на каменных табличках уже более 6000 лет назад{247}. Однако в конечном итоге они сдавались на волю бога дождей Нингирса. Аристотель написал трактат о метеорологии{248} и даже выдвинул несколько интересных догадок, однако в целом эта часть его деятельности была довольно слабой. Лишь в последние 50 лет, когда существенно выросла мощность вычислительных машин, появилась возможность для реального прогресса.