Hello World. Как быть человеком в эпоху машин Фрай Ханна
Однако Герри проанализировал статистику преступлений в своей родной стране и понял, что это не так. Он увидел, что в любом уголке Франции складывалась характерная картина преступности – какие правонарушения совершались, как, а главное, кем. Закон чаще нарушали молодые, чем старые, мужчины чаще, чем женщины, бедные чаще, чем богатые. Очень быстро обнаружился любопытный факт – эти характерные картины не менялись со временем. Криминальная статистика в каждой области год за годом повторялась с весьма незначительными вариациями. Количество ограблений, изнасилований и убийств воспроизводилось из года в год с пугающей точностью. Можно было предсказать даже то, каким способом будет совершено убийство. Значит, Герри и его коллеги могли дать достаточно точный прогноз – сколько человек в таком-то году будет убито ножом, саблей или камнем и сколько будет задушено или утоплено в той или иной области[294].
Возможно, в конечном итоге свободный выбор преступника тут не играет большой роли. Преступность не носит хаотичный характер: люди предсказуемы. И вот спустя два столетия после открытия Герри Ким Россмо решил, что надо отталкиваться от этой самой предсказуемости.
Герри исследовал картины преступности на уровне страны в целом и ее провинций, но оказалось, что даже на индивидуальном уровне люди, совершая преступления, создают достаточно информативные карты. Преступники, как и мы все, обычно привязываются к хорошо знакомым районам. Они действуют в определенной местности. Следовательно, даже самые тяжкие правонарушения, скорее всего, произойдут неподалеку от места жительства тех, кто их совершит. И если постепенно удаляться от места преступления, шансы найти дом, где обитает правонарушитель, будут неуклонно уменьшаться[295] – в криминологии известно это явление ослабления связей на расстоянии.
С другой стороны, вряд ли серийный преступник станет выискивать себе жертву в непосредственной близости от места своего жительства, чтобы не привлекать к своему дому внимания полиции и чтобы его не узнали соседи. Таким образом, вокруг его дома остается, так сказать, зона безопасности, где преступление крайне маловероятно[296].
Программа, которую разработал Россмо, основана на этих двух ключевых топографических факторах – ослаблении связей на расстоянии и зоне безопасности, характерных для географии большинства тяжких преступлений. Отметив места злодеяний булавками на карте, Россмо понял, что можно связать два главных условия математической формулой и примерно обозначить район, где мог бы проживать подозреваемый.
Если совершено одиночное преступление, эта схема мало чем поможет. Без достаточного объема информации, за которую можно было бы зацепиться, от так называемого алгоритма геопрофилирования будет не больше толку, чем просто от здравого смысла. Но если рассматривать несколько преступлений, появляются более конкретные идеи, и на карте города постепенно вырисовываются зоны, где вероятность выследить злоумышленника выше всего.
Серийный преступник действует примерно по тому же принципу, что и вращающийся дождеватель. Нельзя сказать, где маньяк нападет на свою жертву в следующий раз, как невозможно указать и точки падения капель воды. Но если поливочная система уже успела поработать и на землю попало множество капель, по мокрым пятнам нетрудно определить, где примерно установлен дождеватель.
Точно так же устроена программа, которую Россмо разработал для выслеживания серийного насильника – операции “Рысь”. На тот момент полицейским были известны пять разных мест нападений и в придачу несколько адресов, где преступник покупал спиртное, сигареты и видеоигры, расплачиваясь крадеными банковскими картами. Уже по этим локациям алгоритм вычислил два основных района предположительного проживания насильника – окраины Лидса Миллгарт и Киллингбек[297].
В оперативном штабе по расследованию нашлась еще одна важная наводка: неполный отпечаток пальца, когда-то давно оставленный насильником на месте преступления. Для автоматической системы идентификации отпечатков пальцев, которая могла бы прогнать этот образец по своей базе данных осужденных преступников и найти точное соответствие, он был слишком мал – пришлось бы эксперту вооружиться лупой и кропотливо, самым внимательным образом изучить все отпечатки один за другим. К тому моменту расследование длилось уже почти три года, и, несмотря на все усилия ста восьмидесяти сотрудников пяти подразделений полиции, дело стало зависать. Все дорожки вели в никуда.
Следователи приняли решение проверить вручную все отпечатки пальцев, добытые в тех двух районах, которые выделил компьютер. Начали с Миллгарта, но исследование картотеки с отпечатками пальцев в местном отделении полиции не дало результата. Перешли к Киллингбеку, и после девятисот сорока часов работы с архивом наконец узнали имя – Клайв Баруэлл.
Сорокадвухлетний Клайв Баруэлл имел жену и четверых детей, а в промежутке между своими нападениями успел отсидеть в тюрьме за вооруженное ограбление. Теперь он работал дальнобойщиком и по роду своей деятельности постоянно колесил по стране. Но жил он в Киллингбеке, а в Миллгарт частенько наведывался к матери – эти два района и отметил алгоритм[298]. По одному только фрагменту отпечатка нельзя было с уверенностью идентифицировать его, но проведенный впоследствии тест ДНК подтвердил, что все эти чудовищные преступления на его совести. Полиция нашла, кого искала. В октябре 1999 года Баруэлл предстал перед судом. Ему назначили восемь пожизненных сроков подряд[299].
Когда все закончилось, Россмо смог проанализировать работу своей программы. Она не назвала имени Баруэлла, но показала на карте районы, которыми полиции следовало заняться. Если бы в распоряжении полицейских был алгоритм, который позволил бы им на основании места жительства подозреваемых расположить их в приоритетном порядке для проверки отпечатков пальцев и проб ДНК, они доставили бы гораздо меньше неудобств ни в чем не повинным гражданам. Для того чтобы выследить Клайва Баруэлла, достаточно было бы обработать данные трех процентов жителей района[300].
Алгоритм, безусловно, оказался эффективным. Нашлись у него и другие достоинства. Ему несвойственны те перекосы, о которых шла речь в главе “Правосудие”, потому что он всего лишь упорядочивает имеющийся список имен. Кроме того, он не может поставить под сомнение продуктивную разыскную работу или забрать себе слишком много власти, а просто повышает КПД расследования, поэтому вряд ли окажется, что ему будут чересчур доверять.
Вдобавок это чрезвычайно гибкий алгоритм. После операции “Рысь” его использовали больше трехсот пятидесяти агентств по борьбе с преступностью во всем мире, в том числе американское ФБР и Королевская канадская конная полиция. Его аналитические функции применимы далеко не только к расследованию преступлений – та же программа помогла по карте очагов вспышек малярии в Египте выявить стоячие водоемы, в которых расплодились комары[301]. Один из моих аспирантов в Университетском колледже Лондона, зная, где применялись самодельные бомбы, пытается с помощью той же программы выяснить, где их изготавливают. А группа лондонских математиков даже попробовала выследить неуловимого художника стрит-арта Бэнкси по расположению его граффити[302].
Слава богу, такие преступления, как серийные нападения с применением насилия, изнасилования и убийства, когда геопрофилирование оказывается особенно эффективным, происходят не каждый день. На самом деле великое множество правонарушений не требует такой специфической методики розыска, как в деле Клайва Баруэлла. Для того чтобы алгоритмы умели расследовать разными методами не только особо тяжкие преступления, им понадобились бы различные исходные географические данные. Нужно было бы дать им представление обо всем городе в целом. Характерную картину для каждой улицы и каждого закоулка – тот ритм жизни, который любой патрульный чует нутром. Джек Мейпл, по счастью, располагал такими данными.
Карты будущего
В восьмидесятых годах прошлого века надо было дважды подумать, прежде чем воспользоваться нью-йоркским метро. Неуютно там было. Стены размалеваны, вагоны пропахли застарелой мочой, платформы усеяны шприцами, того и гляди ограбят. Ежегодно в метро жертвами убийц становились в среднем двадцать ни в чем не повинных человек – в этом подземном мире вы чувствовали себя, словно в каком-нибудь неблагополучном районе.
В это неспокойное время Джек Мейпл служил в полиции. Только недавно его повысили до лейтенанта транспортной полиции, и за годы службы ему порядком надоело лишь реагировать на правонарушения, тогда как надо было бы бороться за снижение уровня преступности. Состояние неудовлетворенности привело к рождению блестящей идеи.
“Я вычертил на стене в пятьдесят пять футов все станции нью-йоркского метро и все до единого поезда, – рассказывал Мейпл в интервью в 1999 году. – Потом цветными карандашами отметил все места тяжких насильственных преступлений, крупных краж и ограблений. Отметил раскрытые и нераскрытые преступления”[303].
Казалось бы, ничего особенного, но карты, нарисованные на оберточной бумаге цветными восковыми карандашами, для своего времени оказались новаторскими и получили название “Карт будущего”. Никто до сих пор не пробовал взглянуть на преступность под таким углом. Но когда Мейпл отступил на несколько шагов назад и окинул взглядом весь криминальный город, ему стало ясно, что он видит картину совершенно в новом ракурсе.
“Возникает вопрос: почему? – сказал он. – По каким таким причинам в некоторых районах преступления идут одно за другим?” В те годы каждый звонок в полицию обрабатывался как отдельный инцидент. Если вы позвонили в полицию и сообщили, что поблизости устроили разборки наркодилеры, но, завидев полицейского, те быстренько смылись, никто не пытался уловить связь между вашей жалобой и другими сигналами, поступившими оттуда, куда они переместились. А по картам Мейпла можно было точно указать те места, где сложилась криминогенная обстановка, то есть он мог приступить к разбору причин. “В этом районе есть торговый центр? Не потому ли здесь происходит столько карманных краж и ограблений? А школа? Возможно, поэтому в три часа начинаются всякие неприятности? Нет ли где-то рядом заброшенного дома? Не потому ли тут процветает торговля наркотиками?”[304]
Анализ этих вопросов позволил начать борьбу с преступностью в городе. Поэтому в 1990 году, когда нью-йоркскую транспортную полицию возглавил Билл Браттон, человек прогрессивно мыслящий, Мейпл показал ему свои “Карты будущего”. С их помощью они вместе решили сделать так, чтобы в метро всем стало спокойнее[305].
Браттон высказал свою собственную отличную идею. Он понимал, что нормальной работе подземки очень мешают попрошайки, скачущие через турникеты “зайцы” и те, кто справляет в метро нужду. Приоритетными в работе полиции для Браттона стали не ограбления и убийства, хотя серьезных преступлений в подземке тоже хватало, а эти мелкие правонарушения.
В его решении была двойная логика. Во-первых, если все антиобщественные явления в самых неблагоприятных районах жестко пресекаются, общество получает четкий сигнал о недопустимости криминальных действий любого рода, и есть надежда изменить ситуацию, которую люди привыкли считать “нормальной”. Во-вторых, среди безбилетников гораздо чаще попадаются уголовники, способные на более тяжкие преступления. Если задержать их при попытке пройти в метро без оплаты, у них не будет такого шанса. “Мы прижали безбилетников и таким образом сумели остановить опасных вооруженных преступников уже у турникетов, раньше, чем они могли попасть в метро и устроить там погром”, – сказал Браттон газете Newsday в 1991 году[306]. Стратегия оказалась успешной. Полицейский контроль становился более продуманным, а метро – более безопасным. С 1990 по 1992 год благодаря картам Мейпла и тактике Браттона число тяжких преступлений в метро уменьшилось на 27 %, а серьезных краж – на треть[307].
Заняв пост комиссара Полицейского управления Нью-Йорка, Браттон прихватил с собой “Карты будущего”. Их доработали и модифицировали в программу CompStat – инструмент для обработки потока данных, которым сейчас пользуются в полицейских управлениях как в США, так и за их пределами. В основе программы лежит все тот же простой принцип Джека Мейпла – для того чтобы выявить самые горячие точки города, надо зафиксировать места, где были совершены преступления.
Как правило, в городе можно отчетливо выделить горячие точки. Так, одно исследование, которое проводилось в Бостоне и охватывало период продолжительностью двадцать восемь лет, показало, что 66 % уличных ограблений происходили всего на 8 % улиц[308]. В другой работе приводится карта Миннеаполиса с отмеченными на ней адресами, откуда поступали звонки в полицию – половина из трехсот тысяч оказалась сосредоточена на трех процентах территории города[309].
Однако эти горячие точки не всегда остаются на месте. Они непрерывно, день ото дня, мигрируют, слегка смещаясь и видоизменяясь подобно пятнам бензина на поверхности воды. И в 2002 году, уже в Лос-Анджелесе, Браттон задумался: а нет ли других закономерностей, по которым можно было бы предсказать не только где будет совершено преступление, но и когда? Нельзя ли расширить рамки и заняться не только уже совершенными правонарушениями? Можно ли прогнозировать действия преступников, а не пресекать их на месте или расследовать уже случившиеся происшествия, что приводило в отчаяние Мейпла?
Флажок и буст
Когда речь заходит о прогнозировании преступности, лучше всего начать с ограбления домов. Домовые кражи совершаются по определенному адресу, поэтому, в отличие, скажем, от карманной кражи, точно известно, где именно произошло преступление. И вообще, пропажу мобильного телефона потерпевший может и не заметить, пока не придет домой. К тому же люди обычно сообщают об ограблении, что позволяет собрать достаточно подробную информацию – например, для правонарушений с наркотиками это сделать значительно труднее. Важно и то, что во многих случаях хозяева дома могут с уверенностью назвать время кражи (допустим, когда они были на работе или ушли куда-то вечером) – таких же данных для вандализма вам никто не сообщит.
У взломщиков есть нечто общее с серийными убийцами и насильниками, подопечными Россмо, – и те, и другие предпочитают действовать в знакомых районах. Теперь уже известно, что более вероятно быть ограбленным на той дорожке, по которой вор ходит регулярно – возможно, на работу или в школу[310]. Мы[311] знаем также, насколько оживленные улицы выбирают преступники – предпочитая “золотую середину”, они обходят стороной главные магистрали с плотным трафиком, но чувствуют себя как дома там, где можно затеряться среди случайно попавших сюда беззаботных прохожих, – конечно, при условии, что на каждом углу не дежурят бдительные местные жители, которым до всего есть дело.
Но это лишь первое из двух достоинств вашего дома в глазах грабителя. Конечно, существуют постоянно действующие факторы, такие как район проживания и степень оживленности улицы, и воры всегда будут слетаться на эти “флажки”. Но, прежде чем продавать дом и очертя голову бежать в тихую гавань, где каждая дверь контролируется соседями, подумайте о том, что криминогенные горячие точки города тоже нестабильны. Возможно, второй признак вашего дома, который сулит удачу взломщику, даже более важен. Этот фактор зависит от того, что происходит в вашей округе в настоящее время. Это называется “буст”[312].
Если с вами случалось такое, что к вам вламывались дважды за короткий промежуток времени, эффект буста должен быть вам до боли знаком. Когда вас ограбят впервые, полицейские объяснят вам, что воры любят возвращаться – то есть для вас риск выше всего вскоре после первого их визита, независимо от того, где вы живете. Действительно, в этот период шансы быть ограбленным возрастают в двенадцать раз.
Непрошеные гости возвращаются по нескольким причинам. Возможно, они уже знают, как расположены комнаты и где вы держите дорогостоящие вещи (к тому же телевизоры и компьютеры довольно быстро вновь появляются в доме), какие у вас замки, знают пути отхода, а может быть, в прошлый раз им не удалось вынести что-то особенно ценное, но они положили на это глаз. Так или иначе, эффект буста сказывается не только на вас. Исследователи выяснили, что и для ваших соседей вероятность ограбления повышается сразу после того, как наведались к вам, – равно как и для их соседей, соседей их соседей и дальше по всей улице.
Очаги преступности вспыхивают и разгораются по всему городу, словно фонтаны фейерверка. Чем дальше от эпицентра, тем слабее огни; со временем они вовсе затухают и месяца через два гаснут вовсе – если только новое ограбление не встряхнет ту же улицу[313][314].
Явление флажка и буста в преступности сродни природному явлению – землетрясению. Где и когда начнутся толчки, предугадать невозможно – хотя и известно, что в одних районах это более вероятно, чем в других. Но как только земля дрогнет, можно выдвигать обоснованные предположения о месте и времени следующих толчков, при этом более всего подвержена риску зона эпицентра, а по мере удаления от него вероятность повторных подземных ударов постепенно снижается и приходит в норму с течением времени.
Впервые аналогию между землетрясениями и ограблениями провели при Браттоне. Полицейское управление Лос-Анджелеса, всячески стараясь найти способ прогнозирования преступности, начало сотрудничать с математиками из Калифорнийского университета, и ученые получили для анализа всю информацию, какая имелась в распоряжении полиции, – о тринадцати миллионах правонарушений, совершенных за восемьдесят лет. К тому времени криминологи уже несколько лет знали о теории флажка и буста, но специалисты из Калифорнийского университета впервые в процессе изучения закономерностей криминального мира поняли, что красивые математические формулы, по которым составляются прогнозы сейсмической активности и повторных толчков, можно применить к прогнозированию как первичных, так и вызванных первичными преступлений. И это справедливо не только для ограблений со взломом. Был предложен способ прогнозирования любых правонарушений – хоть угона машин, хоть вандализма и насильственных действий.
Встряска получилась основательная. По этим формулам можно было не просто высказать расплывчатое предположение, что в районе недавно совершенного ограбления риск рецидива повышается, а дать количественную оценку этого риска для каждой отдельно взятой улицы. А если вы предполагаете с высокой степенью уверенности, что в ту или иную ночь грабители посетят тот или иной район, легко написать программу, которая подскажет полиции, где стоит сосредоточить свои силы.
Так появилась программа PredPol (PREDictive POLicing) – “Прогностическая правоохрана”.
Типстер-криминолог
Очень может быть, что программа PredPol вам где-нибудь встречалась. С тех пор как ее начали применять в 2011 году, ей посвятили тысячи публикаций в СМИ – обычно под заголовками, отсылающими к фильму “Особое мнение” с Томом Крузом в главной роли. PredPol среди прочих программ уже как Ким Кардашьян – знаменита на весь мир, журналисты без конца перемывают ей косточки, но никто толком не знает, чем она занимается.
Поэтому я хотела бы несколько умерить ваши ожидания, прежде чем вы подумаете о провидицах, которые плавают в бассейне и выкрикивают предсказания. PredPol никого не выслеживает, пока преступление не совершено. Эту программу вообще интересуют не люди, а географические данные. Да, я вольно употребила слово “предсказание”, но вообще-то алгоритм не может предвидеть будущее. Это не магический кристалл. Он не дает прогноз для происшествий, а только оценивает их потенциальный риск – вроде небольшая разница, но очень существенная.
Представьте себе алгоритм в роли букмекера. Если полицейские встанут перед картой города и сделают ставки на то, где ночью будут совершены преступления, PredPol рассчитает их шансы на выигрыш. Он действует, как типстер на скачках, профессиональный прогнозист, – высвечивает на карте города красными квадратиками “фаворитов” нынешнего вечера среди улиц и районов.
Вопрос в том, оправдает ли “надежды” фаворит нашего советчика. Чтобы проверить проницательность алгоритма[315], ученые провели два независимых эксперимента – состязания программы с лучшими аналитиками из криминальной полиции на юге Англии, в графстве Кент, и в Юго-западном дивизионе полиции Лос-Анджелеса. Это был честный поединок. Алгоритму и человеку было предложено разместить на карте двадцать квадратиков, соответствующих ста пятидесяти квадратным метрам, и таким образом указать места, где, по их мнению, в ближайшие двенадцать часов с наибольшей вероятностью будут совершены преступления.
Прежде чем перейти к подведению итогов, надо отметить, что задача была поставлена довольно каверзная. Мы с вами, не зная почти ничего о криминальном ландшафте Кента и Калифорнии, скорее всего, не придумали бы ничего лучше, кроме как расставить квадратики наобум. Учтите, что они покроют ничтожно малую часть карты – для Кента всего одну тысячную всей территории[316] – и придется каждые двенадцать часов менять расстановку, начиная все сначала. При столь хаотичной игре можно надеяться, что наши с вами “прогнозы” сбудутся менее чем в одном случае из ста[317].
Специалисты справились гораздо лучше. Аналитик из Лос-Анджелеса сумел верно указать места совершения преступлений в 2,1 % случаев[318], а в Кенте его коллега выступил даже лучше, со средним результатом 5,4 %[319] – выдающееся достижение, если вспомнить, что территория Кента раз в десять больше Лос-Анджелеса.
Но алгоритм обошел их обоих. В Лос-Анджелесе он дал вдвое больше верных прогнозов для правонарушений по сравнению со своим живым соперником, а в Англии на одном из этапов эксперимента чуть ли не каждое пятое преступление происходило в зоне красных квадратиков, распределенных по карте математическими методами[320]. PredPol – не магический кристалл, но еще никто и никогда не мог так ясно предвидеть будущее в мире криминала.
Практическое применение прогнозов
Есть одна загвоздка. Компьютер более или менее хорошо предсказывает, где в ближайшие двенадцать часов кто-то нарушит закон, но полиция преследует несколько иную цель – сократить число правонарушений, которые могли бы произойти в ближайшие двенадцать часов. Допустим, алгоритм выдал свой прогноз – каковы ваши дальнейшие действия?
Вариантов несколько. В случае ограбления дома можно установить камеры видеонаблюдения или поставить живых детективов под прикрытием и поймать воров с поличным. Но, наверно, будет лучше для всех, если направить усилия на профилактику преступления. Что бы вы выбрали, если подумать? Заманить злодея в ловушку, став его жертвой? Или не стать жертвой ни при каких обстоятельствах?
Можно предупредить жителей данного района, что их дома под угрозой, посоветовать им сменить замки, установить охранную сигнализацию или выключатели с таймером, чтобы перехитрить жуликов – те решат, что дома кто-то есть, и пойдут дальше. В одном эксперименте, который провели в Манчестере в 2012 году, так и сделали[321], и количество ограблений уменьшилось более чем на четверть. Впрочем, есть один отрицательный момент: по расчетам исследователей, профилактика каждого взлома методом “защиты цели” обходится примерно в 3925 фунтов[322]. Попробуйте продать эту технологию Полицейскому управлению Лос-Анджелеса, которое ежегодно разбирается с пятнадцатью тысячами домовых краж[323].
Другой вариант, так называемая тактика “участковых полицейских”, или “полицейских на точках”, практически ничем не отличается от традиционного патрулирования.
“Раньше, – рассказывал мне бывший сотрудник лондонской полиции Стив Колган, – патрульные делили карту на куски, распределяли участки меж собой и обходили их. Тебе этот участок, тебе тот. Все просто”. Но, как подсчитали в одном британском исследовании, если полицейский обходит случайно выбранный на карте города участок пешком, можно надеяться, что один раз за восемь лет он окажется в радиусе ста метров от места грабежа[324].
По методу “полицейских на точках” патрульные отправляются в те “горячие точки”, которые выделил алгоритм. По-моему, этот метод без всякого преувеличения можно было бы назвать “полицейские на горячих точках”. Суть в том, что если полиция всегда на виду, в нужном месте и в нужное время, то шансы не допустить правонарушения существенно возрастают – уж по крайней мере, когда что-то случится, полицейские отреагируют незамедлительно.
В Кенте именно так и получилось. На втором этапе эксперимента в начале вечерней смены сержант печатал карту, на которой красными квадратами были размечены зоны риска на текущий день. Если все было тихо, полицейский патруль должен был приехать в ближайший такой квадрат, выйти из машины и обойти участок пешком.
В один из таких вечеров на той улице, где при других обстоятельствах патруля не оказалось бы, полицейские заметили женщину с ребенком, иммигрантку из Восточной Европы. Выяснилось, что с ней жестоко обращались дома, а ее ребенок буквально несколько минут назад подвергся сексуальным домогательствам. Дежуривший тогда сержант подтвердил, что “их нашли только потому, что PredPol отметил это место”[325]. Позднее той же ночью в том же районе арестовали подозреваемого.
В ходе испытаний методики “полицейских на точках” алгоритм спас не только эту мать с ребенком – в целом по Кенту преступность снизилась на 4 %. В США, где такой же эксперимент проводила сама компания PredPol, сообщалось о еще более значительном снижении преступности. В лос-анджелесском районе Футхилл за первые четыре месяца применения алгоритма было совершено на 13 % меньше преступлений, в то время как во всех других районах города, где полиция работала по привычной схеме, закон нарушался на 0,4 % чаще. В Алхамбре, пригороде Лос-Анджелеса, с января 2013 года, когда там внедрили эту программу, были достигнуты фантастические результаты: краж со взломом стало меньше на 32 %, а угонов – на 20 %[326].
Цифры эффектные, но на самом деле еще неизвестно, так ли велика заслуга программы PredPol. Тоби Дейвис, математик и криминолог из Университетского колледжа Лондона, сказал мне: “Возможно, [преступность] упала просто потому, что полицейских направили в какие-то районы, неважно, куда именно, и велели им вылезти из машин и прогуляться”.
Надо отметить еще один момент. Раз вероятность засечь правонарушение тем выше, чем усерднее вы его ищете, то журнал учета преступлений обновляется хотя бы потому, что полицейские выехали из участка. “Если полиция на месте, – объяснил Дейвис, – правонарушений регистрируется больше, чем могло бы при других условиях. Даже когда в двух разных местах совершается одинаковое количество преступлений, больше материалов полицейские соберут там, где они сами были, чем там, где их не было”.
Следовательно, тактика расстановки полицейских по точкам таит в себе одну большую потенциальную опасность. Выбирая районы для патрулирования на основании компьютерного прогноза, вы рискуете попасть в петлю обратной связи.
Предположим, в относительно бедном квартале изначально сложилась криминогенная обстановка – тогда алгоритм, наверное, предскажет рост преступности в этом районе. Туда направят больше полицейских, а стало быть, они зафиксируют больше правонарушений. Алгоритм даст еще более печальный прогноз, подтянут дополнительные силы полиции – и так далее. Этот замкнутый круг характерен скорее для попрошайничества, бродяжничества, мелкой наркоторговли и прочих правонарушений, типичных для бедных районов.
В Великобритании разные группы населения то и дело жалуются на недостаточный полицейский контроль на улицах, и, казалось бы, нечестно стягивать все силы полиции в определенные районы. Однако не все питают теплые чувства к полиции. “Можно понять тех, кого раздражает вид полицейского, расхаживающего у них под окнами, даже когда все спокойно, пусть он просто ходит взад-вперед, – говорит Дейвис. – По-хорошему, вы же имеете право на жизнь без неусыпного полицейского надзора, так чтобы полиция не давила на вас”.
Мне кажется, он прав.
Так вот, хороший алгоритм должен быть разработан с учетом привычных для полиции тактики и методик. По крайней мере, теоретически возможно сделать так, чтобы программу не влекло так неудержимо в какой-то один квартал, – скажем, чтобы она высылала наряды полиции как в районы высокого риска, так и туда, где риск поменьше. Однако PredPol – это частная собственность, людям со стороны программа недоступна, и никто не знает, как она работает, поэтому, к сожалению, нет никакой возможности узнать, предусматривает ли она уход от петли обратной связи – или, в более широком смысле, достаточно ли она объективна.
На рынке представлены и другие алгоритмы, кроме PredPol. Один из конкурентов – HunchLab, который собирает самую пеструю статистическую информацию: сведения о зарегистрированных преступлениях, звонки в полицию, данные переписи, а также совсем уж неожиданные параметры вроде фаз луны. В основе алгоритма HunchLab нет конкретной теории. Он не пытается дать ответ на вопрос, почему в одном районе преступления совершаются чаще, чем в других, – он просто отмечает найденные в данных закономерности. Благодаря этому он дает более достоверный прогноз для более разнообразных правонарушений, чем PredPol, который опирается на идею о создании преступниками географических паттернов; но, поскольку эта программа тоже защищена авторскими правами на интеллектуальную собственность, мы, как люди посторонние, не можем поручиться, что она ненароком не ущемит интересы какой-нибудь части общества[327].
Еще один закрытый алгоритм прогнозирования – Strategic Subject List (Стратегический список объектов наблюдения), который взяли на вооружение в Полицейском управлении Чикаго[328]. В этой программе используется принципиально другой подход. Ее задача – определить потенциальных участников перестрелок без учета географических данных. Исходя из различных условий, программа формирует “тревожный список” людей, которые, по ее версии, с наибольшей вероятностью в ближайшем будущем окажутся вовлечены в события с применением огнестрельного оружия, неважно, они будут стрелять или их подстрелят. Идея вполне здравая, ибо сегодняшняя жертва завтра легко может сама стать виновником преступления. И у этого алгоритма благородная цель – тем, кого он отметил, полицейские предлагают записаться на коррекционные программы, чтобы попытаться как-то изменить свою жизнь.
Впрочем, есть основания опасаться, что этот алгоритм не дает ожидаемого эффекта. Как показало недавнее исследование, проведенное некоммерческой организацией RAND Corporation, наличие фамилии в списке ничего не говорит о вероятности участия человека в перестрелке[329]. Однако повышает его шансы попасть за решетку. Исследователи предположили, что в любом инциденте со стрельбой те, кто оказался в поле зрения алгоритма, для полиции становятся подозреваемыми.
Алгоритмы прогнозирования полицейского контроля, несомненно, перспективны, и те, кто их разрабатывает, безусловно, честно делают свое дело с самыми лучшими намерениями. Но и беспокойство из-за возможной необъективности алгоритмов тоже оправдано. На мой взгляд, это слишком важные для справедливого общества вопросы, чтобы мы вот так просто поверили в добросовестное использование таких алгоритмов правоохранительными органами. На этом примере, одном из многих, видно, до какой степени нам необходимы независимые эксперты и контролирующие органы, которые гарантируют нам, что от алгоритма будет больше пользы, чем вреда.
При этом потенциальный вред кроется не только в прогнозах. Как мы уже не раз видели на других примерах, существует реальная опасность того, что под влиянием авторитета алгоритма некорректные результаты приобретут дополнительную весомость. А это может привести к самым неприятным последствиям. Слово компьютера – еще не истина в последней инстанции.
Кто ты, по-твоему?
Дело было в Южном Денвере, в 2014 году. Стив Талли мирно спал у себя дома, и вдруг раздался стук в дверь[330]. Стив открыл и увидел на пороге мужчину, который извинился за то, что случайно задел его машину. Незнакомец попросил Талли взглянуть на повреждения. Талли вышел. Но когда он присел на корточки, чтобы осмотреть переднюю дверь[331], взорвалась светозвуковая граната. Трое невесть откуда взявшихся парней в черных жилетах и шлемах повалили его на землю. Один из них наступил ему на лицо. Другой держал его за руки, а третий принялся избивать его прикладом винтовки.
Талли получил тяжелейшие травмы. Вечер закончился для него сильнейшим нервным потрясением, гематомами и переломом полового члена[332]. “Я и понятия не имел, что можно сломать пенис, – сказал он позднее корреспонденту интернет-издания The Intercept. – В какой-то момент я закричал, стал звать на помощь полицию. Потом понял, что копы уже здесь, они-то меня и лупят”[333].
Стива Талли арестовали по обвинению в ограблении двух местных банков. Во время второго ограбления пострадал полицейский – видимо, поэтому, полагает Талли, его задержание прошло так жестко. “Я сказал им, вы рехнулись! – вспоминает он, как орал на полицейских. – Вы взяли не того!”
Талли был прав. Его арест стал результатом поразительного сходства с человеком, которого искали на самом деле, – с настоящим преступником.
Сообщил полиции о Талли монтер, который увидел фотографии в местных новостях по телевизору, а потом выполнял какие-то работы в его доме, но в конечном счете с программой распознавания лиц работал специалист ФБР – это он изучил видеозапись, сделанную камерой наблюдения[334], и пришел к выводу, что “по-видимому, попавший в кадр подозрительный человек – Талли”[335].
У Талли было железное алиби, но из-за свидетельских показаний сотрудников ФБР на то, чтобы полностью восстановить его доброе имя, ушел год. При этом почти на два месяца, пока не появилось достаточно доказательств для его освобождения, его заперли в камере с самыми суровыми условиями. Он потерял трудоспособность, а к тому времени, когда его мучения закончились, – еще и работу, дом и возможность видеться с детьми. И все это – результат ошибочной идентификации личности.
Двойное видение
В наши дни работу полиции невозможно представить без алгоритмов распознавания лиц. Имея фотографии, видеосъемку и снимки, сделанные стереоскопическими камерами, эти алгоритмы найдут нужное лицо, измерят его характерные параметры, сравнят их с базами данных об уже известных лицах и таким образом определят личность человека на изображении.
В Берлине алгоритмы распознавания лиц, способные определить в толпе находящегося в розыске предполагаемого террориста, натаскивали на видеосъемке многолюдных вокзалов[336]. В США, в одном только штате Нью-Йорк, с 2010 года при содействии таких алгоритмов лишь за мошенничество и хищение персональных данных было арестовано четыре тысячи человек[337]. А курсирующие по английским дорогам фургоны, оснащенные камерами и похожие на модернизированные автомобили службы Google StreetView, автоматически сверяют ваше лицо с лицами из списка находящихся в розыске[338]. В июне 2017 года, в Южном Уэльсе одна из таких машин проехала мимо человека, на арест которого у местной полиции уже был ордер, и новая технология впервые успешно показала себя в деле[339].
Нередко от того, сумеем ли мы идентифицировать и опознать лицо, зависит наша безопасность. Но было бы рискованно полностью доверить решение этой задачи людям. Взять, к примеру, паспортный контроль. Как показало одно недавнее исследование с имитацией работы службы безопасности в аэропорту, профессионалы вроде бы с наметанным глазом в 14 % случаев – а это очень много – пропустили людей с фальшивыми документами, зато 6 % абсолютно законных паспортов не приняли по ошибке[340]. Не знаю, как на ваш взгляд, а по-моему, если подумать, сколько народу ежедневно пропускает аэропорт “Хитроу”, это не просто мелкое недоразумение.
Как мы еще увидим, алгоритмы распознавания лиц справляются со своей работой куда лучше людей. Но если они применяются в уголовном розыске, где ошибки могут привести к катастрофическим последствиям, перед нами встают очень серьезные вопросы. Для начала, легко ли перепутать одного человека с другим? И у многих ли где-то есть такие же опасные двойники, как у Стива Талли?
В 2015 году исследователи высказали мнение в одной работе, что вероятность существования человека, похожего на вас как две капли воды, крайне мала. Теган Лукас из Университета Аделаиды педантично сличала лица четырех тысяч человек на фотографиях по восьми параметрам и не смогла найти ни одного полного совпадения, на основании чего сделала вывод, что шансы встретить двух человек с абсолютно идентичными лицами не дотягивают до одного на триллион[341]. Если судить по этим расчетам, не скажешь, что Талли просто “малость не повезло”. С учетом того, что его уникальный злой двойник проживал в том же районе и оказался к тому же преступником, надо думать, в следующий раз другой невезучий парень влипнет в такую же кошмарную историю лишь через десятки тысяч лет.
Но у нас есть основания полагать, что эти цифры не суммируются механически. Представить себе, что где-то есть ваша точная копия, действительно нелегко, однако кое-какие отдельные факты подтверждают, что не состоящие в родстве “близнецы” встречаются в природе, и гораздо чаще, чем это следует из работы Лукас.
Один из примеров – Нил Дуглас, который направлялся в Ирландию, но обнаружил на своем месте в самолете свой дубликат. Их совместное селфи на фоне хохочущего салона моментально облетело соцсети, и вскоре Дуглас стал получать фото рыжих бородачей со всего мира, желавших присоединиться к компании близнецов. “Кажется, нас уже набралось на небольшую армию”, – сказал Нил в интервью BBC[342].
У меня даже есть собственная история на ту же тему. Когда мне было двадцать два года, кто-то из моих друзей показал мне картинку со страницы местной рок-группы в соцсети MySpace. На подборке фотографий с какого-то концерта, где меня не было, вовсю отрывались веселые люди, и одно лицо показалось мне до боли знакомым. Я написала на электронную почту солисту группы – хотела удостовериться, что я не забрела как-то ночью в бессознательном состоянии на мероприятие, о котором теперь ничего не помню, – и мои опасения подтвердились: не я, а мой клон, любительница синти-попа, отправилась в тот вечер на тусовку.
Итак, у Талли, Дугласа и у меня есть по меньшей мере по одной – а может, и больше – точной копии. Из семи с половиной миллиардов человек нас уже трое – и это только навскидку, – то есть гораздо больше, чем один на триллион, мы уже превысили оценочный результат Лукас.
Такое расхождение в оценках обосновано. Вопрос в трактовке учеными термина “идентичность”. По методике Лукас требовалось полное совпадение всех “мерок” двух разных людей. При всем невероятном сходстве Нила и его двойника, если их ноздри или мочки ушей различались хотя бы на миллиметр, строго говоря, по ее критериям их нельзя было считать двойниками.
Но даже если вы начнете сравнивать две фотографии одного и того же человека, точные измерения не покажут, как мы меняемся в течение жизни с возрастом, из-за болезни или усталости, не учтут выражение лица и его искажение в зависимости от ракурса съемки. Попробуйте зафиксировать до миллиметра все основные признаки, и вы увидите, что один и тот же человек имеет совершенно разные лица, словно совершенно разные люди. Проще говоря, нельзя отличить одно лицо от другого только по меркам.
Тем не менее охотно верю, что Нила Дугласа можно перепутать с его двойником, пусть они и не абсолютно идентичные близнецы. Как и в случае с Талли – бедняга Стив даже не был в той же степени похож на настоящего грабителя, и все равно эксперты из ФБР идентифицировали фото неверно, да так, что его обвинили в преступлении, которого он не совершал, и заперли в камеру самого строгого режима.
Офицеры паспортного контроля продемонстрировали нам, как легко принять на фотографии одного человека за другого, даже если они похожи лишь в общих чертах. На деле выяснилось, что опознать незнакомца нам не под силу. Именно по этой причине моя подруга, по ее собственному признанию, с трудом смогла досмотреть великолепный фильм Кристофера Нолана “Дюнкерк”: никак не могла понять, кто кого играет. По той же причине подростки “берут напрокат” у старших товарищей удостоверения личности и беспрепятственно покупают спиртное. И по той же причине американская юридическая некоммерческая организация The Innocence Project (Проект “Невиновность”) установила, что более 70 % необоснованных обвинительных приговоров выносится из-за ошибок свидетелей при опознании[343].
Однако, если свидетель запросто может обознаться, увидев Нила или его попутчика, то мать Нила, безусловно, найдет сына на фотографии с первого взгляда. Мы безошибочно узнаем лица наших друзей и близких, даже при наличии настоящих двойников – вы с большой вероятностью перепутаете однояйцевых близнецов, с которыми знакомы лишь шапочно, но тех, кого знаете хорошо, различите без труда.
Так вот в чем дело: сходство в глазах смотрящего. Если нет строгого определения для сходства, различия между лицами не поддаются измерению и нет того критического состояния, когда мы можем утверждать, что эти два лица идентичны. Невозможно точно сказать, что значит “двойник” и насколько типично данное лицо, а главное – невозможно точно оценить вероятность того, что лицо на двух картинках принадлежит одному и тому же человеку.
Значит, метод идентификации личности по лицу вовсе не аналогичен анализу ДНК, который уверенно опирается на надежную статистическую базу. При анализе ДНК в криминалистике профиль составляют по фрагментам генома, заведомо отличающимся у разных людей. Ключевой момент заключается как раз в степени различий – если в добытом на месте преступления биоматериале и в образце, взятом для анализа у подозреваемого, последовательности ДНК совпадают, то можно рассчитать вероятность того, что обе пробы получены из одного источника. Кроме того, можно сказать, с какой вероятностью по чистой случайности точно такая же последовательность ДНК в этих фрагментах окажется еще у какого-нибудь бедолаги[344]. Чем больше маркеров используется в экспертизе, тем меньше шансов ошибиться, поэтому в каждой стране судебная власть имеет полное право постановить, сколько генетических маркеров необходимо проверить, чтобы обеспечить необходимый и приемлемый для судей уровень достоверности[345].
Пусть даже нам кажется, что черты лица объективно связаны с личностью человека, без понимания тонких различий между людьми метод идентификации правонарушителей по лицам не имеет строгой научной основы. Что же касается опознания людей по фотографиям, то вот вам цитата из презентации, представленной криминалистами ФБР: “Из-за недостаточности статистических данных заключение носит исключительно субъективный характер”[346].
К сожалению, мы не можем решить эту проблему, попросив алгоритм провести опознание вместо нас, и, в частности, поэтому идентифицировать преступников с его помощью следует крайне осторожно. Как бы ни был точен алгоритм, сходство и идентичность – не полные синонимы и никогда ими не станут.
Осмотрительность в работе с алгоритмами распознавания лиц следует проявлять и по другой причине. Не так уж хорошо они различают лица, как вам, возможно, кажется.
Один на миллион?
Сами алгоритмы используют один из двух подходов. В первом строится объемная модель лица – либо наложением множества плоских изображений, либо с помощью сканирования лица специальной инфракрасной камерой. Так работают идентификаторы лица в айфонах. Такие алгоритмы научились уходить от трудностей, связанных с изменением выражения лица и старением, – для них важнее всего те зоны лица, где есть твердые ткани и кости, например, изгибы орбиты глаза и валика носа.
По заверениям Apple, шансы на то, что кто-нибудь взломает ваш айфон с помощью идентификатора лица, составляют один на миллион, однако алгоритм небезупречен. Его могут обмануть близнецы[347], родные братья и сестры[348], дети, стащившие родительский телефон. Так, вскоре после внедрения этой технологии появилось видео о десятилетнем мальчике, который легко справился с фейс-контролем маминого айфона. С тех пор его мама стирает не предназначенные для детских глаз сообщения[349]. Был случай, когда алгоритм ввела в заблуждение специально отпечатанная на 3D-принтере маска с инфракрасными наклейками вместо глаз[350]. Из всего этого следует, что алгоритм можно использовать для разблокирования телефона, однако это не самый надежный инструмент для доступа к банковскому счету.
При сканировании фотографий в паспорте и видеозаписей с камер наблюдения толку от 3D-алгоритмов не намного больше. Для этого понадобятся алгоритмы другого типа, которые проводят статистический анализ плоского изображения. Они не пытаются, как мы с вами, найти особые приметы, отличающие одно лицо от другого, а формируют статистическое описание распределения на картинке освещенных и затененных участков. Как в случае с алгоритмами распознавания собак из главы “Медицина”, ученые недавно пришли к выводу, что эффективнее предоставить алгоритму достаточно обширную подборку лиц и позволить ему самостоятельно, методом проб и ошибок, выбирать наиболее подходящие комбинации, а не надеяться на то, что люди найдут правильные варианты. Как обычно, это сделали с помощью нейросетей. Именно такие алгоритмы работают там, где в последнее время произошел качественный рывок в производительности и точности. Впрочем, производительность эта сопряжена с издержками. Не всегда можно точно понять, как именно алгоритм приходит к выводу, похожи два лица или нет.
Это означает, что даже такие ультрасовременные алгоритмы легко сбить с толку. Поскольку они составляют статистическое описание распределения света и тени на лице, достаточно надеть очки с оригинальной оправой и декором на стеклах, и алгоритм запутается. Более того, если разрисовать очки так, чтобы декор дал сигналы, схожие с чужим лицом, можно заставить алгоритм выдать решение, что вы и есть тот самый человек – парень на фото ниже воспользовался этим приемом, нацепив очки, в которых он выглядит в точности как Мила Йовович[351]. Очки для маскировки? Похоже, Кларк Кент что-то знал.
Оставим выходки с экстравагантными очками – возможности статистических алгоритмов в распознавании лиц были отмечены во множестве восторженных публикаций, и, в частности, на все лады расхваливали гугловский FaceNet. Чтобы проверить зоркость этого алгоритма, ему велели опознать 5000 лиц известных людей. Предварительно то же задание выполнили на отлично живые эксперты, которые угадали в 97,5 % случаев – что неудивительно, потому что известные всему миру лица участникам эксперимента тоже были известны[352]. Но FaceNet выступил еще лучше, добившись феноменальной точности 99,6 %.
Вроде бы выходит так, что в распознавании лиц машины превзошли человека. Казалось бы, при столь блестящих результатах мы с полным правом можем применять алгоритмы для опознания преступников. Однако тут кроется один подвох. На самом деле для тестирования алгоритма пять тысяч лиц – это очень мало. Когда его задействуют в борьбе с преступностью, ему придется выловить одно-единственное лицо не из нескольких тысяч, а из нескольких миллионов.
Ибо в базе данных британской полиции насчитывается девятнадцать миллионов лиц – изображений, созданных по фотографиям тех, кого арестовали по подозрению в совершении преступления. А вот ФБР располагает коллекцией в 411 миллионов изображений, и, по некоторым источникам, в нее входят лица половины взрослого населения Америки[353]. В Китае же, где база данных об удостоверяющих личность документах позволяет без труда получить сведения о миллиардах лиц, программы распознавания лиц уже получили мощную поддержку государства. На улицах, в метро и аэропортах – повсюду установлены камеры видеонаблюдения, от объективов которых не уйдет ни объявленный в розыск преступник, ни беспечный пешеход, гуляющий по городским улицам[354]. (Говорят даже, что всякие незначительные провинности вроде брошенного на улице мусора учитываются в рейтинге граждан, в системе Sesame Credit, – со всеми вытекающими последствиями для нарушителей порядка, о которых рассказывалось в главе “Персональные данные”.)
Возникает проблема: с ростом числа лиц в базе данных многократно увеличивается вероятность ошибочной идентификации. Чем больше лиц просматривает алгоритм, тем больше у него шансов отыскать два похожих. Поэтому, когда те же алгоритмы работают с более обширной подборкой изображений, их точность резко падает.
Допустим, мне дали десять удостоверений личности незнакомых людей и предложили сказать, которое из них чье; допустим, я прошла тест на отлично – стало быть, сумею узнать любого человека по изображению его лица, поэтому меня отправили в центр Нью-Йорка высматривать в толпе преступников, на которых имеется ориентировка. Очевидно, я не смогу продемонстрировать тот же высокий уровень точности.
То же самое происходит с алгоритмами. В 2015 году Вашингтонский университет провел конкурс MegaFace – специалистам со всего мира предложили протестировать свои алгоритмы распознавания лиц на базе данных объемом в миллион изображений[355]. Хоть и ближе к реальности, но существенно меньше, чем содержится в каталогах госорганов. И все равно алгоритмы выдержали экзамен не слишком успешно.
FaceNet компании Google, почти безупречно выполнивший задание со знаменитостями, показал неожиданно невысокий результат – идентифицировал верно всего лишь 75 %[356] изображений. Другие алгоритмы дали всего лишь 10 % верных ответов. На то время, когда писалась эта книга, чемпионом был китайский продукт Tencent YouTu Lab, точность которого в распознавании лиц составила 83,29 %[357][358].
Иными словами, если бы вы искали конкретных преступников в веренице миллионов цифровых изображений, то, судя по приведенным результатам, вы упустили бы каждого шестого – и это при самом благоприятном исходе.
Однако следует помнить, что эта область знаний стремительно развивается. Точность ответов неуклонно повышается, и как будут обстоять дела через годы или через несколько месяцев, никто не знает. Могу сказать лишь, что различные позы и внешний вид объектов, освещенность и качество изображения – все эти детали страшно усложняют создание надежного и точного инструмента для распознавания лиц. До идеальной точности поиска нужного лица среди четырехсот миллионов нам еще довольно далеко, и мы пока не можем найти того самого единственного на триллион, полностью идентичного двойника.
Подводим баланс
Факты удручающие, но это не повод опускать руки. Некоторые алгоритмы работают достаточно хорошо, чтобы их можно было использовать для определенных целей. Так, в канадской провинции Онтарио люди с игровой зависимостью добровольно записываются в черные списки казино. Если кому-то из них не хватит силы воли, алгоритм распознавания отметит лицо этого человека, и сотрудники казино вежливо попросят его удалиться[359]. Конечно, это несправедливо по отношению к тем, кому ни за что испортили вечер, хотя они просто хотели развлечься, но я убеждена в оправданности такой жертвы, если это помогает завязавшим игроманам бороться со старыми пороками.
Так и в розничной торговле. Офисы охраны в магазинах всегда были увешаны фотокарточками воришек – теперь, едва вы войдете в дверь, алгоритм сверит вашу личность с базой данных магазинных воров. Если ваше лицо совпадает с лицом уже засветившегося злоумышленника, дежурные сотрудники охраны получат на смартфоны сообщение и смогут выследить вас в проходах торгового зала.
У магазинов есть резон заинтересоваться такой технологией. Только в торговых заведениях Великобритании ежегодно совершается примерно 3,6 миллиона правонарушений, что наносит ретейлерам немалый ущерб – 660 миллионов фунтов[360]. А если принять во внимание, что в 2016 году в американских магазинах из-за насильственных действий погиб 91 подозреваемый в воровстве[361], то, пожалуй, для всеобщего блага лучше вовсе не пустить рецидивиста в магазин, прежде чем дело примет серьезный оборот.
Однако высокотехнологичные методы борьбы с магазинными ворами имеют свои недостатки, например, связанные с нарушением неприкосновенности частной жизни. Компания FaceFirst, один из главных поставщиков программного обеспечения для систем безопасности, утверждает, что не хранит фотографии постоянных покупателей, но, безусловно, магазины пользуются системой распознавания лиц для отслеживания наших трат. В связи с этим возникает вопрос, кто рискует попасть в черный список компьютера. Кто сказал, что в черный список всех заносят обоснованно? И как же презумпция невиновности, не пойман – не вор? Что станется с теми, чьи фамилии оказались в черном списке случайно, – как им избавиться от клейма? Опять же всегда есть шанс, что алгоритм, для которого стопроцентная точность просто недостижима, ошибется при опознании.
Вопрос в том, что перевешивает – плюсы или минусы. Простого ответа нет. Даже ретейлеры не могут прийти к единому мнению. Одни с энтузиазмом хватаются за новые технологии, другие стараются держаться от них подальше, и в числе последних сеть Walmart, чьи надежды на прибыль от инвестиций не оправдались, поэтому компания прекратила эксперимент FaceFirst в своих магазинах[362].
Но в сфере борьбы с преступностью, по-видимому, гораздо легче найти баланс пользы и вреда. В самом деле, далеко не только алгоритмы распознавания лиц стоят на шатком статистическом фундаменте. Никто не знает, какова вероятность ошибки в экспертизе отпечатков пальцев[363], следов укуса, разлета брызг крови[364] или в баллистической экспертизе[365]. По сообщениям Национальной академии наук США 2009 года, ни один из применяемых в криминалистике методов, кроме анализа ДНК, “не доказывает связи между уликами и данным человеком или источником”[366]. Тем не менее нельзя отрицать, что все эти методы подтвердили свою практическую ценность и важность для полицейского расследования – при условии, что полиция не придает полученным с их помощью доказательствам излишний вес. Пожалуй, если есть хоть малейший риск повторения дела Стива Талли, нельзя пользоваться несовершенной технологией, которая увеличит вероятность лишения человека свободы. Но все-таки подобные истории погоды не делают. Потому что при всех колоссальных минусах ловли преступников с помощью методов распознавания лиц у этих технологий есть еще и большие жирные плюсы.
Трудный выбор
В мае 2015 года по Манхэттену бегал человек с молотком и нападал на случайных прохожих. Сперва он подбежал к группе людей рядом с Эмпайр-стейт-билдинг и размозжил затылок двадцатилетнему парню. Спустя шесть часов он направился на Юнион-сквер и тем же молотком ударил в висок мирно сидевшую на скамейке женщину. Всего через несколько минут он объявился вновь – на этот раз его жертвой стала женщина тридцати трех лет, которая шла по улице вдоль парка[367]. Алгоритм распознавания лиц сумел идентифицировать его личность по видеозаписи с камеры наблюдения – это был Дэвид Бэрил, и за несколько месяцев до своей акции он выложил в Instagram фото забрызганного кровью молотка[368]. Его признали виновным в нападениях и приговорили к двадцати двум годам тюремного – заключения.
Некоторые считавшиеся безнадежными дела подняты из архивов тоже благодаря прогрессу в технологии распознавания лиц. В 2014 году алгоритм привел на скамью подсудимых американца, пятнадцать лет скрывавшегося под чужим именем. Нил Стаммер, обвиняемый в нескольких преступлениях, включая похищения и сексуальные домогательства к детям, сбежал из-под залога. После того как картинку с объявления ФБР о розыске сверили с базой паспортных данных и нашли в Непале человека с таким же лицом и паспортом, под фотографией в котором стоит другое имя[369], Стаммера арестовали снова.
Летом 2017 года во время теракта на Лондонском мосту погибли восемь человек, и теперь я понимаю, какую пользу могла бы принести система, использующая такой алгоритм. Одним из трех мужчин, направивших свой фургон на пешеходов, а затем устроивших резню на близлежащем рынке Боро, был Юссеф Загба. Его объявили в розыск в Италии как подозреваемого в терроризме, и алгоритм распознавания лиц мог бы изобличить его автоматически еще до того, как он попал в нашу страну.
Но как найти компромисс между правом на неприкосновенность частной жизни и на защиту общества, между справедливостью и безопасностью? Сколько Стивов Талли мы готовы отдать в обмен на быстрое обнаружение таких личностей, как Дэвид Бэрил и Юссеф Загба?
Давайте посмотрим статистику нью-йоркского полицейского управления. Сообщается, что в 2015 году в результате успешного опознания 1700 подозреваемых было произведено 900 арестов, при том что ошибочно опознали пять человек[370]. Как бы туго ни пришлось этим пятерым, вопрос остается открытым – устраивает ли нас такое соотношение? Та ли это цена, которую мы готовы заплатить за сокращение преступности?
Оказывается, алгоритм без изъянов, вроде алгоритма геопрофилирования Кима Россмо, который мы обсуждали в начале этой главы, – скорее исключение, чем правило. В борьбе с преступностью любой алгоритм, какой ни возьми, с одной стороны вселяет большие надежды, с другой – внушает сильную тревогу. PredPol, HunchLab, Strategic Subject Lists и алгоритмы распознавания лиц – все они сулят нам решение всех проблем и одновременно создают новые проблемы.
Насколько я могу судить, именно в сфере уголовного права, где само существование алгоритмических систем вызывает вопросы, на которые нет простых и ясных ответов, наиболее остро проявляется насущная потребность в их регулировании. Так или иначе, нам предстоит столкнуться с проблемой трудного выбора. Памятуя о том, что, когда собственники алгоритма передадут нам его, он может оказаться не столь прекрасным (а преступность может вырасти), – должны ли мы требовать применения только тех алгоритмов, в которых нам все понятно и в механизм которых мы можем вникнуть? Следует ли отказаться от математической системы, в которой технологически заложена необъективность или возможность ошибки, если мы понимаем, что при этом требуем от машины более высокого уровня, чем тот, что обеспечат нам люди? Когда необъективная система становится уж слишком необъективной? В какой момент потенциальные жертвы преступления станут вам дороже жертв алгоритма?
Отчасти вопрос сводится к тому, как мы, все общество в целом, представляем себе благополучие. Что для нас главное? Как можно более низкий уровень преступности? Или превыше всего свобода невиновных? В какой степени вы готовы пожертвовать первым ради второго?
Это очень хорошо сформулировал профессор социологии из Массачусетского технологического института Гэри Маркс в интервью газете Guardian: “В Советском Союзе в самые страшные годы тоталитаризма и диктатуры уличная преступность держалась на поразительно низком уровне. Но, боже правый, какой ценой?”[371]
Возможно, в конце концов мы захотим ограничить сферу деятельности алгоритмов. Придем к выводу, что не все поддается анализу и расчету. Что есть какие-то чувства, которые плохо укладываются в рамки уголовного права. Наверное, не потому, что алгоритмы их не испытывают. Просто потому, может быть, что некоторые вещи не входят в компетенцию равнодушной машины.
Искусство
Джастин пребывал в задумчивости. Четвертого февраля 2018 года он сидел в своей гостиной в Мемфисе, штат Теннесси, и смотрел по телевизору матч Суперкубка, поедая M&M’s. Неделю назад он отметил свой тридцать седьмой день рождения и теперь, по ставшей уже ежегодной традиции, размышлял о том, как сложилась его жизнь.
Джастин понимал, что вообще-то должен быть благодарен судьбе. Все у него шло как по маслу. Стабильная офисная работа с девяти до пяти, крыша над головой, семья, которая его любит. Но ему всегда хотелось чего-то большего. В юности ему казалось, что он создан для славы и удачи.
Как же так вышло, что он стал таким… нормальным? “Это все рок-группа, – подумал он. Где он стал играть в четырнадцать лет. – Если бы нас тогда заметили, все пошло бы по-другому”. Но они не добились успеха, неважно по какой причине. Бедняга Джастин Тимберлейк так и не увидел настоящего успеха.
Вконец расстроившись, он открыл еще одну банку пива и стал думать о том, что могло бы быть. Реклама в перерыве Суперкубка закончилась. Заиграла музыка, и началось грандиозное шоу. А в параллельной вселенной – точно такой же, за исключением одной мелочи – публика рукоплескала другому тридцатисемилетнему Джастину Тимберлейку из Мемфиса.
Много миров
Почему настоящий Джастин Тимберлейк так преуспел в жизни? И почему не преуспел другой Джастин Тимберлейк? Кто-то (в том числе и я в 14 лет[372]) сказал бы, что Джастин заслужил статус поп-звезды, что его одаренность, приятная внешность, способности к танцу и художественные достоинства музыки не могли не принести ему славу. Но кто-то возразил бы. Мог бы сказать, что ни Тимберлейк, ни любая другая поп-звезда, на которую молятся легионы фанатов, ничем особенно не выделяются. Талантливые люди, способные петь и танцевать, попадаются на каждом углу, а звезды – это те из них, кому просто повезло.
Конечно, утверждать ничего нельзя. Разве что вы создадите несколько параллельных миров, запустите в каждый из них по Тимберлейку, проследите за развитием всех инкарнаций и тогда увидите, везде ли Тимберлейк достигнет популярности. К сожалению, вряд ли многие из нас могут создать искусственную мультивселенную, но, если оставить Тимберлейка в покое и обратить внимание на менее известных музыкантов, можно заняться сравнительным анализом значимости везения и таланта для популярности хитов.
В этом и заключалась суть знаменитого эксперимента с несколькими цифровыми мирами, который поставили еще в 2006 году Мэтью Салганик, Питер Доддс и Дункан Уоттс. Ученые создали свой собственный онлайн-плеер наподобие интернет-сервиса Spotify, загрузили одни и те же 48 песен в исполнении неизвестных певцов на восемь параллельных музыкальных сайтов и рассредоточили по ним пользователей.
В “Музыкальную лабораторию”[373][374] заглянули 14 341 человек, и всем им предложили зарегистрироваться, прослушать все песни, оценить их, а те, что понравились больше всего, скачать.
Как и на настоящем Spotify, гости сайта могли посмотреть, что слушают другие “обитатели” того же “мира”. Помимо имени исполнителя и названия песни участники эксперимента видели, сколько раз уже скачали ту или иную запись в их ветке.
Сначала все счетчики выставили на ноль, но постепенно, по мере изменения суммарных показателей, становилось ясно, какие песни в каждой из восьми веток пользуются наибольшим успехом.
Вместе с тем, чтобы получить некую независимую оценку “истинной” популярности песен, экспериментаторы создали контрольный “мир”, где выбор слушателей не зависел от мнения других людей. Песни появлялись в случайном порядке, списком или в сетке, но статистика скачиваний не показывалась.
Результаты эксперимента оказались весьма любопытными. Какие-то песни с треском провалились во всех мирах. Другие шли впереди с большим отрывом – им в итоге отдали предпочтение везде, даже там, где слушатели не знали, сколько раз их скачивали. Но между абсолютными хитами и откровенными неудачами исполнители могли попасть буквально на любую строчку рейтинга.
Возьмем, к примеру, панк-группу из Милуоки 52Metro – посетителям одного мира их песня Lockdown очень понравилась, и в конце концов она заняла первое место, а в другом ее ожидало фиаско и сороковое место из сорока восьми возможных. Одна и та же песня, одни и те же соперники в списке; просто в этом отдельно взятом мире группа не набрала очки[375]. Иногда успех зависел от везения.
При том что конкурсантов вели к вершине разные дорожки, исследователи заметили, что слушатели скачивали записи гораздо охотнее, если знали, что они понравились еще кому-то. Случайно попав на верхние строки рейтинга, не самая удачная песня начинала быстро собирать голоса. Чаще скачивали то, что чаще скачивали. Популярность кажущаяся выливалась в самую настоящую, то есть конечный успех был просто приумноженной с течением времени случайностью.
Такие результаты можно объяснить. В психологии это называется социальным доказательством, или информационным социальным влиянием. Если нам не хватает информации, чтобы составить собственное мнение, мы нередко повторяем за другими. Поэтому в театрах иногда подсаживают в зрительный зал своих людей, чтобы они хлопали и смеялись в нужных местах. Услыхав рядом аплодисменты, мы, скорее всего, их поддержим. Что касается предпочтений в музыке, вам вовсе не обязательно захочется послушать то, что слушают другие, но популярность – это быстрая подсказка, которая гарантирует, что вы не обманетесь в своих ожиданиях. “Выбор чересчур широк, – сказал тогда Салганик интернет-журналу LiveScience. – Вы же не можете прослушать всё, поэтому самый рациональный путь – послушать то, что слушают все остальные”[376].
Во всех областях развлекательной индустрии популярность – это эквивалент качества. Так, в 2007 году в одном исследовании изучали, как влияло включение книги в топ-лист газеты New York Times на общественное мнение о ней. Алан Соренсен, автор исследования, проанализировал принципы рейтингового отбора и сравнил популярность книг, которые, судя по продажам, должны были бы попасть в топ-лист, но не попали из-за каких-либо задержек или по чистой случайности, с популярностью тех, что были отмечены газетой. Он заметил четкую корреляцию: одного только включения в топ-лист было достаточно, чтобы продажи книги повысились в среднем на 13–14 %, а для ранее не известных авторов – на 57 %.
Чем больше мы шарим по разным сайтам в поисках модных новинок – просматриваем топ-листы книг, рейтинги на Amazon, Rotten Tomatoes[377], хит-парады Spotify, – тем важнее становится для нас общественное мнение. Когда голова идет кругом от широчайшего выбора, эффект только усиливается, да и маркетинговые ходы, звездные имена, шумиха в прессе и обзоры критиков не проходят мимо нашего внимания.
Поэтому самая бездарная музыка может оказаться вверху чарта. И мой цинизм тут ни при чем. Рассказывают, что в девяностых годах два британских музыкальных продюсера, сильно обеспокоенные этим явлением, поспорили, кто сумеет раскрутить самую плохую песню до места в хит-парадах. Говорят, в их споре родилась группа Vanilla, в составе которой пели четыре девушки и которая дебютировала с песней No way no way, mah na mah na, сделанной по образцу песенки Mah na mah na из знаменитого “Маппет-шоу”. Пением это можно было назвать лишь условно, обложка сингла выглядела так, словно ее изготовили с помощью редактора Microsoft Paint, а промоклип, бесспорно, был достоин худшей оценки в своем жанре. Однако у “ванильных” девушек была мощная поддержка. Благодаря публикациям в нескольких журналах и появлению в музыкальной программе ВВС Top of the Pops песенка все-таки пробилась на четырнадцатую строчку хит-парада[378].
Надо признать, группа недолго купалась в лучах славы. Когда вышел второй сингл, ее популярность уже сошла на нет. Третий так и не увидел свет. Судя по всему, можно предположить, что общественное мнение – не единственный решающий фактор успеха, и следующий эксперимент “Музыкальной лаборатории” это подтвердил.
В целом свой второй эксперимент исследователи провели по старой схеме. Но на этот раз они изобрели один остроумный прием, чтобы посмотреть, до какой степени кажущаяся популярность превращается в самореализующийся прогноз. Как только наблюдатели замечали, что хит-парады в каждой ветке стабилизируются, они приостанавливали голосование и переворачивали таблицу вверх ногами. Чемпионов чарта новые пользователи интернет-плеера видели внизу, а бывшие безнадежные лузеры показывались как лучшие из лучших.
Общее количество скачиваний обвалилось практически мгновенно. Когда песни с верхних строчек перестали радовать, аудитория и вовсе потеряла интерес к трекам с этого сайта. Заметнее всего число скачиваний уменьшилось для тех аутсайдеров, которые теперь взлетели на самый верх. При этом сосланные на дальние позиции достойные песни оценивались хуже, чем прежде, когда они были наверху, однако все равно лучше, чем их предшественницы из конца чарта. Если бы эксперимент продолжался достаточно долго, самые популярные хиты восстановили бы свою репутацию. Вывод: рынок не застывает в каком-то одном состоянии. Важны и везение, и качество.
Вернемся в реальность – в тот единственный мир с имеющимися в нем исходными данными, где результаты эксперимента, поставленного в “Музыкальной лаборатории”, интерпретируются просто и ясно. Качество – важное свойство, отличное от популярности, и оно играет свою роль. Тот факт, что лучшие песни отстояли свои позиции, говорит о том, что какая-то музыка может быть изначально “лучше”. С одной стороны, великолепной песне в прекрасном исполнении успех предначертан судьбой (по крайней мере, так должно быть). Но подвох в том, что обратное верно далеко не всегда. Если что-то становится модным, отсюда вовсе не следует, что это что-то окажется надлежащего качества.
А вот что такое надлежащее качество – совсем другой вопрос, и очень скоро мы к нему вернемся. Впрочем, не для всех и не всегда само по себе качество так уж критично. Если у вас студия звукозаписи или издательство, или если вы кинопродюсер, цена вопроса, умеете ли вы находить заведомо успешные проекты, – миллионы долларов. Нельзя ли поручить отбор хитов алгоритму?
Хитовый промысел
Инвестирование в кино – рискованный бизнес. Прибыль приносят немногие проекты, большей частью они едва окупаются, а изрядную долю кинопродукции составляют фильмы неудачные[379][380]. Ставки высоки – затраты на производство доходят до десятков, а то и сотен миллионов долларов, и ошибки в оценке зрительского интереса порой обходятся катастрофически дорого.
В 2012 году студия Disney, выпустив фильм “Джон Картер”, убедилась в этом на собственном горьком опыте. Съемки стоили киностудии 350 миллионов долларов, и предполагалось, что это кино станет еще одной крупной франшизой наряду с “Историей игрушек” и “В поисках Немо”. Не смотрели? Я тоже. Лента не нашла отклика в душах зрителей, дело кончилось убытком в 200 миллионов долларов и отставкой главы Walt Disney Studios[381].
Сильные мира Голливуда признают, что точно предсказать коммерческий успех фильма невозможно. В этой сфере все держится на шестом чувстве. Всегда есть шанс сделать ставку на фильм, который впоследствии обрушит кассу. Вот что сказал в 1978 году Джек Валенти, тогда президент Американской ассоциации кинокомпаний: “Никто не скажет вам, как поведет себя фильм на рынке. Пока не начнется кино и в темном зале между экраном и зрителями не пролетит какая-то искра, вы этого не узнаете”[382]. Спустя пять лет, в 1983 году, Уильям Голдман, автор сценариев к фильмам “Принцесса-невеста” и “Бутч Кэссиди и Санденс Кид”, сформулировал ту же мысль коротко и ясно: “Никто ничего не знает”[383].
Но, как мы уже не раз убеждались, прогнозирование того, что вроде бы не поддается прогнозу, для алгоритмов – дело привычное. Почему в кино должно быть иначе? Интерес к ленте, прибыль и отзывы критиков можно измерить. Различные факторы, касающиеся ее особенностей и структуры, как то: звездность актерского состава, жанр, бюджет, продолжительность демонстрации, характерные детали сюжета и прочие, – все это тоже можно оценить в цифрах. Тогда почему бы не поискать крупную жемчужину с помощью уже известных методов? Можно ли отобрать те фильмы, которым на роду написан кассовый успех?
Эта грандиозная задача подстегнула ряд новых исследований, в ходе которых ученые постарались проникнуть в тайны и глубины богатейшего пула информации, собранной и обработанной такими сайтами, как Internet Movie Database (IMDb, база данных о кино) и Rotten Tomatoes. Оказалось – и вполне ожидаемо, – что из этих данных можно сделать кое-какие любопытные выводы.
Для примера посмотрим работу Самита Сринивасана 2013 года[384]. Он выяснил, что на сайте IMDb, где пользователям предлагалось отметить ленты ключевыми для сюжета словами, составлен подробнейший каталог указателей, по которому можно судить об эволюции наших предпочтений в кино. Ко времени его исследования каталог IMDb насчитывал два миллиона наименований фильмов, снятых за сто с лишним лет, и сюжету каждого из них отвечало множество тегов. Одни ключевые слова – например, “организованная преступность” и “отцы и дети” – описывали фильм в общих чертах, в других действие ассоциировалось с местом (“Манхэттен, Нью-Йорк”) или указывались специфические детали сюжета (“держать на прицеле”, “привязан к стулу”).
По одним только ключевым словам видно, как вдруг вспыхивает интерес зрителей к определенным деталям сюжета; взять, к примеру, фильмы о Второй мировой войне или те, в которых поднимается тема абортов. Сразу вслед за выходом такого кино выпустят еще несколько картин на ту же тему, после чего наступит затишье. По совокупности всех тегов Сринивасан смог оценить по шкале от нуля до единицы новизну идей в каждой ленте на момент ее выпуска и сопоставить эти оценки с кассовыми сборами.
Если какой-то поворот сюжета или его характерная особенность – скажем, обнаженное женское тело или мафия – уже встречались в фильмах прошлых лет, ключевое слово приносило ленте мало очков за новизну. В свою очередь, любые оригинальные решения – например, введение восточных единоборств в боевики семидесятых годов – существенно повышали индекс новизны, при условии, что это решение появлялось на экране впервые.
Как выяснилось, мы воспринимаем новинки неоднозначно. В среднем больше сборов делали ленты с более высокими индексами новизны. Но до известного предела. Стоит только передавить и превысить определенный порог новизны – и жди беды; если этот показатель был выше 0,8, прибыли, которые мог принести фильм, резко падали. Исследование Сринивасана подтвердило давние подозрения социологов – банальность нас отталкивает, но и совсем незнакомое мы тоже принимаем в штыки. Лучшее кино занимает позиции в узкой зоне золотой середины между “новым” и “не самым новым”.
Индекс новизны мог бы подсказать киностудиям, как уберечься от финансирования провальных проектов, однако он не поможет узнать судьбу конкретной ленты. Пожалуй, здесь полезнее была бы работа европейских исследователей. Они установили корреляцию между количеством изменений, внесенных в статью о фильме в “Википедии” за последний месяц перед премьерой, и финальной суммой кассовых сборов[385]. Правят статьи нередко люди, не имеющие отношения к выходу фильма на экраны, – это просто фанаты кино, которые добавляют в статью какую-то информацию. Если статью многократно редактировали, значит, новое кино вызвало интерес, что, в свою очередь, приводит к более высоким финансовым показателям.
В целом этот метод имел весьма скромную прогностическую ценность – верный прогноз прибыли был дан для 70 лент из 312 с точностью 70 % и выше. Но чем удачнее шел прокат и чем активнее корректировалась статья в “Википедии”, тем больше информативных данных получали исследователи и тем точнее становились их прогнозы. Для шести высокодоходных лент кассовые сборы были предсказаны с точностью 99 %.
Эти исследования интересны в научном плане, однако инвесторам мало толку от модели, которая работает только за месяц до выхода фильма в прокат. А что, если попытаться решить задачу авансом, то есть исходя из уже известных фактов, таких как жанр, популярность актеров, занятых в главных ролях, возрастные ограничения (“рекомендовано для просмотра с родителями”, 12+ и так далее), с помощью алгоритма машинного обучения рассчитать вероятность успешного проката?
В 2005 году такое исследование было проведено и имело резонанс – были предприняты попытки использовать нейросеть для прогнозирования популярности фильмов задолго до их появления на экранах кинотеатров[386]. Авторы работы решили максимально упростить задачу, поэтому не стали заниматься предсказаниями точной суммы выручки, а рассортировали ленты по девяти категориям от самых провальных до лидеров проката с огромными сборами. К сожалению, даже с таким упрощением результаты не порадовали. Тогда нейросеть показала себя лучше всех предыдущих статистических методик, но все равно в среднем оценила фильмы верно всего лишь на 36,9 %. Чуть более точным было попадание в топовой категории, для фильмов с предполагаемой выручкой свыше двухсот миллионов долларов, – блокбастеры нейросеть определила с точностью 47,3 %. Но инвесторы посматривают на все это с недоверием. Порядка десяти процентов тех лент, которым алгоритм прочил бешеный успех, на деле принесли, по голливудским меркам, жалкие гроши – меньше двадцати миллионов долларов.
С тех пор ученые еще не раз пытались повысить точность прогнозов, но существенного прорыва в этой области не произошло. Все факты свидетельствуют об одном и том же – пока нет данных о реакции тех, кто уже посмотрел кино, предсказать его дальнейшую судьбу почти невозможно. Если надо выбрать кассовую ленту среди многих других, прав Голдман. Никто ничего не знает.
Количественная оценка качества
Итак, прогнозирование популярности – дело сложное. Мы знаем, что нам нравится, но не всегда знаем почему. Для алгоритма, работающего в сфере искусства, это серьезная помеха. Если “качество” нельзя объяснить популярностью, то как еще его измерить?
Это существенный момент – если мы требуем от алгоритма какой бы то ни было самостоятельности в искусстве, неважно, создания новых произведений или грамотного анализа наших собственных творений, нам потребуются некие единицы измерения качества. Надо предложить алгоритму объективный метод для верной оценки, своего рода эмпирический эталон для сравнения. Что-нибудь наподобие “эти клетки – злокачественные” или “такой обвиняемый склонен к нарушению закона”, только применительно к искусству. Иначе мы ничего не добьемся. Если мы не сможем дать определение понятию “хорошо”, нам не создать алгоритма, который сочинил бы “хорошую” песню или выбрал бы ее среди других.
К сожалению, в поисках объективной меры качества мы погружаемся в давнюю и бесконечную философскую дискуссию, начатую еще во времена Платона. Споры на эту тему не утихают вот уже больше двух тысячелетий. Как оценить эстетическую ценность произведения искусства?
Одни философы, в частности Готфрид Лейбниц, утверждали, что, если мы все восхищаемся чем-либо, например, “Давидом” Микеланджело или “Реквиемом” Моцарта, значит, есть некая поддающаяся определению и измерению сущность красоты, поэтому произведения искусства можно сравнивать.
С другой стороны, люди редко бывают единодушны в оценках. Другие философы – например, Дэвид Юм – придерживались мнения, что красоту каждый понимает по-своему. Кто-то видит в известном произведении Энди Уорхола интереснейший эстетический эксперимент, а кто-то – консервную банку с супом, ничем не примечательную в художественном отношении.
Но есть и третья группа философов – Иммануил Кант в их числе, – которые считали, что истина где-то посередине. Что наши суждения о красоте не то чтобы зависят только от нашего личного вкуса, но и не вполне объективны. Они зависят и от чувственного восприятия, и от эмоций, и от интеллекта наблюдателя – и что немаловажно, могут меняться в зависимости от его настроения.
Эта гипотеза подтверждается фактами. Поклонники Бэнкси, возможно, вспомнят, как в 2013 году он анонимно продавал “с лотка” в нью-йоркском Центральном парке свои черно-белые работы, выполненные аэрозольными красками, по 60 долларов за штуку. В ряду других киосков и прилавков с типовыми сувенирами его прилавок, с точки зрения прохожих, наверное, отличался довольно высокими ценниками. Первый покупатель нашелся лишь через несколько часов. Дневная выручка Бэнкси составила 420 долларов[387]. Однако год спустя, на аукционе в Лондоне, другому покупателю то же самое произведение показалось настолько прекрасным в эстетическом плане, что он с готовностью отдал за одну-единственную картину 68 000 фунтов (около 115 000 долларов по тогдашнему курсу)[388].
Надо признать, не у всех Бэнкси пользуется успехом. Чарли Брукер, автор идеи и сценарист сериала “Черное зеркало”, однажды обозвал его “пустозвоном, творчество [которого] идиотам кажется жутко интеллектуальным”[389]. Так что, по-видимому, эта история говорит только о том, что качество как таковое не является неотъемлемым свойством произведений Бэнкси. Баснословные цены – результат медийного хайпа, а также информационного социального влияния. Но и в оценках бесспорных шедевров мы тоже нередко проявляем беспричинное своенравие.
Я часто вспоминаю один эксперимент, который провела в 2007 году газета Washington Post[390]. Всемирно известного скрипача Джошуа Белла, на чьи концерты билеты всегда распроданы, попросили выступить лишний раз. Взяв свою скрипку Страдивари стоимостью 3,5 миллиона долларов, утром, в час пик, Белл встал наверху у эскалатора одной из станций вашингтонского метро, положил на пол шляпу для монет и купюр и сорок три минуты развлекал публику. Как писала Washington Post, “один из самых прославленных виртуозов с мировым именем исполнил самые красивые музыкальные произведения на одном из самых дорогих инструментов, какие только существуют в мире”. И что бы вы думали? Семь человек немного постояли, послушали. Более тысячи пробежали мимо. Когда Белл отыграл всю программу, в его шляпе лежал небогатый улов – 32 доллара и 17 центов.
Меняется и наше представление о том, что такое “хорошо”. Наша потребность в некоторых жанрах классической музыки явно выдержала испытание временем, чего не скажешь о других видах искусства. Арман Леруа, профессор эволюционной биологии Имперского колледжа Лондона, изучал развитие и трансформацию поп-музыки и нашел убедительное доказательство переменчивости наших вкусов: “Всегда есть некий порог скуки. Когда людям хочется чего-то новенького, нарастает напряженность”[391].
В качестве примера рассмотрим ритм-машины и синтезаторы – в конце 1980-х годов они так всем полюбились, что все хит-парады стали на одно лицо. “Что ни возьми, все звучит как ранняя Мадонна и «Дюран Дюран», – объясняет Леруа. – Можно было подумать, что это уже вершина поп-музыки. Вот и все тут. Дальше развиваться вроде некуда”. Как бы не так. Очень скоро появился хип-хоп, и чарты вновь заискрились разнообразными хитами. Я спросила Леруа: было ли что-то такое в хип-хопе, что вызвало перемены? “Вряд ли. Могло появиться что угодно, но появился хип-хоп. Он вызывал отклик у американской аудитории, и люди сказали: это что-то новенькое, давайте еще”.
Дело вот в чем. Даже если произведения искусства можно сравнивать по каким-то объективным критериям, мы не можем придумать физический метод измерения их эстетических достоинств, который работал бы всегда и везде, поскольку мы воспринимаем искусство в зависимости от контекста. Какие средства вы ни используете – статистические методики, хитроумный искусственный интеллект или алгоритмы машинного обучения, – попытки облечь в цифры саму суть артистического гения равнозначны попыткам схватить дым руками.
Но алгоритму нужны хоть какие-то исходные данные. Раз популярность и изначально присущее качество не годятся, единственное, что можно оценить количественно, – это степень сходства с любым предыдущим продуктом.
Измерение сходства позволяет сделать массу всего. Это, бесспорно, самый подходящий метод для рекомендательных сервисов, таких как Netflix и Spotify. Обе компании предлагают пользователям удобный поиск новых фильмов и песен, к тому же, работая по схеме абонентского обслуживания, они заинтересованы в более точном прогнозировании предпочтений клиентов. Строить свои алгоритмы на базе популярности им нельзя, иначе пользователей завалят предложениями послушать Джастина Бибера и посмотреть “Свинку Пеппу”. Нельзя основываться и на косвенных показателях качества, например, на критических обзорах, потому что на домашней странице останется сплошное артхаусное кино не для всех, тогда как все вообще-то хотят скинуть туфли после длинного рабочего дня и часа на два бездумно погрузиться в какой-нибудь тупой триллер или посмотреть кино с Райаном Гослингом.
Зато с оценкой сходства алгоритм может сфокусироваться непосредственно на предпочтениях того или иного пользователя. Что он слушает, что смотрит, что пересматривает снова и снова? В таком случае можно составить набор ключевых слов для каждой песни и каждого фильма, надергав их на сайте IMDb, в “Википедии”, блогах о музыке и журнальных статьях. Проделать это для всего каталога, после чего останется только найти другие песни и фильмы с теми же тегами и предложить их пользователям. Далее можно будет еще и найти других пользователей, которым нравятся те же песни и фильмы, посмотреть, что еще они выбирают, и показать своему клиенту то же самое.
Ни Spotify, ни Netflix даже не пытаются отбирать лучшие песни и фильмы. Совершенство их вообще не интересует. Spotify не обещает вам найти ту единственную группу на земле, которая целиком и полностью отвечает вашим вкусам и настроению. Алгоритмы выдачи рекомендаций всего лишь находят достаточно хорошие для вас фильмы и музыку, так чтобы вы не разочаровались. Вам предлагают абсолютно безвредный способ скоротать время. Периодически алгоритмы будут попадать в десятку с выбором, но в каком-то смысле это немного смахивает на “холодное чтение”. Чтобы радоваться новым открытиям в музыке, вам достаточно периодически находить то, что вас порадует. Механизм поиска вовсе не обязан всегда работать безошибочно.
Для алгоритмов выдачи рекомендаций критерий сходства – идеальный инструмент. Но самое интересное начинается тогда, когда вы просите алгоритм создать произведение искусства, не имея однозначных критериев оценки его качества. Способен ли алгоритм сотворить шедевр, если его восприятие искусства целиком и полностью ограничивается прошлым опытом?
Хорошие художники копируют, великие художники воруют. Пабло Пикассо[392]
В октябре 1997 года в Орегонском университете давали весьма любопытный концерт. На авансцене одиноко стоял рояль. Вышла пианистка Уинифред Кернер и приготовилась исполнить три короткие пьесы.
Первая пьеса – малоизвестное сочинение для фортепиано великого мастера барокко Иоганна Себастьяна Баха. Вторую, в стиле Баха, сочинил профессор музыки того же университета Стив Ларсон. Третью написал алгоритм, который разработали специально для имитации музыкальной манеры Баха.
По окончании концерта публику попросили выбрать одного из этих троих авторов для каждой пьесы. К великому огорчению Стива Ларсона, его опус большинством голосов приписали компьютеру. Когда же было объявлено, что за творение гениального композитора слушатели приняли не что иное, как машинную продукцию, зал дружно ахнул от ужаса, смешанного с восторгом.
Ларсон расстроился. Вскоре после этого эксперимента он сказал в интервью New York Times: “Я глубоко и бесконечно восхищаюсь музыкой [Баха]. Компьютер сумел обмануть публику – не знаю, что и подумать”.
Не только ему стало не по себе. Создателю прославившегося алгоритма, электронного композитора, Дэвиду Коупу уже приходилось наблюдать такую же реакцию. “[Сначала] мы играли в эту, я бы сказал, «игру» с отдельными людьми, – рассказывал он мне. – И когда они проигрывали, им это не нравилось. Они сердились на меня уже за саму идею. Потому что творчество считается прерогативой человека”[393].
Очевидно, такого же мнения придерживался и Дуглас Хофштадтер, ученый-когнитивист, писатель и главный организатор памятного концерта. Несколькими годами ранее в своей книге “Гёдель, Эшер, Бах: эта бесконечная гирлянда”, за которую в 1979 году получил Пулитцеровскую премию, он довольно категорично выразился по этому поводу:
Музыка – это язык эмоций, и никакая программа не напишет ничего сколько-нибудь прекрасного, пока не разовьет у себя столь же богатый духовный мир, каким обладаем мы… Полагать, что запрограммированная “музыкальная шкатулка” может по нашей команде выдавать опусы, достойные Баха, – значит самым бессовестным, чудовищным образом недооценивать глубину человеческой души[394].
Однако, прослушав сочинения алгоритма Коупа – программы по имени ЭМИ[395] – Хофштадтер признал, что, пожалуй, не все так однозначно: “ЭМИ озадачила меня и повергла в сомнения, – сказал он через несколько дней после эксперимента в Орегонском университете. – Ясно, что ЭМИ не генерирует стиль сама, и это единственное, что меня здесь успокаивает. Манера алгоритма определяется подражанием другим композиторам. Впрочем, это слабое утешение. Я совершенно выбит из колеи, [возможно] музыка – это нечто не такое великое, как я всегда думал”.
Так что же это? Только ли человеку по плечу добиться эстетического совершенства? Или автором произведения искусства может стать алгоритм? И если зрители не смогли отличить музыку компьютера от музыки великого композитора, не значит ли это, что компьютер доказал свою способность к настоящему творчеству?
Попробуем разобраться с каждым из этих вопросов начиная с последнего. Для того чтобы составить обоснованное мнение, давайте сделаем паузу и попробуем разобраться в том, как работает этот алгоритм[396]. Дэвид Коуп любезно согласился немного просветить меня.
Чтобы написать программу, первым делом надо было перевести музыку Баха на понятный компьютеру язык: “Для каждой ноты надо ввести в базу данных по пять характеристик: момент начала звучания, длительность, высоту тона, громкость и музыкальный инструмент”. Коуп методично, вручную ввел все пять характеристик для каждой ноты из записей Баха. Одних только хоралов Баха насчитывалось 371 – множество созвучий, десятки тысяч нот, по пять цифровых значений для каждой. Коуп проделал фантастическую работу: “Я месяцами ничего делал, кроме как вбивал эти цифры. Но я самый настоящий маньяк”.
Затем, по системе Коупа, надо было посмотреть, что в произведениях Баха следует за каждым отдельно взятым звуком. Коуп записал последующие ноты для каждой из нот в хоралах Баха. Все это он собрал в некое подобие словаря – банк данных, в котором алгоритм мог выбрать любой аккорд и составить исчерпывающий список всех возможных последующих вариантов, выписанных вдохновенным пером Баха.
Можно сказать, ЭМИ действует примерно так же, как алгоритмы предиктивного ввода текста на смартфонах. Телефон составил себе словарик по когда-то введенным вами фразам и теперь подбирает для ваших новых сообщений те слова, которые вы с большой вероятностью написали бы сами вслед за текущим словом[397].
И наконец, надо было запустить машину. Коуп загружал в систему первый аккорд и просил алгоритм просмотреть словарь и найти в неупорядоченной подборке следующие ноты. Далее алгоритм повторял ту же процедуру – штудировал словарь и выбирал нужные ноты и созвучия. На выходе получалось абсолютно новое музыкальное произведение, которое звучало так, словно его написал сам Бах[398].
А может, это и есть сам Бах. По крайней мере, Коуп так считает. “Все аккорды придуманы Бахом. Представьте себе, что вы натерли на терке кусок пармезана, а потом снова слепили из стружки кусок. Получится все тот же пармезан”.
Вне зависимости от того, чья это величайшая заслуга, одно не вызывает сомнений. Музыка ЭМИ, как бы она ни была красива и мелодична, родилась в результате перетасовок ранее созданных произведений. Это не впервые созданное оригинальное произведение, а лишь подражание мотивам из произведений Баха.
Совсем недавно появились и другие алгоритмы, которые продвинулись чуть дальше простой рекомбинации и “написали” приятную для слуха музыку. Больше других преуспели на этом поприще генетические алгоритмы – разновидность алгоритмов машинного обучения, использующие принцип естественного отбора. Что ж, судя по павлинам, у эволюции есть свои творческие секреты.
Идея проста. Такие программы оперируют с нотами, как с музыкальной ДНК. За исходную берется первая цепочка со случайной последовательностью нот – первая популяция “песен”. Из поколения в поколение алгоритм отбирает и культивирует самые “красивые” музыкальные фрагменты, чтобы со временем композиции становились все лучше и лучше. Это так говорится “красивые” и “лучше”, но, конечно же, как мы уже поняли, никто не знает точного значения этих слов. С тем же успехом алгоритм может написать поэму и картину – но все равно он будет ориентироваться только на степень сходства с ранее созданными произведениями искусства.
Впрочем, в некоторых случаях большего и не требуется. Если вы ищете фоновый мотивчик в стиле фолк для своего сайта или видео в YouTube, вам нет дела до того, что он перекликается со всеми сразу известными хитами в этом жанре. У вас очень простые условия – не нарушить ничьи авторские права и не тратить время и нервы на сочинительство. Если это все, что вам нужно, вам на помощь придут несколько компаний. Услуги такого рода предлагают британские стартапы Jukebox и AI Music, использующие программы для написания мелодий. Какие-то мелодии сгодятся для ваших целей. Какие-то будут, можно сказать, оригинальны. Будут даже красивые. Безусловно, алгоритмы мастерски подражают старому – просто они не очень хорошо создают новое.
Это не значит, что они оказывают нам плохую услугу. Многие мелодии, сочиненные людьми, тоже не отличаются новизной. Спросите Армана Леруа, биолога-эволюциониста, изучавшего культурную эволюцию поп-музыки, – он считает, что творческий потенциал человека вызывает у нас излишнее умиление. Как он говорит, компьютер ни в чем не уступил бы даже самым выдающимся победителям хит-парадов. Вот, к примеру, что он думает о песенке Happy Фаррелла Уильямса (сдается мне, что Леруа – не фанат Уильямса):
“Счастлив, счастлив, счастлив, я так счастлив!” Ну что это, в самом деле! На всю песню, кажется, пяток слов. Звучит в точности так, будто ее робот для вас сочинил, в угоду простой житейской потребности людей в хорошем настроении и легкомысленной пляжной музыке. Абсолютно идиотская песня, примитивная до предела. Если мы к этому стремимся – что ж, это легко устроить.
Не слишком высокого мнения Леруа и об Адель: “Вслушайтесь в то, что она поет, и вы поймете, что там нет никаких проявлений чувств, которые не могла бы воспроизвести программа генерирования лирических песен”.
Существует мнение (вам оно может показаться спорным, я и сама не готова согласиться), что изобретательность людей сводится к очередной рекомбинации прежних изобретений – и алгоритмы “сочиняют” музыку примерно так же. Как сказал Марк Твен:
Свежая мысль – это нечто, чего не бывает. Просто не может быть. Мы лишь собираем все старые мысли и засыпаем их, так сказать, в умственный калейдоскоп. Поворачиваем его, и мысли складываются в новые, причудливые картины. Снова поворачиваем, получаем другие сочетания, и так до бесконечности; но те же самые разноцветные стекляшки перемешивались во все века.
Между тем Коуп дает очень простое определение творческой деятельности, охватывающее и деятельность алгоритмов: “Творчество – это поиск ассоциативных связей там, где, казалось бы, их нет”.
Возможно. Но, по-моему, все-таки если ЭМИ и ей подобные программы и проявляют способность к творчеству, то в какой-то ущербной форме. Их музыка бессодержательная, даже если она мелодична. И я никак не могу отделаться от мысли, что если мы будем относиться к машинной продукции как к искусству, то в плане культуры наша картина мира станет намного беднее. Может, такая культурная пища легко усваивается и поднимает настроение. Но это не Искусство с большой буквы.
Изучая материалы для этой главы, я поняла, что совсем по другой причине я отношусь к творчеству алгоритмов с сомнением. Дело не в том, способны ли компьютеры к творческой деятельности. Способны. Главный вопрос – что считать искусством.
Я математик. Я со знанием дела оперирую фактами о ложной позитивности и рассуждаю об абсолютной истине, о точности и статистике. Но что касается искусства, я лучше сошлюсь на Льва Толстого. Я, как и он, полагаю, что подлинное искусство имеет дело с человеческими отношениями, с взаимодействиями на эмоциональном уровне. Лев Толстой писал: “…Искусство есть передача другим людям особенного, испытанного художником чувства”[399][400]. Если вы согласны с Толстым, вам должно быть понятно, почему компьютер не может творить подлинное искусство. Это замечательно объяснил Дуглас Хофштадтер, задолго до его знакомства с ЭМИ: