Удовольствие от X. Увлекательное путешествие в мир математики от одного из лучших преподавателей в мире Строгац Стивен
«Весной, — писал Теннисон, — воображение молодого человека с легкостью поворачивается к мыслям о любви». Увы, потенциальный партнер молодого человека может иметь собственные представления о любви, и тогда их отношения будут полны бурных взлетов и падений, которые делают любовь столь волнующей и столь болезненной. Одни страдальцы от безответной ищут объяснение этих любовных качелей в вине, другие — в поэзии. А мы проконсультируемся у исчислений.
Представленный ниже анализ будет насмешливо-ироничным, но он затрагивает серьезные темы. К тому же если понимание законов любви может от нас ускользнуть, то законы неодушевленного мира в настоящее время хорошо изучены. Они принимают форму дифференциальных уравнений, описывающих изменение взаимосвязанных переменных от момента к моменту в зависимости от их текущих значений. Возможно, у таких уравнений мало общего с романтикой, но они хотя бы могут пролить свет на то, почему, по словам другого поэта, «путь истинной любви никогда не был гладким».
Чтобы проиллюстрировать метод дифференциальных уравнений, предположим, что Ромео любит Джульетту[102], но в нашей версии этой истории Джульетта — ветреная возлюбленная. Чем больше Ромео любит ее, тем сильнее она хочет от него спрятаться. Но когда Ромео охладевает к ней, он начинает казаться ей необыкновенно привлекательным. Однако юный влюбленный склонен отражать ее чувства: он пылает, когда она его любит, и остывает, когда она его ненавидит.
Что происходит с нашими несчастными влюбленными? Как любовь их поглощает и уходит с течением времени? Вот где дифференциальное исчисление приходит на помощь. Составив уравнения, обобщающие усиление и ослабление чувств Ромео и Джульетты, а затем решив их, мы сможем предсказать ход отношений этой пары. Окончательным прогнозом для нее будет трагически бесконечный цикл любви и ненависти. По крайней мере четверть этого времени у них будет взаимная любовь.
Чтобы прийти к такому выводу, я предположил, что поведение Ромео может быть смоделировано с помощью дифференциального уравнения
которое описывает, как его любовь (R) изменяется в следующее мгновение (dt). Согласно этому уравнению, количество изменений (dR) прямо пропорционально (с коэффициентом пропорциональности a) любви Джульетты (J). Данная зависимость отражает то, что мы уже знаем: любовь Ромео усиливается, когда Джульетта любит его, но это также говорит о том, что любовь Ромео растет прямо пропорционально тому, насколько Джульетта его любит. Это предположение линейной зависимости эмоционально неправдоподобно, но оно позволяет значительно упростить решение уравнения.
Напротив, поведение Джульетты можно смоделировать с помощью уравнения
Отрицательный знак перед постоянной b отражает то, что ее любовь остывает, когда любовь Ромео усиливается.
Единственное, что еще осталось определить, — их изначальные чувства (то есть значения R и J в момент времени t = 0). После этого все необходимые параметры будут заданы. Мы можем использовать компьютер, чтобы медленно, шаг за шагом двигаться вперед, изменяя значения R и J в соответствии с описанными выше дифференциальными уравнениями. На самом деле с помощью основной теоремы интегрального исчисления мы можем найти решение аналитически. Поскольку модель простая, интегральное исчисление выдает пару исчерпывающих формул, которые говорят нам, сколько Ромео и Джульетта будут любить (или ненавидеть) друг друга в любой момент времени в будущем.
Представленные выше дифференциальные уравнения должны быть знакомы студентам-физикам: Ромео и Джульетта ведут себя как простые гармонические осцилляторы. Таким образом, модель предсказывает, что функции R(t) и J(t), описывающие изменение их отношений во времени, будут синусоидами, каждая из них возрастающая и убывающая, но максимальные значения у них не совпадают.
Модель можно сделать более реалистичной разными путями. Например, Ромео может реагировать не только на чувства Джульетты, но и на свои собственные. А вдруг он из тех парней, которые настолько боятся, что их бросят, что станет остужать свои чувства. Или относится к другому типу парней, которые обожают страдать — именно за это он ее и любит.
Добавьте к этим сценариям еще два варианта поведения Ромео: он отвечает на привязанность Джульетты либо усилением, либо ослаблением собственной привязанности — и увидите, что в любовных отношениях существуют четыре различных стиля поведения. Мои студенты и студенты группы Питера Кристофера из Вустерского политехнического института предложили назвать представителей этих типов так: Отшельник или Злобный Мизантроп для того Ромео, который охлаждает свои чувства и отстраняется от Джульетты, и Нарциссический Болван и Флиртующий Финк для того, который разогревает свой пыл, но отвергается Джульеттой. (Вы можете придумать собственные имена для всех этих типов).
Хотя приведенные примеры фантастические, описывающие их типы уравнений весьма содержательны. Они представляют собой наиболее мощные инструменты из когда-либо созданных человечеством для осмысления материального мира. Сэр Исаак Ньютон использовал дифференциальные уравнения для открытия тайны движения планет. С помощью этих уравнений он объединил земные и небесные сферы, показав, что и к тем и к другим применимы одинаковые законы движения.
Спустя почти 350 лет после Ньютона человечество пришло к пониманию того, что законы физики всегда выражаются на языке дифференциальных уравнений. Это верно для уравнений, описывающих потоки тепла, воздуха и воды, для законов электричества и магнетизма, даже для атома, где царит квантовая механика.
Во всех случаях теоретическая физика должна найти правильные дифференциальные уравнения и решить их. Когда Ньютон обнаружил этот ключ к тайнам Вселенной и понял его великую значимость, он опубликовал его в виде латинской анаграммы. В вольном переводе она звучит так: «Полезно решать дифференциальные уравнения»[103].
Глупая идея описать любовные отношения с помощью дифференциальных уравнений пришла мне в голову, когда я был влюблен в первый раз и пытался понять непонятное поведение моей девушки. Это был летний роман в конце второго курса колледжа. Я очень напоминал тогда первого Ромео, а она — первую Джульетту. Цикличность наших отношений сводила меня с ума, пока я не понял, что мы оба действовали по инерции, в соответствии с простым правилом «тяни-толкай». Но к концу лета мое уравнение начало разваливаться, и я был еще более озадачен. Оказалось, произошло важное событие, которое я не учел: ее бывший возлюбленный захотел ее вернуть.
В математике мы называем такую задачу задачей о трех телах. Она заведомо неразрешима, особенно в контексте астрономии, где впервые и возникла. После того как Ньютон решил дифференциальные уравнения для задачи о двух телах (что объясняет, почему планеты движутся по эллиптическим орбитам вокруг Солнца), он обратил внимание на задачу о трех телах для Солнца, Земли и Луны. Ни он, ни другие ученые так и не смогли ее решить. Позже выяснилось, что задача о трех телах содержит семена хаоса[104], то есть в долгосрочной перспективе их поведение непредсказуемо.
Ньютон ничего не знал о динамике хаоса, но, по словам его друга Эдмунда Галлея[105], пожаловался, что задача о трех телах «вызывает головную боль[106] и так часто не дает ему спать, что он больше не будет об этом думать».
Здесь я с вами, сэр Исаак.
21. Выйди на свет[107]
Господин Дикурцио был моим наставником в средней школе — хмурый и требовательный, склонный к сарказму человек, носивший скучного вида очки в черной оправе. Словом, симпатяга. Но я заметил его безумную страсть к физике.
Однажды я рассказал ему, что прочитал биографию Эйнштейна. В ней говорилось, что во время учебы в колледже Эйнштейн был сильно поражен чем-то под названием «уравнения Максвелла для электричества и магнетизма»; и я заявил, что не могу ждать, пока начну достаточно разбираться в математике, чтобы узнать, что они собой представляют.
Это произошло во время ужина в школе-интернате. За большим столом сидели еще несколько студентов, жена учителя и две его дочери; господин Дикурцио раскладывал картофельное пюре по тарелкам. При упоминании об уравнениях Максвелла он бросил ложку, схватил бумажную салфетку и начал писать на ней загадочные символы, точки и кресты, перевернутые треугольники, E и В со стрелками над ними, и вдруг, как мне показалось, он заговорил на нечеловеческом языке: «Ротор ротора — это градиент дивергенции минус квадрат дельты…»
Что за абракадабру он бормотал? Теперь-то я понимаю, что он давал объяснения в терминах векторного исчисления[108] — раздела математики, описывающего все находящиеся вокруг нас невидимые поля. Вспомните магнитное поле, поворачивающее стрелку компаса на север, гравитационное поле, притягивающее ваш стул к полу, или микроволновое поле, которое готовит ваш ужин.
Наибольшие достижения векторного исчисления лежат в том сумеречном мире, где математика сталкивается с реальностью. В самом деле, история Джеймса Максвелла и его уравнений показывает один из сверхъестественных случаев несомненной эффективности математики. Так или иначе, перетасовав несколько символов, Максвелл обнаружил, что такое свет[109].
Чтобы осознать значимость его открытия и получить общее представление о векторном исчислении, давайте начнем со слова «вектор». Оно происходит от латинского корня vehere, «осуществлять», который также дает нам такие слова, как «транспортное средство» (vehicle) и «лента конвейера» (conveyor belt). Для эпидемиологов вектор является носителем возбудителя, подобно комару, передающему малярию через кровь. Для математика вектор (по крайней мере в своей простейшей форме) — это шаг, который переносит вас из одного места в другое.
Вспомните одну из схем для начинающих танцоров бальных танцев, покрытую стрелками, указывающими, как, танцуя румбу, ставить правую ногу, а затем левую:
Эти стрелки и есть векторы. Они содержат два вида данных: направление (в каком направлении переставлять ногу) и величину (на какое расстояние ее нужно переместить). Все векторы имеют такую двойственность.
Векторы, как и числа, можно складывать и вычитать, но наличие направленности делает их более сложными. Тем не менее сложение векторов становится более понятным, если вы представите его в виде инструкции по танцам. Например, что получится, если сначала вы делаете один шаг на восток, а следующий на север? Естественно, вектор, который указывает на северо-восток.
Примечательно, что скорость и сила ведут себя так же: они складываются, как и танцевальные шаги. Это должно быть знакомо любому теннисисту, который когда-либо пытался подражать Питу Сампрасу и бил по мячу справа снизу от линии, когда бежал на полной скорости к боковой линии. Если направить мяч без учета своего движения, то удар будет неточным. Скорость мяча по отношению к корту — это сумма двух векторов: скорости мяча относительно вас (вектор, направленный снизу от линии, как и предполагалось) и вашей скорости относительно корта (вектор, направленный в ту сторону, куда вы бежите). Чтобы отбить мяч в нужном направлении, необходимо целиться в противоположную половину поля противника, чтобы компенсировать боковое движение.
За пределами векторной алгебры лежит векторное исчисление: раздел математики, который использовал господин Дикурцио. Вы помните, что любое исчисление — это математика перемен. Поэтому векторное исчисление должно включать в себя изменение векторов во времени и пространстве. В последнем случае говорят о «векторном поле».
Классический пример векторного поля — силовое поле вокруг магнита. Для его демонстрации положите магнит на лист бумаги и начните сыпать на него железные стружки. Каждая стружка ведет себя как маленькая стрелка компаса, и ее направление совпадет с направлением локального «севера», определяемого магнитным полем в этой точке. Совокупность стружек создает захватывающую картину силовых линий магнитного поля, которые пролегают от одного полюса магнита к другому.
Направления и величины векторов в магнитном поле меняются от точки к точке. Как и во всех исчислениях, ключевым инструментом для количественного расчета таких изменений является производная. В векторном исчислении оператор производной называется «дельта» — от греческой буквы (дельта), обычно используемой для обозначения изменений в отдельных переменных. Как напоминание о родственных связях, в векторном исчислении также применяется перевернутый треугольник . (Это тот самый таинственный перевернутый треугольник учителя Дикурцио, который он несколько раз нарисовал на салфетке и который называется «набла».)
Оказывается, существует два различных, но одинаково естественных способа взять производную у векторного поля, применяя к нему «наблу». Первый называется дивергенцией поля. Чтобы интуитивно почувствовать, как она измеряется, взгляните на векторное поле, показывающее, как вода потечет из источника слева в раковину справа.
Для этого примера, чтобы отслеживать векторное поле, вместо железных стружек возьмем множество мелких корок или фрагменты плывущих по поверхности воды листьев. Мы собираемся использовать их в качестве зондов. Их движение будет показывать, как вода течет в каждой точке. Представьте, что произойдет, если выложить небольшой кружок из корок вокруг источника. Очевидно, что корки начнут раздвигаться и круг станет расширяться, так как вода вытекает из источника. Источник здесь расходится. И чем сильнее расхождение, тем быстрее увеличивается область нашего коркового круга. Вот почему дивергенция векторного поля определяет, насколько быстро растет площадь небольшого круга из корок.
На рисунке ниже оттенками серого изображены численные значения дивергенции в каждой точке поля. Светлые оттенки показывают точки, где поток имеет положительную дивергенцию, а темные — места отрицательной дивергенция там, где поток сжимает кольцо корок в окружности с центром слива воды.
Другой способ измерения производной — ротор векторного поля. Грубо говоря, ротор показывает, насколько сильно поле крутится вокруг данной точки. (Вспомните карты погоды, демонстрирующие вращающуюся розу ветров вокруг ураганов и тропических штормов, которые вы видели в новостях.) В векторном поле на рисунке области, выглядящие как ураганы, имеют большой ротор.
Украсив векторное поле оттенками серого, можно показать, где ротор имеет наибольшие положительные (светлая область) и наибольшие отрицательные (темная область) значения. Обратите внимание, что положительность или отрицательность ротора говорит также о том, в каком направлении вращаеся поток (против или по часовой стрелке).
Ротор чрезвычайно информативен для ученых, имеющих дело с механикой жидкостей и аэродинамикой. Несколько лет назад моя коллега Джейн Ван с помощью компьютера смоделировала структуру воздушного потока вокруг стрекозы в момент, когда та зависает на одном месте[110]. Вычисляя ротор, Джейн обнаружила, что, когда стрекоза машет крыльями, это формирует пару противоположно вращающихся вихрей (роторов), действующих как маленькие торнадо под ее крылышками и создающих достаточную подъемную силу, чтобы удерживать насекомое в воздухе. Таким образом, векторное исчисление помогает объяснить, как летают стрекозы, шмели и колибри, что долгое время было загадкой для традиционной аэродинамики неподвижного крыла самолета.
Теперь, когда вы получили представление о дивергенции и роторе, давайте вернемся к уравнениям Максвелла. Они выражают четыре фундаментальных закона: первый — для дивергенции электрического поля, второй — для его ротора, а третий и четвертый такого же типа — для магнитного поля. Уравнения дивергенции связывают электрические и магнитные поля с источниками их возникновения, заряженными частицами и токами, которые создают их изначально. Уравнения ротора описывают, как электрические и магнитные поля взаимодействуют и изменяются с течением времени. При этом уравнения обладают красивой симметрией: они связывают скорость изменения во времени одного поля со скоростью изменения в пространстве другого поля, что количественно выражается его ротором.
Максвелл использовал математические приемы, эквивалентные векторному исчислению, которое в его время еще не было известно, и вывел логические следствия из этих четырех уравнений. Перетасовка символов привела его к выводу, что электрические и магнитные поля могут распространяться в виде волн, похожих на рябь в пруду. За исключением электрических и магнитных полей, больше походивших на симбиотические организмы. Они поддерживали друг друга. Волновое движение электрического поля воссоздавало магнитное поле, которое, в свою очередь, воссоздавало электрическое поле, и так далее; каждое тянуло другое вперед, причем ни одно из них не могло сделать это самостоятельно.
Это был первый прорыв — теоретическое предсказание электромагнитных волн. Но действительно потрясающее открытие ждало Максвелла впереди. Когда он вычислил скорости этих гипотетических волн с использованием известных свойств электричества и магнетизма, из его уравнений стало ясно, что поля передвигаются со скоростью около 193 тысячи миль в секунду — такое же значение для скорости света вывел французский физик Ипполит Физо за десять лет до этого!
Как я хотел бы стать свидетелем момента[111], когда человек впервые понял истинную природу света. Считая свет электромагнитной волной, Максвелл объединил три древних и, казалось бы, не связанных между собой явления: электричество, магнетизм и свет. Хотя такие экспериментаторы, как Фарадей и Ампер, ранее нашли основные части этой головоломки, именно Максвелл, вооруженный своей математикой[112], сложил их.
Сегодня мы купаемся в некогда гипотетических волнах Максвелла, имея радио, телевидение, сотовые телефоны и Wi-Fi. Таково наследие его колдовства с символами.
Часть V. Многоликие данные
22. Новая нормальность
Статистика внезапно стала сверхмодным направлением. С появлением интернета, электронной торговли, социальных сетей, проекта по расшифровке генома человека, а также в связи с развитием цифровой культуры в целом мир стал захлебываться в данных.[113] Маркетологи изучают наши вкусы и привычки. Разведывательные службы собирают информацию о нашем местонахождении, электронной переписке и телефонных звонках. Специалисты по спортивной статистике жонглируют цифрами[114], решая, каких игроков покупать, кого набирать в команду, а кого посадить на скамью запасных. Каждый стремится объединить точки в график и обнаружить закономерность в беспорядочном скоплении данных.
Неудивительно, что эти тенденции отражаются и в обучении. «Давайте обратимся к статистике»[115], — увещевает в своей колонке газеты New York Times Грег Мэнкью, экономист из Гарвардского университета. «В учебной программе по математике в средней школе слишком много времени уделяется традиционным темам, таким как евклидова геометрия и тригонометрия. Эти полезные для обычного человека умственные упражнения, однако, малоприменимы в повседневной жизни. Учащимся было бы гораздо полезнее больше узнать о теории вероятности и статистике». Дэвид Брукс идет еще дальше[116]. В своей статье, посвященной дисциплинам, заслуживающим внимания для получения достойного образования, он пишет: «Возьмите статистику. Вот увидите, окажется, что знание того, что такое стандартное отклонение, вам очень пригодится в жизни».
Вполне вероятно, а еще неплохо разбираться в том, что такое распределение. Это первое, о чем я намерен поговорить. И хотел бы заострить на нем внимание, поскольку в этом заключается один из главных уроков статистики[117]: вещи кажутся безнадежно случайными и непредсказуемыми при рассмотрении их по отдельности, однако в совокупности в них обнаруживается закономерность и предсказуемость.
Возможно, вы видели демонстрацию этого принципа в каком-нибудь научном музее (если нет, видеоролики можно найти в интернете). Типичный экспонат представляет собой приспособление под названием доска Гальтона[118], которая чем-то напоминает автомат для игры в пинбол, только без флипперов. Внутри его с равными интервалами располагаются ровные ряды штырьков.
Опыт начинается с того, что в верхнюю часть доски Гальтона запускаются сотни шариков. При падении они сталкиваются со штырьками и с равной вероятностью отскакивают то вправо, то влево, а затем распределяются внизу доски, попадая в отсеки одинаковой ширины. Высота столбика из шариков показывает, с какой вероятностью шарик может оказаться в данном месте. Большинство шариков размещаются примерно в середине, по бокам их уже меньше, и еще меньше — по краям. В общем, картина чрезвычайно предсказуема: шарики всегда образуют распределение в форме колокола, хотя предугадать, где окажется каждый отдельно взятый шарик, невозможно.
Каким образом отдельные случайности превращаются в общие закономерности? Но именно так действует случайность. В среднем столбике скопилось больше всего шариков потому, что, прежде чем скатиться вниз, многие из них совершат примерно одинаковое количество прыжков вправо и влево и в результате окажутся где-то посередине. Несколько одиноких шариков, расположившихся по краям, образуют хвосты распределения — это те шарики, которые при столкновении со штырьками отскакивали всегда в одном направлении. Такие отскоки маловероятны, поэтому по краям так мало шариков.
Подобно тому как местоположение каждого шарика определяется суммой множества случайных событий, многие явления в этом мире являются следствием множества мелких обстоятельств и тоже подчиняются колоколообразной кривой. По этому принципу работают страховые компании. Они с высокой точностью могут назвать количество своих клиентов, которые умирают каждый год. Однако не знают, кому именно не повезет на этот раз.
Или возьмем, к примеру, рост человека. Он зависит от бесчисленного количества случайностей, связанных с генетикой, биохимией, питанием и окружающей средой. Следовательно, велика вероятность, что при рассмотрении в совокупности рост взрослых мужчин и женщин будет представлять собой колоколообразную кривую[119].
В одном блоге под названием «Ложные данные, которые люди сообщают о себе в интернете» статистическая служба сайта знакомств OkCupid[120] недавно опубликовала график роста своих клиентов или, скорее, указанных ими значений. Обнаружилось, что показатели роста представителей обоих полов, как и ожидалось, образуют колоколообразную кривую. Однако удивительно то, что оба распределения были примерно на два дюйма смещены вправо относительно ожидаемых значений.
Таким образом, либо рост клиентов, опрошенных компанией OkCupid, превышает средний, либо при описании себя в интернете они прибавляют к своему росту еще пару дюймов.
Идеализированной версией подобных колоколообразных кривых является то, что математики называют нормальным распределением. Это одно из важнейших понятий в статистике, имеющее теоретическое обоснование. Можно доказать, что нормальное распределение возникает при сложении большого количества мелких случайных факторов, причем каждый из них действует независимо от других. И многие события происходят именно таким образом.
Но не все. И это второй пункт, на который я хотел бы обратить внимание. Нормальное распределение не такое уж вездесущее, как кажется. На протяжении сотни лет, и особенно в последние несколько десятилетий, ученые и специалисты в области статистики отмечают существование множества явлений, отклоняющихся от этой кривой и следующих собственному графику. Любопытно, что подобные типы распределений практически не упоминаются в учебниках по элементарной статистике, а если и встречаются, то обычно рассматриваются как некие патологии. Это странно. Я попытаюсь объяснить, что многие явления современной жизни приобретают больший смысл при условии понимания этих «патологических» распределений. Это новая нормальность.
Возьмем, к примеру, распределение размеров городов в США. Вместо того чтобы скапливаться вокруг некоей средней величины колоколообразной кривой, подавляющее большинство городов имеют небольшой размер и, следовательно, скапливаются в левой части графика.
И чем больше население города, тем реже такие города встречаются. Иначе говоря, в совокупности распределение будет представлять собой скорее кривую в форме буквы L, чем колоколообразную кривую.
И в этом нет ничего удивительного. Все знают, что мегаполисов гораздо меньше, чем маленьких городов. Хотя это не так очевидно, размеры городов подчиняются простому красивому распределению — если посмотреть на них в логарифмическом масштабе.
Будем считать, что различие между двумя городами одно и то же, если их население отличается в одно и то же число раз (подобно тому как две любые клавиши рояля, отстоящие на октаву, всегда разнятся вдвое по частоте). И сделаем то же самое на вертикальной оси.
Теперь данные располагаются на кривой, представляющей собой почти идеальную прямую линию. Исходя из свойств логарифмов, нетрудно вывести, что исходная L-образная кривая представляет собой степенную зависимость, которая описывается функцией вида
где x — население города, у — количество городов, имеющих такой размер, с — константа, а показатель степени a (показатель степенной зависимости) определяет отрицательный наклон прямой линии.
Степенные распределения[121] имеют некоторые нелогичные, с точки зрения традиционной статистики, свойства. Например, в отличие от нормального распределения, их моды, медианы и средние значения не совпадают из-за скошенной асимметричной формы L-образных кривых. Президент Буш извлек из этого немалую пользу, заявив в 2003 году, что сокращение налогов позволило каждой семье сэкономить в среднем 1586 долларов[122]. Хотя математически это верно, здесь он к своей выгоде взял за основу среднее значение вычета, под которым скрывались огромные вычеты в сотни тысяч долларов, полученные 0,1 % богатейшего населения страны. Известно, что «хвост» в правой части распределения дохода следует степенной зависимости, и в подобной ситуации использование средней величины вводит в заблуждение, поскольку она далека от своего реального значения. В действительности большинству семей вернули менее 650 долларов. В данном распределении медиана значительно меньше, чем среднее значение.
Этот пример демонстрирует важнейшее свойство распределений степенной зависимости: они имеют «тяжелые хвосты» по сравнению по крайней мере с маленькими «жидкими хвостиками» нормального распределения. Подобные большие хвосты хотя и редкость, но встречаются чаще в распределениях данных, чем обычные колоколообразные кривые.
В «черный понедельник», 19 октября 1987 года, промышленный индекс Доу-Джонса упал на 22 %. По сравнению с обычным уровнем нестабильности на фондовом рынке это падение составило более двадцати стандартных отклонений. Согласно традиционной статистике (в которой используется нормальное распределение), подобное событие практически невозможно: его вероятность составляет менее чем один случай на 100 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 (10 в 50 степени). Однако это произошло — поскольку колебания цен на фондовом рынке[123] не соответствовали нормальному распределению. Для их описания лучше подходят распределения с «тяжелым хвостом».
Подобное происходит с землетрясениями, пожарами и наводнениями, что усложняет страховым компаниям задачу управления рисками. Такая же математическая модель описывает число погибших в результате войн и террористических атак, а также другие, гораздо более мирные вещи, такие как количество слов в романе или число сексуальных партнеров у человека.
Хотя прилагательные, используемые для описания длинных хвостов, выставляют их в не слишком выгодном свете, «хвостатые» распределения гордо несут свои хвосты. Жирный, тяжелый и длинный? Да, это так. Но в таком случае покажите, какой нормальный?
23. Шансы — это…
Вам когда-нибудь снился страшный сон, будто вам нужно сдать экзамен по предмету, который вы не изучали? Преподавателям обычно снятся «противоположные» сны: что они читают лекцию по дисциплине, о которой ничего не знают.
Такое случается со мной, когда я веду курс теории вероятностей[124]. Меня никогда ей не учили, и то, что мне приходится читать лекции по этому предмету, — страшно, смешно и очень похоже на дом с привидениями в парке развлечений.
Однако чаще всего мое сердце колотится, когда я сталкиваюсь с темой условной вероятности, то есть вероятности того, что некое событие А произойдет при условии, что произойдет некое событие B. Это скользкое понятие легко спутать с вероятностью наступления B при условии A. Однако это разные вещи, и нужно быть очень внимательным при вычислении их вероятностей. В качестве примера рассмотрим следующую задачу.
Прежде чем отправиться на недельный отдых, вы просите приятеля поливать ваши комнатные цветы, которые и так еле живы. Если их не поливать, то вероятность того, что они погибнут, составит 90 %. Если поливать регулярно, то вероятность их гибели будет равна 20 %. Вероятность того, что ваш друг забудет их полить, составляет 30 %. Вопрос А: какова вероятность того, что ваши растения не погибнут за эту неделю? Вопрос В: если по возвращении вы обнаружите, что они засохли, какова вероятность того, что ваш друг забыл их полить? Вопрос С: если ваш друг забыл их полить, какова вероятность того, что они погибнут к вашему возвращению? Хотя вопросы В и С звучат похоже, они разные. В действительности в условии задачи уже содержится ответ на вопрос С — 90 %. Однако как учесть все вероятности, чтобы получить ответы на вопросы В и А?[125]
Естественно, на протяжении нескольких первых семестров преподавания этой темы я засел за книги и стал делать медленные, но верные успехи. И постепенно начал кое-что замечать. Многие мои студенты не использовали теорему Байеса, которой я их обучал, а решали задачу равноценным способом, казавшимся им более простым.
Открытия, год за годом совершаемые изобретательными студентами, стали для меня лучшим способом размышления над условными вероятностями. В предложенных способах решения студенты прибегали к помощи интуиции, вместо того чтобы отвергать ее. Трюк состоял в том, чтобы мыслить натуральными числами, а не абстрактными категориями, такими как процентное соотношение, шансы или вероятности. Как только вы перестроите свое сознание, туман рассеется.
Это главная идея захватывающей книги Calculated Risks («Просчитанные риски») Герда Гигеренцера, когнитивного психолога из Института человеческого развития Макса Планка в Берлине. В ряде исследований, посвященных медицинским и правовым проблемам, от консультаций больных СПИДом до анализа ДНК по отпечаткам пальцев, Гигеренцер изучает заблуждения при подсчетах рисков и неопределенности. Однако вместо того чтобы брюзжать и оплакивать человеческую слабость, он демонстрирует, как избежать заблуждений, переводя задачи условной вероятности на язык натуральных чисел, подобно тому как это делали мои студенты.
В одном из исследований Гигеренцер и его коллеги проводили опрос врачей в Германии и США, в ходе которого просили оценить вероятность того, что женщина с положительной маммографией больна раком груди, даже если она входит в группу с низким уровнем риска, то есть ее возраст от 40 до 50 лет, отсутствуют симптомы и наследственная предрасположенность[126]. Чтобы конкретизировать вопрос, врачей также просили привести следующую статистику в процентах и степени вероятности: данные о распространенности рака груди среди женщин этой категории, а также о чувствительности маммографии и вероятности ложноположительных результатов.
Вероятность того, что у одной из этих женщин рак груди, составляет 0,8 %. Если же женщина действительно больна, то вероятность того, что ее маммография будет положительной, равна 90 %. Тем не менее, если женщина здорова, вероятность того, что ее маммография окажется положительной, составляет 7 %. Допустим, у женщины положительная маммография. Какова вероятность того, что она действительно больна раком груди?
Гигеренцер описывает реакцию первого опрошенного им врача, заведующего отделением университетского госпиталя, имеющего более тридцати лет профессионального опыта.
Было очевидно, что он очень нервничал, пытаясь проанализировать все цифры. И в конечном итоге пришел к выводу, что вероятность того, что у женщины рак груди, при условии положительной маммографии, составляет 90 %. Он нервно добавил: «Боже, полный абсурд. Я не могу с этим согласиться. Попробуйте задать вопрос моей дочери, она учится на врача». Он знал, что его оценка ошибочна, однако не знал, как это аргументировать. Потратив 10 минут на обдумывание ответа, он не смог просчитать, какое заключение сделать из имеющихся вероятностей.
Гигеренцер задал тот же вопрос двадцати четырем немецким врачам; их оценки варьировались от 1 до 90 %. Восемь посчитали, что вероятность составляет 10 и менее процентов, еще восемь назвали результат 90 %, а предположения еще восьмерых колебались в пределах 50–80 %. Представьте, каково было бы пациентке слышать столь противоречивые мнения.
Что касается американских врачей, девяносто пять из ста решили, что вероятность того, что женщина больна, равна примерно 75 %.
Правильный ответ: 9 %.
Как получилось, что процент столь низкий? Гигеренцер утверждает, что анализ становится практически прозрачным, если перевести исходную информацию из процентного соотношения и вероятностей в натуральные числа возможных исходов.
У восьми женщин из тысячи рак груди, причем у семи из них положительная маммография. Среди оставшихся 992 женщин положительную маммографию будут иметь примерно 70. Возьмем женщин, обследование которых дало положительный результат. Сколько из них действительно больны раком груди?
Так как всего в группу риска попало 77 (7 + 70 = 77) женщин — но только семь из них на самом деле больны раком груди, — вероятность того, что у женщины рак груди, при условии положительной маммографии, составляет 7 из 77, или 1 из 11, то есть примерно 9 %.
Отметим два упрощения в приведенных выше подсчетах. Во-первых, мы округлили десятые доли до целых чисел. Так бывает в случаях, подобных тому, где мы сказали «Из восьми женщин, больных раком груди, семь имеют положительную маммографию». В действительности надо было сказать: 90 % из 8 женщин, или 7,2. Таким образом, мы немного пожертвовали точностью для большей ясности изложения.
Во-вторых, мы исходили из того, что все происходит именно с той частотностью, которая предполагается данной вероятностью. Например, поскольку вероятность рака груди составляет 0,8 %, мы предположили, что им больны именно 8 женщин из 1000 нашей гипотетической выборки. Но эти цифры могут не совпадать с реальностью. События не обязаны соответствовать вероятности своего наступления, ведь, если подбросить монетку 1000 раз, необязательно 500 раз выпадет орел. Но, решив, что так и будет, мы получим правильный ответ для подобных задач.
Обычно такая логика считается несколько сомнительной, поэтому ученые мужи смотрят свысока на данный подход в сравнении с более строгой, но сложной в использовании теоремой Байеса. Однако ясность ответа является достаточным аргументом для его применения. Когда Гигеренцер провел повторный опрос еще среди двадцати четырех врачей, на этот раз используя целочисленные вероятности, практически все ответили правильно.
Хотя перевод данных в натуральные числа возможных исходов оказывает нам огромную услугу, задачи по условной вероятности могут ставить в тупик по другим причинам[127]. Здесь существует опасность неверной постановки вопроса или подсчета правильной, но вводящей в заблуждение вероятности.
Этим грешили как обвинение, так и защита во время судебного процесса над О. Дж. Симпсоном в 1994–1995 годах[128]. Обе стороны попросили суд рассмотреть ложную условную вероятность.
Обвинение в течение первых десяти дней процесса доказывало, что Симпсон неоднократно проявлял насилие в отношении своей бывшей жены Николь Браун: регулярно избивал, унижал и прилюдно раздевал, говоря окружающим: «Это принадлежит мне». Однако каким образом эти действия относились к процессу об убийстве? Аргументом обвинения было то, что насилие в семье выступало как мотив убийства. По словам одного из обвинителей, «удар — это прелюдия убийства».
Защитник обвиняемого Алан Дершовиц[129] приводил доводы, что даже если бы голословные утверждения о домашнем насилии оказались правдой, они не относятся к делу и, следовательно, недопустимы. Позднее он написал: «Нам необходимо было доказать, что среди тех, кто избивает своих партнеров, лишь ничтожно малое число, менее 1 из 2500, совершают убийство».
В действительности же обе стороны просили суд рассмотреть вероятность того, что Симпсон убил бывшую жену, принимая во внимание тот факт, что при жизни он ее избивал. Однако специалист в области статистики И. Гуд отметил, что для этого не существует верного доказательства, на которое можно было бы сослаться.
Вопрос на самом деле в следующем: какова вероятность того, что муж убил свою бывшую жену, если до убийства он ее бил и она была кем-то убита? Условная вероятность в таком случае очень далека от схемы 1 на 2500.
Чтобы разобраться почему, представим себе выборку из 100 тысяч избитых женщин. Ссылаясь на предоставленные Дершовицем цифры — 1 из 2500, допустим, что примерно сорок из этих женщин были убиты мужьями в этом году (поскольку 100 000 разделить на 2500 равно 40). Можно также предположить, что еще трое из них убиты кем-либо другим[130] (эта оценка основана на статистике ФБР, касающейся количества женщин, убитых в 1992 году). Итак, из этих 43 жертв 40 были убиты теми, кто их избивал. Другими словами, в 93 % случаев убийцей являлось лицо, избивавшее женщину.
Не путайте это число с вероятностью того, что это сделал Симпсон. Она зависит от множества других обстоятельств, от разных «за» и «против». Например, от заявления защиты о том, что полиция выдвинула Симпсону ложные обвинения, а также от заявления обвинения, что убийца и Симпсон носили одинаковую обувь, перчатки и имели почти одинаковый код ДНК.
Какова вероятность того, что что-нибудь из перечисленного изменит ваше мнение о вынесенном приговоре? Ноль.
24. Распутывание всемирной паутины
В те далекие времена, когда Google еще не существовало, поиск в сети был безнадежным занятием[131]. Сайты, предлагаемые старыми поисковыми машинами, часто не соответствовали запросу, а те, которые содержали нужную информацию, были либо глубоко запрятаны в списке результатов, либо вообще отсутствовали.
Алгоритмы на основе анализа ссылок решили проблему, проникнув в суть парадокса, подобного коанам дзен: в результате поиска в интернете должны были отображаться лучшие страницы. А что же, кузнечик[132], делает страницу лучшей? Когда на нее ссылаются другие не менее хорошие страницы.
Звучит подобно рассуждениям про замкнутый круг.[133] Так и есть. Именно поэтому все настолько сложно. Ухватившись за эту идею и превратив ее в преимущество, алгоритм анализа ссылок дает решение поиска в сети в стиле джиу-джитсу.
Этот подход построен на идеях, взятых из линейной алгебры[134], изучения векторов и матриц. Если вы хотите выявить закономерности в огромном скоплении данных или выполнить гигантские вычисления с миллионами переменных, линейная алгебра предоставит для этого все необходимые инструменты[135]. С ее помощью был построен фундамент для алгоритма PageRank[136], положенного в основу Google. Она также помогает ученым классифицировать человеческие лица[137], провести анализ голосования в Верховном суде[138], а также выиграть приз Netflix[139] (вручаемый команде, сумевшей улучшить более чем на 10 % систему Netflix, на основе которой составляются рекомендации для просмотра лучших фильмов).
Чтобы изучить линейную алгебру в действии, рассмотрим, как работает алгоритм PageRank. А чтобы выявить его сущность без лишней суеты, представим игрушечную паутину, состоящую всего из трех страниц, связанных между собой следующим образом:
Стрелки указывают, что страница X содержит ссылку на страницу Y, однако Y не отвечает ей взаимностью. Наоборот, Y ссылается на Z. Тем временем X и Z ссылаются друг на друга, сцепившись между собой цифровыми лапками.
Какие страницы самые важные в этой маленькой паутине? Вы можете подумать, что это невозможно определить из-за недостатка информации об их содержимом. Но такой способ мышления устарел. Беспокойство по поводу контента вылилось в неудобный способ ранжирования страниц. Компьютеры мало понимают в смысловом наполнении, а люди не справляются с тысячами новых страниц, которые каждый день появляются в сети.
Подход, придуманный Ларри Пейджем и Сергеем Брином, аспирантами университета и основателями Google, состоял в том, чтобы позволить страницам самим ранжироваться в определенном порядке, голосуя ссылками. В приведенном выше примере страницы X и Y ссылаются на Z, благодаря чему Z становится единственной страницей с двумя входящими ссылками. Следовательно, она и будет самой популярной страницей в данной среде. Однако если ссылки поступают со страниц сомнительного качества, они станут работать против себя. Популярность сама по себе ничего не значит. Главное — иметь ссылки с хороших страниц.
И здесь мы снова оказывается в замкнутом круге. Страница считается хорошей, если на нее ссылаются хорошие страницы, но кто изначально решает, какие из них хорошие?
Это решает сеть. Вот как все происходит. (Далее я буду пропускать некоторые подробности, изложенные в примечании[140].)
Алгоритм Google назначает для каждой страницы дробное число от 0 до 1. Это численное значение называется PageRank и измеряет «важность» страницы по отношению к другим, высчитывая относительное количество времени, которое гипотетический пользователь потратит на ее посещение. Хотя пользователь может выбирать более чем из одной исходящей ссылки, он выбирает ее случайно с равной вероятностью. При таком подходе страницы считаются более авторитетными, если они чаще посещаются.
А поскольку индексы PageRank определяются как пропорции, их сумма по всей сети должна составлять 1. Этот закон сохранения предполагает другой, возможно, более осязаемый способ визуализации PageRank. Представьте его как жидкое вещество, текущее по сети, количество которого уменьшается на плохих страницах и увеличивается на хороших. С помощью алгоритма мы пытаемся определить, как эта жидкость распределяется по интернету на протяжении длительного времени.
Ответ получим в результате многократно повторяющегося следующего процесса. Алгоритм начинается с некоего предположения, затем обновляет все значения PageRank, распределяя жидкость в равных частях по исходящим ссылкам, после этого она проходит несколько кругов, пока не установится определенное состояние, при котором страницы получат причитающуюся им долю.
Изначально алгоритм задает равные доли, что позволяет каждой странице получить одинаковое количество PageRank. В нашем примере три страницы, и каждая из них начинает движение по алгоритму со счетом 1/3.
Начальные значения PageRank
Затем счет обновляется, отображая реальное значение каждой страницы. Правило состоит в том, что каждая страница берет свой PageRank с последнего круга и равномерно распределяет его по всем страницам, на которые ссылается. Следовательно, обновленное значение страницы X после прохождения первого круга по-прежнему равно 1/3, поскольку именно столько PageRank она получает от Z, единственной страницы, которая на нее ссылается. При этом счет страницы Y уменьшается до 1/6, так как она получает только половину PageRank от X после предыдущего круга. Вторая половина переходит к странице Z, что делает ее победителем на данном этапе, поскольку она добавляет себе еще 1/6 от страницы X, а также 1/3 от Y, и всего получается 1/2. Таким образом, после первого круга мы имеем следующие значения PageRank:
Значения PageRank после одного обновления
В последующих кругах правило обновления остается прежним. Если обозначить через x, y, z текущий счет страниц X, Y и Z, то в результате обновления получим такой счет:
х' = z
y' = x
z' = x + y,
где штрихи говорят о том, что произошло обновление. Подобные многократно повторяющиеся вычисления удобно выполнять в электронной таблице (или вручную, если сеть маленькая, как в нашем случае).
После десяти повторений обнаружим, что от обновления к обновлению цифры практически не меняются. К этому моменту доля X составит 40,6 % от всего PageRank, доля Y — 19,8 %, а Z — 39,6 %. Эти значения подозрительно близки к числам 40, 20 и 40 %, что говорит о том, что алгоритм должен к ним сходиться.
Так и есть. Эти предельные значения алгоритм Google и определяет для сети как PageRank.
Предельные значения PageRank
Вывод для данной маленькой сети такой: страницы X и Z одинаково важны, несмотря на то что у Z в два раза больше входящих ссылок. Это и понятно: страница X равна Z по значимости, поскольку она получает от нее полное одобрение, однако взамен дает ей лишь половину своего одобрения. Вторая половина тправляется Y. Это также объясняет, почему Y достается только половина от долей X и Z.
Интересно, что эти значения можно получить, не прибегая к многократным итерациям. Надо просто подумать над условиями, определяющими стационарное состояние. Если после очередного обновления ничего не меняется, то x' = x, y' = y и z' = z. Поэтому, заменив переменные со штрихом в уравнениях обновлений на их эквиваленты без штрихов, получим систему уравнений
х = z
y = x
z = x + y,
при решении которой x = 2y = z. Поскольку сумма значений x, y и z должна равняться 1, отсюда следует, что x = 2/5, y = 1/5 и z = 2/5, что соответствует ранее найденным значениям.
Давайте на мгновение вернемся назад и посмотрим, как все это вписывается в широкий контекст линейной алгебры. Приведенное выше уравнение стационарного состояния, так же как и уравнения обновления, содержащие штрихи, — типичные примеры линейных уравнений. Они называются линейными, поскольку описывают прямые линии: переменные x, y, z в этих уравнениях в первой степени, так же как и в знакомом нам из курса алгебры средней школы уравнении прямой y = mx + b.
Линейные уравнения, в противоположность уравнениям, содержащим нелинейные члены, например x2 или yz, либо sin x, решаются относительно просто. Сложности начинаются там, где в уравнениях присутствует огромное количество переменных, как это происходит в реальной сети. Поэтому одной из центральных задач линейной алгебры является разработка более быстрых алгоритмов для решения больших систем уравнений. Даже незначительные усовершенствования этих алгоритмов ощущаются практически во всех сферах жизни — от расписания авиарейсов до сжатия изображения.
Однако самой существенной победой линейной алгебры, с точки зрения ее роли в повседневной жизни, безусловно, стало решение парадокса дзен-буддизма для ранжирования страниц. «Страница хороша в той мере, в какой хорошие страницы ссылаются на нее». Переведенный в математические символы, этот критерий становится алгоритмом PageRank.
Поисковик Google стал тем, чем он есть сегодня, после решения уравнения, которое и мы с вами только что решили, но с миллиардами переменных — и, соответственно, с миллиардными прибылями.
Часть VI. Границы возможного
25. Самые одинокие числа
Как поется в знаменитой песне 1960-х годов, один — самое одинокое число[141], хотя, вдвоем порой бывает еще хуже, чем одному. Возможно, так и есть, но и с простыми числами тоже все непросто.
Паоло Джордано объясняет почему в своем бестселлере The Solitude of Prime Numbers («Одиночество простых чисел»)[142]. Это меланхолическая история любви двух затерянных в жизни людей, двух простых чисел, Маттиа и Аличе. В детстве им пришлось пережить трагедию, вследствие которой они практически перестали общаться с окружающими, но нашли друг в друге родственные души. Джордано пишет.
Простые числа делятся только на единицу и самих себя. Они занимают свое место в бесконечном ряду простых чисел, которые, как и остальные числа, зажаты между двумя другими, но на один шаг дальше, чем предыдущие. Эти числа подозрительны и одиноки, и Маттиа казалось, что они волшебные. Иногда он думал, что они очутились в этом ряду по ошибке, как жемчужины, нанизанные на нитку ожерелья. А порой ловил себя на мысли, что они тоже предпочли бы быть обычными числами, однако по какой-то причине не сложилось. […]
Учась на первом курсе университета, Маттиа узнал, что среди простых чисел есть еще более причудливые экземпляры. Математики называют их простыми числами-близнецами: это пара близлежащих друг к другу чисел, находящихся почти рядом, но между ними всегда стоит четное число, которое не дает им по-настоящему воссоединиться. Это, например, числа 11 и 13, 17 и 19, 41 и 43. Если набраться терпения и продолжить считать дальше, то вы увидите, что постепенно такие пары встречаются все реже. Вы сталкиваетесь с простыми числами, которые становятся все более одинокими, потерянными в этом молчаливом, измеренном пространстве, состоящем только из цифр, и у вас возникает тяжелое предчувствие того, что предыдущие пары чисел были случайными, и их истинное предназначение — одиночество. Потом, когда вы уже готовы сдаться и вам больше не хочется считать, вы встречаете еще одну пару близнецов, крепко держащихся друг за друга. Среди математиков существует убеждение, что, как бы далеко ты ни зашел, всегда можно найти еще пару чисел, даже если никто точно не знает, где они будут обнаружены.
Маттиа думал, что они с Аличе похожи на эти простые числа-близнецы, одинокие и потерянные, близкие, но не до такой степени, чтобы прикоснуться друг к другу.
Здесь я хотел бы остановиться на нескольких красивых идеях из приведенного отрывка, в частности на моменте, касающемся одиночества простых чисел и простых чисел-близнецов. Эти проблемы — центральные в теории чисел[143], самой чистой области математики, изучающей целые числа и их свойства.
Однако прежде чем подняться в облака, давайте разберемся с вопросом, который часто возникает у прагматиков. Есть ли какая-либо польза от теории чисел? Есть. Теория чисел представляет собой основу алгоритмов[144], ежедневно используемых, чтобы обеспечить безопасность проведения транзакций в интернете, а также для шифрования секретных переговоров, имеющих стратегическое значение. Эти алгоритмы построены на сложности разложения очень больших чисел на простые множители.
Но это не единственная причина, по которой математики так одержимы простыми числами. Истинная причина кроется в их фундаментальности. Простые числа — атомы арифметики. Согласно греческому происхождению слова «атом», простые числа являются «атомными», то есть «неделимыми». И подобно тому как все сложено из атомов, каждое число слагается из простых чисел. Например, 60 равно 2 2 3 5. Мы говорим, что 60 — это составное число, и его можно представить в виде произведения простых множителей 2 (дважды), 3 и 5.
А как быть с 1? Это простое число? Нет. И когда мы поймем это, то узнаем, почему 1 — самое одинокое число, даже более одинокое, чем любое простое число.
Оно не заслуживает того, чтобы принимать его во внимание. Учитывая то, что число 1 делится только на 1 и на само себя, его действительно можно считать простым числом, как это и было на протяжении многих лет. Однако современные математики решили удалить его из простых чисел исключительно ради удобства. Если бы число 1 принималось во внимание, оно нарушило бы ход доказательства теоремы, а ее хотелось бы считать верной. Другими словами, мы изменили определение простых чисел, чтобы получить желаемую теорему, согласно которой любое число можно разложить на множители из простых чисел единственным способом. Однако если рассматривать число 1 как простое, разложение на множители не будет единственным. Например, 6 равно 2 3, но оно также равно 1 2 3, 1 1 2 3 и так далее, и нам пришлось бы согласиться, что все эти варианты правомочны. Конечно, это глупо, но мы были бы обречены на такие муки, если бы включили число 1 в состав простых чисел.
Эта маленькая грязная история весьма поучительна и приоткрывает завесу тайны над тем, как иногда делается математика. Наивно полагать, что мы создаем нерушимые определения, а затем выводим из них любые теоремы. Все не так просто. В данном случае при желании мы можем изменить формулировку, тем более что незначительная коррекция позволяет получить более чистую теорему.
Теперь, когда мы отбросили число 1, давайте посмотрим на другие, полноценные простые числа. Главное, что мы о них знаем, — они непостижимы и непроницаемы. Еще никто никогда не наодил для них точной формулы. В отличие от настоящих атомов, они не следуют никакой простой модели и совсем не похожи на периодическую таблицу элементов.
Предупреждающие знаки сразу же можно увидеть уже в первых десяти простых числах: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29. Первое, что бросается в глаза, — их ряд начинается с нехорошего числа 2. Это число-чудак — самый большой неудачник. Оно единственное из простых чисел имеет несчастье быть четным. Неудивительно, что «это самое одинокое число после числа один» (как поется в песне).
Кроме 2, все остальные простые числа нечетные — но все же странные. Посмотрите, какие между ними расстояния: иногда два интервала (как между числами 5 и 7), иногда четыре (13 и 17), а порой шесть (23 и 29).
Чтобы еще сильнее убедиться, насколько беспорядочно расположены простые числа, сравните их с их добропорядочными братьями — нечетными числами 1, 3, 5, 7, 9, 11, 13… Интервалы между нечетными числами всегда одинаковы: два интервала, равномерные, как барабанная дробь. Таким образом, они подчиняются простой формуле: n-е нечетное число равно 2n — 1. Простые числа, наоборот, маршируют под собственный барабан в ритме, который, кроме них, больше никто не слышит.
Учитывая нерегулярность интервалов между простыми числами, некоторые теоретики решили рассматривать их статистически, как членов некоей совокупности, вместо того чтобы искать их отличительные особенности. В частности, давайте посмотрим, как они распределяются среди обычных целых чисел. Сколько существует простых чисел, которые меньше либо равны 10? Или 100? Или произвольному числу N? Эта конструкция — прямой аналог статистического понятия функции распределения.
Представьте, что вы считаете простые числа, прогуливаясь между ними, подобно переписчику во время переписи населения. Изобразите их на оси x. Вы начинаете с числа 1 и идете вправо, подсчитывая простые числа, попадающиеся на пути. Ваш текущий результат будет выглядеть примерно так:
Значения на оси y показывают, сколько простых чисел вы насчитали, пока дошли до данного местоположения x. Для всех x меньше 2 значением на оси y будет 0, поскольку еще не попадались простые числа. Первое простое число появляется на отметке x = 2. И в этом месте график подскакивает вверх. (Попалось!) Затем он остается плоским до отметки x = 3, после чего делает скачок еще на один шаг. Такие чередования прыжков и горизонтальных отрезков образуют странную лестницу неправильной формы. Математики называют ее считающей функцией простых чисел.
Сравните эту картину с аналогичной картиной для нечетных чисел.
Здесь лестница идеально правильная, следуя линии с наклоном — потому что интервал между соседними нечетными числами всегда равен 2.
Есть ли хоть какая-нибудь надежда найти что-нибудь подобное для простых чисел, несмотря на их блуждающий характер? Как это ни удивительно, есть. Ключ к разгадке в том, чтобы сосредоточиться на общей форме линии, а не на отдельных ступенях лестницы. Если мы уменьшим масштаб, из всей этой кажущейся неразберихи начнет вырисовываться кривая. Посмотрите на график функции нахождения всех простых чисел до 100.
Теперь мы меньше отвлекаемся на отдельные ступеньки. Кривая выглядит еще ровнее, если сосчитать все простые числа до миллиарда.
В противоположность первому впечатлению эта кривая не является прямой линией. По мере роста она слегка изгибается книзу. Такой изгиб означает, что простые числа становятся более редкими, изолированными и одинокими. Это то, что Джордано имел в виду, говоря про «одиночество простых чисел».
Такая разреженность кажется еще очевиднее, если посмотреть на данные «переписи» под другим углом. Помните, мы насчитали десять простых чисел среди первых тридцати целых чисел? Таким образом, там, где числовая прямая берет свое начало, примерно одно из трех чисел является целым, что составляет стабильные 33 %. Однако среди первой сотни чисел простых только двадцать пять. Их ряды сократились до одного из четырех, составляя уже 25 %, что вызывает беспокойство. А среди первого миллиарда чисел простых всего лишь 5 %.
И это суровый вестник наклоняющейся кривой. Простые числа похожи на вымирающее поколение. Они никогда не исчезают полностью — со времен Евклида известно, что они никогда не заканчиваются, но почти целиком растворяются в обычных целых числах.
Найдя функции, которые приблизительно соответствуют этой наклоняющейся кривой, теоретики чисел измерили, насколько одиноки простые числа, и выразили в виде формулы типичное расстояние между ними. Если N — большое число, то средний интервал между простыми числами, ближайшими к N, приблизительно равен lnN, то есть натуральному логарифму от N. (Натуральный логарифм ведет себя так же, как и обычный десятичный логарифм, изучаемый в средней школе, но в его основе лежит число e, а не 10. Он является натуральным в том смысле, что повсюду встречается в высшей математике, входя в окружение числа e. Подробнее о повсеместном использовании числа e читайте в главе 19.)
Хотя формула lnN для вычисления среднего промежутка между простыми числами не слишком хорошо работает для малых N, ее эффективность улучшается при приближении N к бесконечности, где ошибка формулы в процентном соотношении приближается к нулю. Чтобы получить представление об этих числах, допустим, что N = 1000. Выясняется, что существует 168 простых чисел меньше 1000 и что средний промежуток между ними в этой части числовой прямой составляет 1000/68, или примерно 5,9. Для сравнения, согласно формуле средний интервал должен равняться ln(1000) 6,9, что превышает реальное значение примерно на 17 %. Но если мы пойдем дальше, скажем, для N = 1 000 000 000, то реальный и вычисленный по формуле интервалы составят 19,7 и 20,7 соответственно, и разность между ними будет примерно 5 %.
Формула lnN, где N стремится к бесконечности, сегодня известна как теорема простых чисел[145]. Она впервые была записана (но не опубликована) Карлом Гауссом[146] в 1792 году, когда ему было всего пятнадцать лет. (Видите, на что способен ребенок, лишенный развлечений в виде игровой приставки?)
Что же касается других молодых людей, о которых шла речь в этой главе, Маттиа и Аличе, то, я надеюсь, вы оценили, насколько это захватывающе, что два простых числа-близнеца[147] продолжают существовать в самых далеких пространствах числовой прямой, «в этом молчаливом измеренном пространстве, состоящем только их цифр». Против них ополчилась целая армия нечетных чисел. Согласно теореме простых чисел, любое отдельно взятое простое число, находящееся вблизи N, не имеет права ожидать, что его потенциальный друг приблизится к нему ближе чем на lnN и пропасть между ними намного превышает 2, если N — большое число.
Но все-таки некоторые пары побеждают нечетные числа. Компьютеры нашли простые числа-близнецы в невероятно отдаленных областях числовой прямой. Где-то вдали уютно устроилась самая большая известная пара двух чисел, каждое из которых состоит из 100 355 десятичных цифр.
Согласно гипотезе о простых числах, подобные пары будут появляться всегда.
Так не попробовать ли нам поискать поблизости от этих чисел еще какую-нибудь парочку простых чисел[148], чтобы сообразить с ними на четверых? Удачных поисков!
26. Групповое мышление
Мы с женой спим совершенно по-разному, и это видно по нашему матрасу. Она подминает под себя подушки, всю ночь ворочается, и матрас под ней практически не вдавлен. А я сплю на спине, в позе мумии, отчего на моей стороне кровати образуется впадина.
Производители кроватей екомендуют периодически переворачивать матрас, вероятно, имея в виду таких людей, как я. Но как это лучше сделать? Как именно его надо переворачивать, чтобы он изнашивался максимально равномерно?
Брайан Хэйес изучает эту проблему на небольшом опыте, который описывает в книге Group Theory in the Bedroom («Теория групп в спальне»). Отбросим двусмысленности, поскольку «группа», о которой пойдет речь, представляет собой совокупность математических действий, то есть всех возможных способов переворачивания или разворачивания матраса, чтобы он при этом точно совпадал с каркасом кровати.
Надеюсь, подробное рассмотрение математики матраса[149] позволит вам получить более общее представление о теории групп[150], одном из самых многогранных разделов математики. Эта теория лежит в основе всего — от хореографии народного танца и фундаментальных законов физики элементарных частиц до мозаики Альгамбры с ее хаотичными элементами[151], показанными на этой картинке.
Как видно из этих примеров, теория групп — это связующее звено между искусством и наукой. Она обращается к тому, что является общим для этих двух областей — неизменному очарованию симметрии. Охватывая столь широкий круг явлений, теория групп неизбежно будет абстрактной. Она вскрывает саму сущность симметрии.
Обычно считается, что симметрия — свойство формы. Однако специалистов в области теории групп больше интересует, что можно сделать с формой, в частности все способы ее изменения, оставив при этом без изменений что-то другое. Точнее, они занимаются поиском всех преобразований, в результате которых форма остается неизменной при соблюдении ряда ограничений. Эти преобразования называются симметриями формы. Вместе взятые, они составляют группу, то есть совокупность изменений, чьи отношения определяют основную архитектуру формы.
В случае с матрасом преобразования приводят к изменению его положения в пространстве (в этом состоит изменение), однако при этом сохраняется его упругость (в этом состоит ограничение). В результате матрас должен идеально ложиться на каркас кровати (то, что остается неизменным). Взяв за основу перечисленные правила, рассмотрим, какие преобразования свойственны элементам этой замечательной маленькой группы. Оказывается, их всего четыре.
Первое состоит в том, чтобы ничего не делать, — отличный выбор для лентяев, предпочитающих не трогать матрас. Несомненно, такое преобразование удовлетворяет всем правилам, однако вряд ли продлит жизнь матраса. Тем не менее чрезвычайно важно включить его в группу. Оно играет в теории групп такую же роль, как 0 в сложении чисел и 1 в умножении. Математики называют его нейтральным (или единичным) элементом, я обозначу его символом I.
При следующих трех способах действительно придется переворачивать матрас. Чтобы различать их, приклеим на углы матраса этикетки с номерами.
Картинка, на которой изображен первый способ переворачивания, находится в начале главы. На ней симпатичный мужчина в полосатой пижаме пытается перевернуть матрас на 180 градусов. Этот горизонтальный переворот обозначим как H.
Вертикальный переворот обозначим как V. При этом маневре матрас сначала находится в вертикальном положении, так что почти достает до потолка, а затем опрокидывается на другую сторону. Помимо грохота, который вы наделаете, чистым результатом вашего действия станет поворот матраса на 180 градусов вокруг поперечной оси, как показано ниже.
Наконец, можно повернуть матрас на пол-оборота, не поднимая его с кровати.
В отличие от переворачиваний H и V, при повороте R верхняя поверхность матраса остается вверху.
Теперь посмотрим на матрас, чтобы понять, в чем разница между его переворотами. Представим себе, что он полупрозрачный, взглянем на него сверху и проверим числа в углах матраса после каждой из возможных трансформаций. При горизонтальном переворачивании получаем зеркальное отражение чисел. Они тоже изменили порядок, поскольку числа 1 и 2 и 3 и 4 поменялись местами.
При вертикальном переворачивании порядок чисел тоже изменился, но по-другому: они, помимо своего зеркального отражения, еще и перевернулись вверх тормашками.
При вращении зеркального отражения не получается, а числа повернулись кверху вниз, и там, где была 1, теперь 4, а вместо 2 появилось 3.
Однако это лишь детали. Самое главное — как эти преобразования соотносятся друг с другом. В схемах их взаимодействия зашифрована симметрия матраса.
Чтобы выявить их с минимальными усилиями, нарисуем следующую диаграмму.
В углах схемы изображены четыре возможных положения матраса. Картинка в левом верхнем углу является точкой отсчета. Стрелка указывает на движения, совершаемые матрасом при переходе из одного положения в другое.
Например, стрелка, ведущая из верхнего левого угла к нижнему правому, описывает вращение R. Она двусторонняя, поскольку, если выполнить действие R дважды, это будет равносильно возврату в исходное положение.
Данное свойство поворота можно описать уравнением RR = I, где RR означает «дважды выполнить действие R», а I является нейтральным элементом, означающим отсутствие действия. При горизонтальном и вертикальном переворачивании тоже происходит отмена этих преобразований: HH = I и VV = I.
На схеме также представлено много другой информации. Например, здесь показано, что рискованное вертикальное переворачивание V эквивалентно действию HR, горизонтальному переворачиванию, сопровождаемому поворотом. Этот путь к аналогичному результату гораздо безопаснее. Данную последовательность действий можно записать в виде уравнения HR = V[152].
Следует также отметить, что порядок выполнения действий не имеет значения, поскольку HR = RH, и оба пути ведут к V. Это верно для любой другой пары действий. Вы можете подумать, что это подобно коммутативному (переместительному) закону для сложения обычных чисел x и y, согласно которому x + y = y + x. Однако будьте внимательны: группа в примере с матрасом — особый случай. Во многих других группах коммутативный закон нарушается. Подчиняющиеся ему группы-счастливчики будут особенно понятными и простыми.
А теперь итоги. Эта схема показывает, как добиться наиболее равномерного изнашивания матраса. Любая стратегия, примененная для всех четырех состояний, будет периодически работать. Например, чередование действий R и H удобно, а поскольку у нас есть возможность миновать шаг V, то нам не требуется много физических усилий. Чтобы напомнить о необходимости выполнять эти действия, некоторые производители дают такой совет: «весной — поворот, осенью — переворот».
Группа чисел, свойственная матрасу, иногда всплывает в самых неожиданных местах, начиная от симметрии молекул воды и заканчивая принципами действия пары электрических переключателей. В этом и состоит прелесть теории групп. Благодаря ей становится очевидным единство вещей, которые в других случаях кажутся не связанными между собой — как в анекдоте о том, как физик Ричард Фейнман получил отсрочку от призыва в армию[153].
Армейский психиатр попросил Фейнмана вытянуть вперед руки. Тот выполнил просьбу, выставив одну руку ладонью вверх, а вторую ладонью вниз. «Нет, по-другому», — сказал психиатр. Тогда Фейнман перевернул обе руки так, что одна ладонь опять оказалась вверху, а вторая внизу.
Фейнман не играл в игры разума, а просто решил немного пошутить в духе теории групп. Если рассмотреть все возможные способы вытягивания рук, а также различные переходы между ними, то стрелка образует такую же модель, как и в группе чисел матраса!
Однако все это слишком усложняет наши отношения с матрасами. Возможно, настоящий урок здесь тот, который вам и так известен: если вас что-нибудь беспокоит, ложитесь спать, и все пройдет.
27. Кручение и склеивание
В нашей местной начальной школе существует традиция приглашать в класс родителей для разговоров с детьми. Благодаря этому ребята узнают о различных профессиях и многих вещах, которым их не учат в школе.