Форма реальности Элленберг Джордан

ВЕЛИКИЙ ВЫЧИСЛИТЕЛЬ КОРНЕЙ

Каждый год в январе, в разгар студеной висконсинской зимы, в нашем районе проводится шоу талантов. Дети играют на скрипке, родители разыгрывают дурацкие скетчи. Я вычислял в уме квадратные корни, выступая под именем Великий Вычислитель Корней. И я победил! Трюку с вычислением квадратных корней в уме я научился в колледже. Его социальная полезность оказалась не такой большой, как я ожидал. Но я все равно вас ему научу.

Предположим, вас просят найти квадратный корень из 29. Чтобы трюк сработал, нужно хорошо знать квадраты, потому что у вас должно буквально соскальзывать с языка, что 5 в квадрате – это 25, а 6 в квадрате – 36. Рассмотрим теперь последовательность чисел

25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36.

Мы знаем только первый и последний из ее двенадцати членов; это 5 и 6. Нам нужно найти пятый член.

Предположим, что это арифметическая прогрессия. Хотя это не так, но давайте допустим. Великий Вычислитель Корней вам разрешает. Мы за 11 шагов переходим от 5 к 6; если все шаги одинаковы, то каждый шаг равен 1/11. Поэтому 29, который находится через четыре шага от 5, должен быть 54/11. О, я не забыл упомянуть, что еще нужно немножко уметь делить в уме? Возможно, вы знаете, что 1/11 – это примерно 0,09, так что 4/11 – это приблизительно 0,36; или вы можете прикинуть, что число 54/11 немного меньше, чем число 54/10, которое равно 5,4. В любом случае вы говорите: «Это где-то 5,3 с хвостиком, вероятно почти 5,4»[421]. (Истинное значение – примерно 5,385.)

Надеюсь, вы заметили принципиальное сходство с аргументацией Фарра, хотя мы использовали разности, а не отношения. Мы безосновательно (как и Фарр) решаем, что на самом деле все разности одинаковы, а затем, на основе имеющихся скудных данных, вычисляем разность нашей прогрессии. Это кажется неоправданным. Но ведь как-то работает!

Справедливо задаться вопросом: зачем я стал это делать (если не считать моей внутренней потребности превзойти соседского ребенка, который научился играть песню Free Fallin’)? Неужели я не мог просто нажать кнопку квадратного корня на своем калькуляторе? Мог. Но Уильям Фарр не мог. И астрономы VII века тоже не могли. Вот как далеко в прошлое уходит эта идея. Чтобы следить за движениями небесных тел, нужны значения тригонометрических функций; эти значения сохранялись в огромных таблицах, составленных с колоссальными затратами сил и времени. Для этих таблиц требовалась более высокая точность, чем может обеспечить мой фокус с квадратными корнями. Примерно в 600 году[422] возникла одна новая идея – у астронома и математика Брахмагупты из индийской исторической области Гурджарадеша и китайского астронома и создателя календаря Лю Чжо, жившего во времена династии Суй.

Нам незачем вдаваться в детали календаря империи, поэтому я для объяснения их метода ограничусь примером с квадратным корнем. С точки зрения арифметики это самая суровая часть во всей теме, так что предполагается, что вы не сможете проделывать это в уме на вечеринке в колледже, попивая пивко.

Чтобы применить подход Брахмагупты – Лю, понадобятся три квадратных корня, а не два: например: 16 = 4, 25 = 5, 36 = 6. От 16 до 36, то есть от 4 до 6 – двадцать шагов, поэтому если вы последуете рецепту Великого Вычислителя и предположите, что корни будут образовывать арифметическую прогрессию, то расстояние между ее членами будет 2/20. Я говорил вам, что это не совсем так, и вот доказательство: если бы эта последовательность была арифметической прогрессией, то 25 (девять шагов от 16) был бы 4,9, а он на самом деле равен 5.

Вот способ поправить дело. Только что мы убедились: нельзя настаивать на том, что квадратные корни образуют арифметическую прогрессию, если у нас есть какие-то три числа; иными словами, мы не можем считать все получающиеся разности одинаковыми.

Следующее предположение: пусть тогда эти разности сами образуют арифметическую прогрессию, то есть чтобы одинаковыми были разности между разностями! Но это в точности идея Фарра об отношениях отношений.

16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36

????????????????????

Итак, чтобы это сработало, нам нужна во второй строке арифметическая прогрессия из двадцати чисел, сумма которых равна 2 (она будет убывать, потому что расстояния между корнями становятся все меньше и меньше); однако при этом сумма первых девяти чисел должна составлять 1, потому что они ведут от 16 = 4 до 25 = 5. Оказывается, существует всего одна подходящая прогрессия. Вот удобный способ ее найти.

Поскольку первые девять членов в сумме дают 1, то их среднее равно 1/9. Однако среднее в арифметической прогрессии с нечетным числом членов – это ее средний член, в нашем случае пятый, поэтому он равен 1/9.

С другой стороны, сумма последних одиннадцати членов тоже равна 1, поэтому их среднее составляет 1/11. Значит, их средний член (то есть пятнадцатый во всей последовательности) равен 1/11.

16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36

???? 1/9????????? 1/11?????

И этого достаточно, чтобы восстановить всю прогрессию! От пятого члена до пятнадцатого – десять шагов, и при этом нам надо преодолеть расстояние от 1/9 до 1/11, то есть 2/99. Следовательно, каждый шаг равен 2/990. Это означает, что первая разность, которая на четыре шага больше, чем 1/9, равна 1/9 + 8/990 = 118/990, а последняя, которая на пять шагов меньше, чем 1/11, составляет 1/11 – 10/990 = 80/990[423].

16, 17 ………………………………………. 35, 36

118/990 ………………………………. 80/990

………..1/9 …………………..1/11 ……….

Так чему же равен 29 в соответствии с последними достижениями астрономии VII века? Чтобы дойти от 16 до 29, нужно сложить первые тринадцать разностей:

118/990 + 116/990 + 114/990 + … + 94/990

и добавить их к 4. Вы получите 4 + 1378/990, то есть примерно 5,392. Это приблизительно втрое точнее нашей первой оценки 54/11.

Метод последовательных разностей попал из Индии в арабский мир, а затем несколько раз был переоткрыт в Англии, в первую очередь Генри Бригсом. В 1624 году он опубликовал работу «Арифметика логарифмов» – таблицы логарифмов для тридцати тысяч чисел с точностью до четырнадцати знаков. (Бригс был первым профессором геометрии в Грешем-колледже – та самая должность, которую позже занимал Карл Пирсон, знакомивший своих слушателей со статистикой.) Как и многое другое в европейской математике XVII века, этот метод был формализован и усовершенствован Ньютоном, так что в итоге мы его называем интерполяционным методом Ньютона. В сочинениях Фарра нет никаких свидетельств, что он знал что-нибудь об этой истории. Хорошие идеи в математике часто возникают естественным образом, когда реальные проблемы мира создают потребность в их появлении.

Работа Бригса не исчерпала проблему логарифмов. Таблицы – вещь конечная, и всегда моет оказаться, что вам нужен логарифм какого-то числа, лежащего между числами, включенными в «Арифметику логарифмов». Гениальность метода разностей состоит в том, что он позволяет получать оценки для весьма сложных функций, например косинусов и логарифмов, используя только операции сложения, вычитания, умножения и деления, поэтому при необходимости вы всегда можете заполнить пробелы между числами, указанными в книге. Однако, как демонстрирует пример с квадратными корнями, вам придется много складывать, вычитать, умножать и делить – и это при том, что вы изучаете всего лишь разности разностей! Чтобы получить еще лучшее приближение, вам могут понадобиться разности разностей разностей или даже разности этих тройных разностей, а то и дальше, пока у вас не закружится голова.

Вам не захочется делать это вручную. Возможно, вам понадобится какой-то механический вычислитель, который будет считать эти разности вместо вас. Это приводит нас к Чарльзу Бэббиджу, который был очарован автоматами с самого детства, когда «человек, назвавший себя Мерлином»[424] позволил мальчику войти к себе в мастерскую и показал свое самое гениальное механическое творение. Позже Бэббидж вспоминал: «Восхитительная танцовщица[425] с птицей на указательном пальце правой руки, которая вертела хвостом, хлопала крыльями, открывала клюв. Эта дама принимала удивительно очаровательные позы. Ее глаза были полны воображения и совершенно неотразимы».

В 1813 году Бэббиджу исполнился 21 год и он изучал математику в Кембридже. Вместе со своим другом Джоном Гершелем (который превзошел Бэббиджа в исследованиях и позднее изобрел цианотипию, которая стала использоваться для получения светокопий) он основал математическое общество – своеобразную пародию на множество студенческих обществ, горячо споривших о правильном толковании Писания. Задачей их общества было возвысить систему математических обозначений Лейбница над системой, которой пользовался местный герой – Ньютон. Это аналитическое общество быстро переросло свое сатирическое происхождение и превратилось в настоящий интеллектуальный салон, нацеленный на перенос новых идей из Франции и Германии в страну, которая после Ньютона стала чем-то вроде математического захолустья.

«Однажды вечером[426], – вспоминает Бэббидж в мемуарах, – я сидел в комнатах аналитического общества в Кембридже, склонив голову в каком-то мечтательном настроении над лежавшей передо мной открытой таблицей логарифмов. Другой член общества, войдя в комнату и увидев полусонного меня, воскликнул: “Бэббидж, о чем грезишь?” – на что я ответил: “О том, что все эти таблицы (указав на логарифмы) могут вычислять машины”».

Бэббидж, как и его вдохновитель Мерлин, быстро превратил мечту в медь и дерево. Его машина, которую теперь считают первым механическим компьютером, умела вычислять логарифмы с помощью метода разностей, поэтому он и назвал ее «Разностной машиной».

Существует одно огромное различие между работой Великого Вычислителя Корней и работой Фарра. Когда мы оценивали квадратные корни, мы находили значения, лежащие между уже известными нам корнями, – такой процесс называется интерполяцией. Фарр, используя известные данные по числу больных коров, пытался экстраполировать – оценивать значение функции в будущем, за пределами диапазона имеющихся данных. Экстраполяция сложна и имеет много подводных камней[427]. Представьте, что произойдет, если с помощью нашего вечериночного трюка мы возьмемся оценивать корень из 49, то есть из числа, которое больше тех двух чисел, что мы использовали в качестве исходных данных. Как вы помните, наша приближенная оценка состояла в том, что корень увеличивается на 1/11 каждый раз, когда число растет на 1. Поскольку 49 превосходит 25 на 24, то корень из него должен быть на 24/11 больше, чем 5, или примерно 7,18. Истинное значение равно 7. А как насчет 100? Оно больше 25 на 75, так что корень из 100 должен быть 5 + 75/11  11,82. Настоящее значение 10. Теперь этот трюк плохо пахнет!

Вот в чем опасность экстраполяции. Она становится менее надежной, когда вы отходите от известных данных, на которых строятся ваши разности. И чем глубже вы погружаетесь в разности разностей разностей, тем страннее становятся экстраполяции.

Именно это произошло с Кевином Хассеттом. Хотя он не изучал эпидемиологию XIX века, использованный им метод «кубической экстраполяции» основывался на том же эвристическом рассуждении[428], которое применял Уильям Фарр для моделирования чумы. Его модель предполагала, что отношение между отношениями между отношениями последовательных данных останется постоянным на протяжении всей эпидемии. (Вам не нужно читать старинные статьи по истории медицины для реализации этой стратегии, сегодня достаточно нажать несколько клавиш в Excel.) Кривая Хассетта примерно соответствовала ходу эпидемии в прошлом – смертность от COVID-19 в США действительно достигла пика как минимум в краткосрочной перспективе, – однако он существенно ошибался относительно устойчивости эпидемии при экстраполяции этих данных на будущее.

Наивная экстраполяция может также увести вас далеко от истины в пессимистическом направлении. Джастин Вольферс, экономист из Мичиганского университета, назвавший модель Хассетта ПОЛНЫМ БЕЗУМИЕМ (прописные буквы его), всего месяцем ранее писал: «Спроецируйте кривую для США всего на 7 дней, и у вас в общей сложности получится 10 000 смертей. Сдвиньтесь еще на неделю – и у вас будет 10 000 смертей в день»[429]. Вольферс экстраполировал еще более простым методом, чем Хассетт, прогнозируя смертность с помощью обычной геометрической прогрессии. И результаты показывают, насколько быстро экстраполяция может отказать. В США действительно умерло 10 000 человек через неделю после прогноза Вольферса, однако после следующей недели уровень смертности достиг весеннего пика в 2000 смертей в день, что в пять раз меньше числа, полученного Вольферсом путем слепой экстраполяции.

«…НО НЕКОТОРЫЕ ПОЛЕЗНЫ»

Когда я объяснял доводы Фарра своему сыну-подростку, тот спросил: «Папа, а почему Фарр не подождал конца февраля, который все равно уже наполовину прошел, и не получил еще одну точку данных? Тогда у него было бы два отношения отношений отношений вместо одного и, соответственно, более прочная основа для подтверждения его величины 1,182 в качестве закона увеличения».

Хороший вопрос, сын! Лучшее объяснение, что мне приходит в голову, – выбор Фарра был победой чувств над разумом. Фарр полагал, что цифры следующего месяца покажут пик эпидемии, и, будучи гордым человеком, хотел предсказать этот пик до того, как он наступит, а не после.

Оказалось, что его прогноз был преждевременным: число новых случаев в феврале превысило 57 000, что по-прежнему превосходило данные предыдущего месяца (47 191). Если бы он дождался новых сведений, то обнаружил бы, что последнее отношение 57 000 / 47 191 = 1,208, последнее отношение отношений 1,395 / 1,208 = 1,155, а последнее отношение отношений отношений 1,155 / 1,289 = 0,896. Пошел бы он дальше, обнаружив такое расхождение, и стал бы вычислять отношение двух отношений отношений отношений? Мы не знаем.

Однако можно с уверенностью сказать, что Фарр понял главное: эпидемия приближается к пику и скоро пойдет на спад. В марте было зафиксировано всего 28 000 новых случаев чумы, а затем заболеваемость продолжила снижаться, хотя и не так быстро, как предсказывал Фарр: его кривая, изображенная на следующем графике, показывает, что болезнь исчезнет к концу июня, хотя на самом деле она продлилась до конца года.

Вы можете видеть на этом примере риски экстраполяции. Расчеты Фарра оправдались в краткосрочной перспективе (скоро ли все изменится?), однако долгосрочный прогноз был гораздо хуже (когда все закончится?)./p>

Почему же исчезла чума крупного рогатого скота? Фарр, по-прежнему не принимая полностью микробную теорию болезней, говорил, что, какое бы ядовитое вещество ни переходило от коровы к корове, с каждым новым животным оно теряло часть своей ядовитости. Это не так: сейчас мы понимаем, как действуют вирусы. Когда British Medical Journal высмеивал письмо Фарра, оспаривались не выводы ученого, а его рассуждения. «Он совершенно забывает принять во внимание[430], – писал анонимный язвительный рецензент, – тот факт, что все убеждены в заразной природе болезни и, соответственно, принимают меры для ее предотвращения». Фарр предсказывал, что чума «исчезнет спонтанно»; и это то, что мы можем сказать наверняка: она действительно исчезла.

О методе Фарра практически забыли на десятилетия, пока в начале XX века Джон Браунли не вернул его в эпидемиологию. Браунли обратил внимание на то, что упустил Фарр: если вы моделируете эпидемию, чтобы отношение отношений было постоянным, как это делал Фарр с оспой, то у вас получается красивая симметричная кривая, которая падает так же быстро, как и поднимается. На самом деле это не что иное, как нормальное распределение, или колоколообразная кривая, играющая центральную роль в теории вероятностей. Люди, которые немного разбираются в математике, относятся к колоколообразной кривой со своего рода фетишистским почтением. Она описывает потрясающее разнообразие природных явлений. Однако распространение и спад эпидемий не входят в их число. Фарр это знал: еще в 1866 году он брал третье отношение вместо второго и предсказывал, что волна чумы будет асимметричной и спадет быстрее, чем поднималась. Браунли тоже признавал, что строгое совпадение с нормальной кривой – это редкость для реальных эпидемий. Тем не менее каким-то образом понятие «закон Фарра» стало означать, что эпидемии следуют примерно симметричной колоколообразной кривой, хотя сам Фарр был достаточно сведущ, чтобы с этим не соглашаться. Я склонен называть его «законом» Фарра, чтобы подчеркнуть, что на самом деле это не закон. Хотя, возможно, лучше было бы назвать его «законом» «Фарра».

Такое жесткое представление порождает опасность плохой экстраполяции. В 1990 году Деннис Брегман и Александр Ленгмюр (легендарный эпидемиолог, предпочитавший практические исследования «в поле», а не чисто лабораторные работы) опубликовали статью под названием «Закон Фарра в применении к прогнозам СПИДа». Ссылаясь на успешный прогноз Фарра в борьбе с чумой крупного рогатого скота, они провели аналогичный анализ статистики СПИДа в Соединенных Штатах. Однако приняли слишком узкую точку зрения, что кривая эпидемии должна быть симметричной и что распространенность СПИДа будет снижаться так же быстро, как увеличивалась. Ученые пришли к выводу, что СПИД уже прошел пик и что в 1995 году в США должно быть зафиксировано всего около 900 случаев заболевания.

На самом деле их было выявлено 69 тысяч.

Это возвращает нас в 2020 год к COVID-19. Многие прогнозы[431] предпочитают рисовать смертность от коронавируса в каждом штате в виде идеально симметричной колоколообразной кривой. Вовсе не потому, что авторы – ее фетишисты; просто они обнаружили, что именно она лучше всего соответствует немногочисленным данным за первые недели вспышки. Для некоторых эпидемий это могло бы сработать. Однако кривая для COVID-19 оказалась стабильно асимметричной, стремительно взлетая в каждом регионе, а затем снижаясь с мучительной медлительностью, оставляя за собой болезни и страх. Эта эпидемия поднимается на лифте, а спускается по лестнице. Если ваш прогноз настаивает на ином, он будет противоречить истине: не надо проталкивать колоколообразную кривую и пытаться подкрутить настройки, когда новые данные будут входить в противоречие с предсказаниями.

Мы здесь сталкиваемся с серьезной проблемой, общей для всех попыток математически спроецировать настоящее в будущее. Сделать прогноз – значит высказать предположение о законе, который управляет интересующей вас переменной. Иногда этот закон прост, как в случае движения теннисного мяча. Он обладает приятной симметрией: время от броска до верхней точки равно тому же количеству времени, которое нужно, чтобы мяч вернулся в вашу руку. Более того, если вы будете аккуратно измерять высоту мяча над землей каждую секунду и запишете последовательно все эти числа, то обнаружите, что разности разностей в этой последовательности будут всегда одинаковыми – на протяжении всей параболической дуги полета мяча. Именно это – характерное свойство параболы, отличающее ее от полуокружности или перевернутой цепной линии, форму которой имеет арка в Сент-Луисе «Ворота Запада»[432]. Если вам повезет, вы сможете обнаружить подобные закономерности, даже не понимая лежащего в их основе механизма; Галилей открыл параболический закон движения тела путем тщательных наблюдений – за десятки лет до того, как Ньютон разработал общую теорию сил и ускорений.

Однако иногда законы не просты! Если диапазон законов, где мы готовы искать, слишком узок – например, если мы настаиваем, что пандемия следует симметричным курсом, когда отношение отношений равно константе, – то мы потерпим неудачу в попытках привязать к реальности наше слишком жесткое правило. Получается недостаточная подгонка данных. То же самое происходит с алгоритмом машинного обучения, когда у него недостаточно ручек или они непригодны.

Это заставляет меня вспомнить о профессоре Роберте Плоте – первом человеке, опубликовавшем рисунок кости динозавра. Выбор возможных объяснений происхождения такой кости у Плота был не слишком широк, чтобы в него попала истина (он наткнулся на часть бедренной кости гигантской рептилии, которую сейчас называют мегалозавром). Натуралист рассматривал вероятность того, что это был какой-то римский слон, заблудившийся и умерший в Корнуолле, однако сравнение с настоящей бедренной костью слона исключило эту версию[433]. Поэтому после некоторых рассуждений ученый счел, что кость принадлежит человеку, вопрос только в том какому. Его ответ: очень высокому человеку[434].

Надо отдать Плоту должное: он имел дело с совершенно новым явлением, и трудно обвинить его в том, что он не сумел распознать то, что видел[435]. Ошибка с подгонкой данных была бы куда более серьезной, если бы Плот счел в своей модели, что все кости в земле принадлежат людям, несмотря на многочисленные примеры найденных нечеловеческих костей. Раскопав скелет какой-нибудь подвязочной змеи, такой палеонтолог мог бы воскликнуть: «О боже! Каким необычайно гибким должен быть этот крошечный человечек!»

Суть модели не в том, чтобы сообщить нам, что общее число смертей от COVID-19 в Соединенных Штатах будет 93 526 (этот прогноз популярная модель Института измерения показателей и оценки здоровья давала 1 апреля), или 60 307 (16 апреля), или 137 184 (8 мая), или 394 693 (15 октября), и не в том, чтобы указать точно день и час, когда процент заполненных больничных коек достигнет максимума. Для работы такого рода нужны прорицатели, а не математики. Однако модели от этого не становятся бесполезными. Зейнеп Туфекчи (социолог, а не математик и не создатель моделей) выразила это в статье с совершенно правильным названием «Модели коронавируса не должны быть верны»[436]. Более полезная цель моделей – дать широкие качественные оценки поведения пандемии в данный момент: она нарастает, выходит из-под контроля? Распространяется, но выходит на плато? Сходит на нет? Как раз с этой задачей Кевин Хассетт и его кубическая модель не справились.

Мы во многом похожи на AlphaGo. Эта программа изучает приблизительный закон, который присваивает определенное количество баллов каждой позиции на доске, но число не говорит нам в лоб, какая это позиция – В, Н или П: такое действие выходит за рамки возможностей любой вычислительной машины, независимо от того, реализована она в железе или находится внутри нашего черепа. Однако задача программы не в том, чтобы выдать абсолютно правильный ответ, а в том, чтобы дать нам совет, какой из возможных путей с наибольшей вероятностью приведет нас в итоге к победе.

Моделирование пандемии сложнее, чем ситуация с AlphaGo, как минимум по одной причине: на протяжении всей партии в го правила игры не меняются, а при создании модели для эпидемии вы основываетесь на определенных фактах – кто, кому и когда передает инфекцию. Однако эти факты могут внезапно измениться из-за массовых действий людей или вследствие какого-то постановления правительства. Вы можете использовать физику для моделирования полета теннисного мяча, а теннисисты достаточно высокого уровня быстро и бессознательно рассчитывают в этой модели, куда полетит мяч при определенном ударе. Однако физика не поможет вам предсказать, чем окончится длинный матч, поскольку она не учитывает человеческий фактор. Моделирование реальности – всегда маневрирование между предсказуемой динамикой и нашими непредсказуемыми реакциями.

В новостях я видел фотографию одного протестующего[437] в Миннесоте, разгневанного указом губернатора оставаться дома с целью ограничения передачи вируса. Видимо, он еще не осознал серьезности угрозы COVID-19, поэтому и нес плакаты с надписями: «Прекратите закрывать» и «Все модели неправильны». Он частично позаимствовал (думаю, не специально) знаменитый афоризм британского статистика Джорджа Бокса, который подходит для ситуации с COVID-19 как нельзя лучше. Он гласит: «Все модели неправильны, но некоторые полезны».

ПОДБОР КРИВОЙ И ОБРАТНАЯ РАЗРАБОТКА

Есть два способа предсказать будущее. Вы можете попытаться выяснить, как устроен мир, и, исходя из этого понимания, сделать хорошие предположения о его дальнейшем развитии. А можете… этого не делать.

Рональд Росс очень четко проводит это различие, отделяя себя от предшественников, чье место намерен занять (например, Фарра). Росс ориентируется на первый подход, который мы могли бы назвать «инженерным анализом»[438]: начать с известных ему фактов о распространении болезни и оттуда обосновывать свой путь к дифференциальным уравнениям, которым с необходимостью должна удовлетворять кривая эпидемии. Уильям Фарр находился в противоположном лагере. Он занимался не инженерным анализом, а подбором (подгонкой) кривой, состоящим в поиске закономерностей в прошлом, предположении, что они сохранятся в будущем, при этом не особо беспокоясь почему. Что случилось сегодня, случится и завтра. Таким способом вы можете делать прогнозы, не заглядывая и даже не пытаясь понять, что происходит внутри системы. И ваши прогнозы могут даже оказаться правильными!

Большинство ученых испытывают естественную симпатию к Россу и людям, занимающимся инженерным анализом. Ученые любят понимать то, что происходит. Так что вот вам небольшой холодный душ: метод подгонки кривых переживает возрождение благодаря прогрессу в машинном обучении.

Возможно, вы заметили, что Google сейчас довольно хорошо переводит документы с одного языка на другой. Не идеально, конечно, как сделал бы человек, но с качеством, которое еще несколько десятилетий назад казалось фантастическим. Улучшается и интеллектуальный (предиктивный) ввод текста: вы набираете буквы, а машина опережает вас и предлагает одним нажатием клавиши вставить слово или фразу, которые (по ее мнению) вы собираетесь набрать дальше. И довольно часто машина оказывается права. (Когда машина правильно угадывает, что я собрался сказать, я из гордости или вредности меняю свою фразу, а когда ничего не остается, кроме как признать правильность модели, сам набираю слово буква за буквой, как положено. Честно говоря, не знаю, что я пытаюсь ей доказать?!)

Если бы вы спросили Рональда Росса, как работает такой метод, он мог бы сказать нечто вроде: мы многое знаем о внутренней структуре предложений (с определенного возраста некоторые даже умеют рисовать их схему) и значениях слов, которые зафиксированы в словарях. С учетом этой информации носитель языка вполне может понимать механизм предложения в достаточной степени, чтобы догадаться, что когда я набираю: «Надеюсь, мы сможем встретиться на следующей неделе за…» – то следующим словом, вероятно, будет не глагол, а какое-то существительное, подходящее по смыслу: «обедом» или «кофе», но не «имуществом», «репой» или «COVID».

Однако языковая машина Google работает совершенно иначе. Она больше похожа на Фарра. Google видел миллиарды фраз – достаточно, чтобы вычленить какие-то статистические закономерности, которые определяют, какие словосочетания могут быть осмысленными предложениями, а какие – нет. Кроме того, машина может оценить, какие фразы среди осмысленных встречаются чаще всего. Фарр смотрел на предыдущую эпидемию, Google просматривает старые электронные письма. Множество людей и до вас не раз говорили: «Надеюсь, мы сможем встретиться на следующей неделе за…» – и большинство из них продолжали фразу словом «обедом» или «кофе». Никто не объясняет машине, что такое существительное и глагол или что такое репа и обед. И она ни в каком разумном смысле не знает, что это такое. Но, так или иначе, это работает. Пока еще не настолько хорошо, как получается у писателя или переводчика (может, так и не получится никогда). Но вполне приемлемо!

Машина работает, даже если вы набираете что-то совершенно оригинальное, как нам всем нравится думать. В 2012 году произошел интеллектуальный спор[439] между одним из основоположников современной лингвистики Ноамом Хомским и Питером Норвигом из Google, который предпринимает колоссальные инженерные усилия, чтобы без нее обходиться. В 1950-х годах Хомский предложил знаменитую фразу Colorless green ideas sleep furiously («Бесцветные зеленые идеи спят яростно»), иллюстрирующую управляемость природы человеческого языка какими-то правилами. Эту фразу никто из людей раньше не видел (во всяком случае, пока Хомский ее не прославил), и не существует способа придать ей осмысленное толкование как утверждения о физическом мире. Тем не менее наш разум четко распознает ее как грамматическое предложение и даже «понимает» ее: мы могли бы правильно отвечать на вопросы, основанные на ней (например: «Спокойно ли спят бесцветные зеленые идеи?»), и осознаем (поскольку знаем, что такое существительные, прилагательные и глаголы), что в конструкции «спят зеленые яростно идеи бесцветные» нужно переставить слова, чтобы придать ей хоть какое-то подобие смысла. Однако, вопреки Хомскому, современная машина может прийти к тем же выводам без изучения правил структуры языка. Программа разрабатывает способ оценить какую-то последовательность слов как похожую на предложение или не похожую, опираясь на ее сходство с другими предложениями, которые реально были сформулированы людьми. Как и машина, обученная отличать кошку от некошки, она применяет своеобразную форму градиентного спуска, чтобы постепенно выработать стратегию, которая идентифицирует уже виденные предложения как максимально похожие на предложения, чем прочие комбинации слов. И не только это; стратегия, которую находит машина, склонна (по каким-то причинам, которые остаются не совсем понятными специалистам) хорошо срабатывать при оценке правильности тех строк слов, которые не были частью обучения. Фраза «бесцветные зеленые идеи спят яростно» получает гораздо более высокую оценку похожести на предложение, чем «спят зеленые яростно идеи бесцветные», даже без какой-либо формальной системы грамматики, даже если эти фразы никогда ранее не встречались в наблюдаемых данных (если предположить, что вы тренируетесь на текстах, собранных до Хомского). Даже фрагменты этой фразы (например, «бесцветные зеленые») встречались редко, если вообще встречались.

Норвиг отмечает, что, когда дело касается реального машинного перевода или автоматической подсказки, статистические методы наподобие этого определенно превосходят все попытки воссоздать базовые механизмы производства человеческого языка[440]. Хомский возражает: как бы там ни было, но методы, как у Google, не дают ни малейшего представления о том, что такое язык; они подобны Галилею, наблюдавшему движение тела по параболе, когда Ньютон еще не предложил объясняющие его законы.

И в отношении языка, и в отношении пандемий правы обе стороны. Нельзя обойтись ни без подбора кривой, ни без инженерного анализа. Автор одной из самых удачных моделей пандемии 2020 года, недавний выпускник Массачусетского технологического института Юян Гу умело объединил оба подхода: он использовал модель дифференциальных уравнений в стиле Росса, предназначенную для имитации известной механики передачи COVID-19, но при этом добавил методы машинного обучения для настройки многих неизвестных параметров в модели, чтобы они максимально хорошо соответствовали наблюдаемым до сих пор данным о пандемии. Нам нужно как можно больше каталогизировать то, что произошло вчера, если мы хотим предсказать, что произойдет завтра. Однако у нас никогда не было миллиардов прошлых пандемий, которые можно было бы рассмотреть, и если мы хотим хорошо подготовиться к следующей вирусной новинке, то нам стоит лучше поискать законы.

Глава 12. Дым в листе

В 1977 году группа участников нидерландской команды предложила на международной математической олимпиаде в Белграде своим британским коллегам такую головоломку. Какое число будет следующим в последовательности?

1, 11, 21, 1211, 111221, 312211…

Упростит ли это задачу, если я назову несколько следующих чисел:

13112221, 1113213211, 31131211131221, 13211311123113112211…

Большинство людей не могут ее решить. Я, естественно, тоже не смог, когда увидел впервые. Но когда вы узнаете решение, удивлению нет предела, насколько оно простое и одновременно очаровательное. Это последовательность «посмотри и скажи». Первый член – это 1. Читаем его как «одна единица» и получаем второе число 11. Читаем его как «две единицы» и получаем следующее число 21. Читаем его как «одна двойка, одна единица» и получаем 1211. Затем следует «одна единица, одна двойка, две единицы», то есть 111221, и так далее.

Это просто забавное развлечение; во всяком случае, так казалось команде из Нидерландов. Однако примерно в 1983 году последовательность «посмотри и скажи» попалась на глаза Джону Конвею, для которого превращение развлечения в математику (и обратно) было образом жизни. Конвей доказал, что[441] последовательность «посмотри и скажи» никогда не будет содержать цифр больше 3, а ее долгосрочное поведение управляется поведением 92 особых цепочек цифр, которые Конвей окрестил атомами и назвал в честь химических элементов (например, 1113213211 – это гафний, за которым следует олово). Более того, само количество цифр в членах последовательности тоже ведет себя вполне предсказуемо. Выписанные выше члены последовательности «посмотри и скажи» имеют такую длину:

1, 2, 2, 4, 6, 6, 8, 10, 14, 20…

Было бы очень красиво, если бы это была геометрическая прогрессия, но это не так. Отношение каждого последующего члена к предыдущему равно:

2, 1, 2, 1,5, 1, 1,33333…, 1,25, 1,4, 1,42857…

Но по мере дальнейшего продвижения начинает вырисовываться какая-то регулярность. Сорок седьмое, сорок восьмое и сорок девятое числа имеют соответственно 403 966, 526 646 и 686 646 цифр. Второе число в 1,3037 раз больше первого. Третье в 1,3038 больше второго. Похоже, что отношение соседних чисел стабилизируется. Изобретательно манипулируя своими 92 атомами, подвергавшимися тому, что он назвал аудиоактивным распадом, Конвей доказал, что эти отношения действительно сходятся к некоторой константе, которую математик точно вычислил[442]. Длины чисел из последовательности «посмотри и скажи» не образуют геометрическую прогрессию, но образуют прогрессию, которая со временем все больше и больше сходится к геометрической.

Геометрические прогрессии элегантны и первозданны. Но в реальном мире они редкость. Чаще встречаются приблизительно геометрические прогрессии, такие как «посмотри и скажи». Они знакомят нас с крайне важным математическим понятием под названием собственное значение. Мы не можем избежать собственных значений, если, например, хотим сделать модели распространения болезней Росса – Хадсон хотя бы немного реалистичными.

ДАКОТА И ДАКОТА

Теория событий Росса и Хадсон применительно к болезням основана на выявлении доли населения, зараженного в данный момент. Это уже создает определенную двусмысленность. О каком населении идет речь? Ваш район? Ваш город? Страна? Весь мир?

Вы можете убедиться, что это действительно важно, выполнив простое упражнение на сложение. Предположим, что на Великих равнинах[443] бушует какая-то новая болезнь – Страшный и Ужасный грипп (СИУ). Допустим, что в Северной Дакоте число случаев утраивается каждую неделю, а в соседней Южной Дакоте по каким-то причинам только удваивается. Числа для Северной Дакоты могут выглядеть так:

10, 30, 90, 270,

а для Южной Дакоты – так:

30, 60, 120, 240.

Тогда общее число случаев заболевания, если бы обе Дакоты были одним штатом, составило:

40, 90, 210, 510,

что вообще не является геометрической прогрессией: отношения между ее последовательными членами равны 2,25, 2,33, 2,43. Если вы рассматриваете статистику по Дакотам как по единому целому, то можете решить, что какая-то зловещая сила делает вирус с каждой новой неделей все более заразным. И начнете волноваться. Прекратится ли когда-нибудь этот рост?

Не волнуйтесь. Число случаев растет не в геометрической прогрессии, а приблизительно так, как в последовательности «посмотри и скажи». За четыре рассмотренные недели количество инфицированных распределилось между Дакотами примерно поровну. Однако ненадолго. Следующие четыре недели принесут Северной Дакоте много заболевших:

810, 2430, 7290, 21 870,

а в Южной Дакоте будет всего лишь:

480, 960, 1920, 3840.

Общее количество случаев заболеваний в обеих Дакотах за восьмую неделю составило 25 710, то есть в 2,79 раза больше, чем за седьмую (9210). Это отношение уже довольно близко к 3 и далее будет только приближаться к этому числу. Более быстрый рост в Северной Дакоте полностью затмевает рост в Южной. Через десять недель после начала эпидемии почти 95 % всех случаев будут зафиксированы именно там. В какой-то момент вы сможете просто игнорировать Южную Дакоту: практически все заболевшие будут концентрироваться в Северной, утраиваясь каждую неделю.

Две Дакоты – напоминание, что в борьбе с пандемиями нужно думать не только о времени, но и о пространстве. В базовой SIR-модели любые два человека в популяции встречаются и смешивают выдохи с равной вероятностью. Мы знаем, что это не совсем так. Жители Южной Дакоты в основном встречаются с другими жителями Южной Дакоты, а северодакотцы – с северодакотцами. Именно поэтому скорость распространения инфекции может быть разной в разных штатах и даже в разных местностях одного штата. Равномерное перемешивание населения привело бы к выравниванию динамики болезни, подобно тому как смешивание горячей и холодной воды быстро дает теплую воду.

Вот более сложный сценарий для Дакот. Предположим, что в Южной Дакоте идеально соблюдают правила социального дистанцирования, то есть между двумя жителями штата никогда не происходит случаев передачи инфекции. Тем временем в Северной Дакоте все общаются, дышат общим воздухом и в целом игнорируют правила. Каждый инфицированный житель Северной Дакоты передает вирус одному жителю штата. Более того, северодакотцы любят пересекать границу, встречаться с людьми, и при этом каждый инфицированный северодакотец передает вирус одному южнодакотцу, а каждый инфицированный южнодакотец – одному северодакотцу.

Уловили? Если нет (или даже если да), давайте посмотрим, как это работает, если сначала у нас есть один северодакотец с СИУ, а в Южной Дакоте больных нет.

На следующей неделе он заразит одного жителя штата Сада мира[444] и одного южнодакотца, в то время как в Южной Дакоте, где зараженных не было, новых инфекций нет. Чтобы упростить ситуацию, будем считать, что больные гриппом выздоравливают после заразной недели, так что в конце недели больными будут только новые инфицированные: в нашем случае это один северо- и один южнодакотец.

На следующей неделе этот северодакотец заразит двух человек – одного в Северной Дакоте, а другого – в Южной, в то время как южнодакотец заразит только приблизившегося северодакотца, так что мы получим:

Со временем инфекция распространяется все шире. Несколько следующих недель дадут нам:

Не слышите ли вы отголоски поэзии на санскрите? Количество зараженных северодакотцев в зависимости от недели:

1, 1, 2, 3, 5, 8, 13…

это (вуаля!) числа Вираханки – Фибоначчи. То же самое и с числом больных в Южной Дакоте, просто со сдвигом на неделю. Это обеспечивают выбранные нами правила передачи вируса Страшного и Ужасного гриппа: каждую неделю количество южнодакотцев с СИУ – это число инфицированных северодакотцев на прошлой неделе, а число северодакотцев с СИУ – это сумма количеств зараженных северодакотцев и южнодакотцев на прошлой неделе, которая равна сумме числа заболевших северодакотцев на прошлой неделе и числа заболевших северодакотцев на позапрошлой неделе.

Последовательность Фибоначчи – не геометрическая прогрессия, отношение между ее членами меняется:

1, 2, 1,5, 1,666…

Хотя на самом деле это своего рода геометрическая прогрессия! Особенно если мы продолжим ее еще на несколько членов. Двенадцатое число Фибоначчи – 144, тринадцатое – 233, а четырнадцатое – их сумма, то есть 377. Отношение 233 / 144  1,61806. Следующее отношение 377 / 233  1,61803. Эти числа весьма близки. А если вы проследите за распространением инфекции еще несколько недель, то увидите, что отношения между соседними неделями все больше приближаются к общему числу, очень близкому к 1,618034. Мы снова сталкиваемся с явлением не точного, но почти экспоненциального роста. Что это за загадочное число, которое скрыто в последовательности чисел Фибоначчи?

Это не просто число. Это число с причудливым названием золотое сечение, оно же золотая пропорция, оно же божественная пропорция, оно же (греческая буква, которая читается как «фи»). Чем знаменитее число, тем больше у него имен[445]. Если вам нужна точная формула, то золотое сечение  = (1 +5) / 2.

Люди веками поднимали шум из-за этого числа. У Евклида пропорция носит более приземленное название «деление в среднем и крайнем отношении». Это число требовалось Евклиду для построения правильного пятиугольника, ведь золотое сечение – это отношение длины диагонали правильного пятиугольника к его стороне. Иоганн Кеплер называл теорему Пифагора и золотое сечение главными сокровищами классической геометрии: «Первое мы можем сравнить с массой золота[446], второе можем назвать драгоценным камнем».

Где-то по пути отношение перестало быть драгоценным камнем и стало золотым; в одном тексте 1717 года говорится, что «древние называли[447] это отношение золотым». (Нет никаких подтверждений, что кто-то из древних на самом деле использовал такое название, однако присваивание вашей выдумке некоторой традиции добавляет ей немного культурной привлекательности.) Золотой прямоугольник – это прямоугольник, длина которого в  раз больше ширины; у него есть приятная особенность: если вы разрежете его поперек, чтобы одна из частей была квадратом, то другая снова окажется золотым прямоугольником (меньшего размера). При желании вы можете отрезать квадрат и от него, получив еще меньший, и так далее, строя целую спираль из квадратов.

Кеплер ценил золотое сечение как за геометрические, так и за арифметические свойства; он открыл последовательность Вираханки – Фибоначчи независимо и обнаружил, что отношения между ее последовательными членами стремятся к золотому сечению. Взаимоотношения между геометрией и арифметикой в этой последовательности становятся заметны, если нарисовать почти золотой прямоугольник, длина и ширина которого – два последовательных числа Фибоначчи, как в этом примере 8  13:

Он почти золотой: отрежьте квадрат, и получите прямоугольник 5  8; снова отрежьте квадрат, и останется 3  5. С каждым разрезом вы двигаетесь назад по последовательности Фибоначчи. В итоге вы доберетесь до нуля, и ваша спираль из квадратов закончится, а не будет продолжаться вечно.

Мое любимое свойство золотого сечения привлекает относительно немного внимания, так что у меня есть шанс известить вас о нем! Причина, по которой я вынужден писать  = 1,618… с раздражающим многоточием, – то, что это число иррациональное; вы не можете выразить его в виде отношения двух целых чисел, а это означает, что вы не можете записать золотое сечение в виде конечной десятичной дроби или даже периодической десятичной дроби вроде 1/7 = 0,142857142857142857…

Но это не значит, что нет рациональных чисел, достаточно близких к нему. Конечно же, они есть! В конце концов, десятичное разложение числа – это способ записать дроби, близкие к нему:

16/10 = 1,6 (довольно близко);

161/100 = 1,61 (ближе);

1618/1000 = 1,618 (еще ближе).

Десятичное разложение дает вам дробь со знаменателем 1000, которая отличается от золотого сечения не более чем на 1/1000[448]; если взять дробь со знаменателем 10 000, то мы получим точность в пределах 1/10 000 и так далее.

Однако есть способ лучше, чем применение десятичных дробей! Вспомните, что отношения между соседними числами Фибоначчи – это тоже дроби, которые стремятся к золотому сечению:

8/5 = 1,6;

13/8 = 1,625;

21/13  1,615.

Забравшись далеко в последовательности, вы получите число

233/144 = 1,6180555555…

которое всего лишь на 2/100 000 отличается от золотого сечения, и это существенно лучше, чем 1618/1000, хотя знаменатель 144 нашей дроби и меньше 1000. По сути, разница меньше сотой часть дроби 1/144.

Некоторые знаменитые иррациональные числа можно аппроксимировать еще точнее. Цзу Чунчжи, астроном V века[449] из Нанкина, заметил, что простая дробь 355/113 невероятно близка к  – с точностью до двух десятимиллионных. Ученый назвал это число «милю» – «очень близкое отношение». Книга Цзу с математическими методами утеряна, а потому мы не знаем, как он придумал это приближение. Однако это не самая очевидная вещь: пройдет еще тысяча лет, прежде чем такое приближение заново откроют в Индии, еще через сто оно станет известно в Европе, и еще через столетие будет окончательно доказано, что на самом деле иррационально.

Насколько точно можно приближать иррациональные числа к рациональным? Это арифметическая задача, но лучше всего думать о ней геометрически. Для этого есть изумительный трюк, придуманный в начале XIX века неецким математиком Петером Густавом Лежён Дирихле. Мы нашли дробь 233/144, расстояние от которой до числа составляет меньше сотой доли от 144. Можно ли найти какую-нибудь дробь p/q, расстояние от которой до числа будет составлять менее тысячной доли от знаменателя q? Можно, и доказательство Дирихле для этого факта настолько простое, что я не могу вам его не показать[450]. Нарисуйте отрезок числовой прямой от 0 до 1 и разделите его на тысячу равных частей-отделений. Я не могу нарисовать тысячу равных частей, так что просто вообразите их.

Теперь начинаем выписывать кратные для числа :

 = 1,618…

и отмечать на числовой прямой дробную часть каждого из этих чисел – ту часть, которая идет после десятичной запятой. Если я нарисую дробные части первых трехсот кратных для числа в виде вертикальных линий ради лучшей заметности, то у меня получится своеобразный штрихкод.

Каждая из этих линий попала в одно из тысячи отделений. Само золотое сечение находится в 619-м отделении. (Не в 618-м – по той же причине, по которой мы сейчас живем в XXI веке, хотя номер года начинается с 20; первое отделение соответствует числам между 0,000 и 0,001, второе – числам между 0,001 и 0,002 и так далее.) Следующее кратное 2 попадет в отделение номер 237, 3 – в отделение номер 855. Продолжайте раскладывать числа по отделениям. Если какое-то из этих кратных окажется в первом отделении, мы выиграем, потому что в этом случае какое-то число q будет иметь дробную часть от 0 до 0,001. Это значит, что разница между q и каким-то целым числом p составляет не более 0,001, а потому после деления обоих чисел на q получаем, что разница между и дробью p/q составляет не более одной тысячной от 1/q.

Но почему какое-то кратное должно попасть в первое отделение? Может быть, подобно фишке в игре «Монополия», никак не желающей попадать на нужное нам поле, кратные будут обходить это отделение?

Вот тут и появляется замечательная идея Дирихле. Сам математик называл ее «принципом выдвижных ящиков» (Schubfachprinzip), а в англоязычных странах называют «принципом голубей и ящиков»[451]. Он гласит: если вы рассаживаете голубей по ящикам и количество голубей больше, чем ящиков, то как минимум в одном ящике окажется два голубя.

Это утверждение настолько очевидно, что трудно поверить в его полезность. Иногда такое случается с самой глубокой математикой.

В нашем случае голуби – это числа, кратные , а ящики – это тысяча отделений. Если мы возьмем 1001 число, кратное , то как минимум два из них попадут в одно отделение. Предположим, в одном отделении окажутся 238 и 576. На самом деле это не так (эта пара чисел находится в отделениях 93 и 988 соответственно), но допустим, что так. Тогда разность между ними должна быть не более 1/1000 от какого-то целого числа. Назовем его p. Однако эта разность составляет 338. Следовательно, число 338 должно оказаться в первом отделении или, честно говоря, в самом последнем отделении, заканчивающемся числом 0,999… (числа там тоже отличаются от целого не больше чем на 1/1000). В любом случае p/338 – это наше требуемое приближение.

Не имеет значения, какие именно два кратных числа  окажутся в одном отделении; любая пара даст дробь, достаточно близкую к . На самом деле первые голуби, оказывающиеся в одном ящике, – это числа и 611 = 988,6187…; оба попадают в отделение 619. Их разность равна 610, то есть примерно 987,0007, и поэтому 987/610 – действительно хорошее приближение для . Вы не удивитесь, узнав, что 610 и 987 являются последовательными членами последовательности Фибоначчи, идущими как раз после того места, где мы остановились в вычислениях.

В числе 1000 нет ничего принципиального. Если вы желаете найти рациональное число p/q, которое отличается от менее чем на миллионную долю 1/q, то можете добиться и этого, хотя, возможно, число q будет равняться почти миллиону.

Разность между «близким отношением» Цзу Чунчжи 355/113 и  составляет всего одну тридцатитысячную от 1/113. Что касается метода Петера Густава Лежёна Дирихле, то вам, возможно, придется искать дроби со знаменателем едва ли не в 30 000, чтобы найти такое же хорошее приближение. Однако на самом деле этого не потребуется! Число «милю» – это не просто хорошее приближение для , а потрясающе хорошее приближение.

Давайте посмотрим, как это выглядит на числовой прямой. Если я посмотрю на первые триста кратных числа 1/7 и отмечу их дробные части вертикальным штрихом, как делал для числа , то получу такую картинку. На ней всего семь линий, поскольку, на какое число ни умножай 1/7, я получу какое-то количество седьмых, дробная часть которых будет 0, 1/7, 2/7, 3/7, 4/7, 5/7 или 6/7.

То же самое верно и для любого рационального числа; мы можем брать сколь угодно кратных, однако линии будут образовывать конечный набор, равномерно распределенный между 0 и 1.

А что насчет ? Вот дробные части для трехсот первых кратных.

Здесь штрихов много. Но не триста. Если бы вы сосчитали видимые линии, то увидели бы, что их ровно 113. Вы видите тут подпись числа «милю». Поскольку очень близко к 355/113, то его первые триста кратных тоже близки к какому-то количеству «сто тринадцатых», а это означает, что штрихи останутся очень близкими к числам 0, 1/113, 2/113 (представьте, что я здесь написал все 113 вариантов), 112/113. Поскольку не точно равно 355/113, то его кратные не точно попадут в места этих дробей: более толстые линии на рисунке – на самом деле несколько линий, слившихся вместе.

Это возвращает нас к золотому сечению. Штрихкод для числа , который я уже рисовал выше, распределен равномернее, без кластеров, как у линий числа р. Нарисуйте тысячу кратных – и получите то же самое, только линий будет больше.

Сколько бы кратных числа мы ни брали – тысячу, миллиард или больше, – эти линии никогда не окажутся в каком-то маленьком множестве равномерных положений, как это было в случае рациональных чисел, и даже не сконцентрируются около таких положений, как в случае с числом р. Здесь нет своего числа «милю».

Вот красивый факт, который несколько сложноват для того, чтобы привести здесь его доказательство: вы не найдете лучших рациональных приближений для , чем те, которые дает последовательность Фибоначчи, и эти приближения никогда не будут существенно лучше тех, что гарантирует теорема Дирихле. Фактически в каком-то смысле (этому утверждению можно придать строгость, но не здесь) из всех вещественных чисел хуже всего аппроксимируется дробями; это самое иррациональное из иррациональных чисел. Для меня этот факт – вполне драгоценный камень.

В ПОИСКАХ ОПРЕДЕЛЕННОГО ОТНОШЕНИЯ

Однажды в 1990-х я ужинал с другом моего друга в ресторане Galaxy Diner в Нью-Йорке. Друг моего друга сказал, что снимает фильм о математике и хотел бы поговорить с профессионалом о том, на что реально похожа математическая жизнь. Мы ели бутерброды с говядиной под расплавленным сыром, а я рассказывал какие-то истории. Прошли годы, и я уже об этом забыл. Друга моего друга звали Даррен Аронофски, и в 1998 году вышел его фильм «Пи». Главный герой картины Макс Коэн занимается теорей чисел, крайне напряженно размышляет и вечно теребит волосы. Он встречает хасида, который заинтересовал его еврейской нумерологией – методом под названием гематрия[452], когда слово превращают в число путем сложения числовых значений всех букв иврита, которые оно содержит. Хасид объясняет, что при сложении значений букв в еврейском слове «восток» получается 144, а в словосочетании «древо жизни» – 233. Макс заинтригован, ведь это числа Фибоначчи! Он выписывает еще несколько чисел Фибоначчи на страницах газеты, посвященных фондовому рынку. «Никогда раньше такого не видел», – замечает впечатленный хасид. Макс лихорадочно программирует свой компьютер (носящий имя Евклид) и рисует спирали из золотых прямоугольников, а затем долго пялится на похожие спирали молока в своем кофе. Он вычисляет 216-значное число. По-видимому, это ключ к прогнозированию цен на акции, а также возможное тайное имя Бога. Он много играет в го со своим научным руководителем. («Прекрати размышлять, Макс. Просто чувствуй. Используй интуицию».) Приступы головной боли усиливаются, он все чаще теребит волосы. Им увлекается красивая девушка из соседней квартиры. Я забыл упомянуть, что фильм черно-белый. Кто-то пытается похитить героя. Наконец, он сверлит отверстие в собственном черепе, чтобы частично снизить математическое давление, и фильм подходит к тому, что кажется счастливым концом.

Не помню, что я рассказывал Аронофски о математике, но точно не это.

(Честно признаюсь: после выхода фильма «Пи», когда мне было уже ближе к тридцати, я не раз сидел в кафе, тактически грамотно положив на видном месте свой потрепанный экземпляр книги Робина Хартсхорна «Алгебраическая геометрия», весьма напряженно думал и теребил волосы пальцами. Однако никто так и не заинтересовался.)

Аронофски узнал о числах Фибоначчи в старших классах из курса «Математика и мистицизм» и сразу ощутил родство с этой последовательностью, поскольку его домашний индекс – 11235. Такое внимание к совпадениям и закономерностям, значимое или нет, характерно для нумерологии золотого сечения. Где-то по дороге понятное влечение к математическим свойствам числа 1,618… вылилось в куда более грандиозные претензии. Специалист по теории чисел Джордж Баллард Мэтьюз еще в 1904 году «жаловался на фильм Аронофски»:

Божественная пропорция[453], или золотое сечение, впечатляет невежественных и, как ни удивительно, даже образованных людей, таких как Кеплер, ощущением таинственности и заставляет их грезить всевозможными видами фантастического символизма. Даже для греков это было сечение; а их философы, несомненно зараженные Востоком, размышляли об атомах и правильных многогранниках в манере, которая нам кажется по-детски примитивной, но была достаточно серьезной для них. Так или иначе, человек, который первым обнаружил точную схему построения правильного пятиугольника, имел основания гордиться своим достижением; а суеверия, собранные вокруг pentagramma mirificum[454], – гротескное эхо его славы.

Фигуры, части которых находятся в золотой пропорции друг к другу, иногда называют самыми красивыми по своей природе. В XIX веке немецкий психолог Густав Теодор Фехнер показывал испытуемым множество разных прямоугольников, чтобы узнать, какие из них они считают самыми привлекательными. Они выбирали золотые! Это и правда красивый прямоугольник. Однако утверждения, что по такому принципу спроектирована пирамида Хеопса, Парфенон и «Мона Лиза», не имеют надежных обоснований. (Леонардо да Винчи проиллюстрировал книгу Пачоли о числе, которое итальянцы называли божественной пропорцией, однако никаких доказательств того[455], что художник обращал внимание на него в собственных работах, нет.) Название для золотого сечения придумано уже в XX веке в честь греческого скульптора Фидия, который, как говорят, использовал золотое сечение для создания классических совершенных тел из камня, но, скорее всего, на самом деле такого не было. Авторитетная статья 1978 года[456] в журнале Journal of Prosthetic Dentistry утверждала, что набор вставных зубов[457] для максимально привлекательной улыбки должен иметь центральный резец в 1,618 раза шире бокового резца, который, в свою очередь, должен быть в 1,618 раз шире клыка. Зачем довольствоваться золотым зубом, если можно получить зубы с золотым сечением?

Золотая нумерология достигла пика популярности в 2003 году после выхода бестселлера Дэна Брауна «Код да Винчи» – истории о профессоре религиозной символики из Гарварда, который использует последовательность Фибоначчи и золотое сечение, чтобы распутать головоломку, включающую рыцарей-тамплиеров и современных наследников Иисуса. После этого «вставка » была уже просто грамотным маркетинговым ходом. Можно было купить джинсы, золотые пропорции которых подчеркивают вашу задницу (и прекрасно сочетаются с искусственными зубами!). Появился «Код Диеты»[458], утверждавший, что Леонардо хотел бы, чтобы вы сбрасывали вес, употребляя белки и углеводы в золотой пропорции. Но, вероятно, вершиной мистической геометрической пустой болтовни была стратегия BREATHTAKING («Захватывает дух»[459]) – 27-страничное описание маркетинговой компанией Arnell Group нового логотипа Pepsi в виде глобуса, разработанного в 2008 году. Вам объясняют, что Pepsi и золотое сечение – естественные партнеры, потому что, как вы, вне сомнения, знали, «лексикон истины и простоты – это повторяющееся явление в истории бренда». На приведенной в документе временной шкале появление нового логотипа Pepsi представлено как кульминация тысячелетий науки, включая Пифагора, Евклида, да Винчи и почему-то ленту Мёбиуса. Нам просто повезло, что Arnell ничего не знала о Вираханке, потому что боюсь даже думать, какую псевдосубконтинентальную философию она в противном случае добавила бы в эту адскую смесь.

Новый логотип Pepsi построен из дуг окружностей, радиусы которых находятся в золотой пропорции друг к другу, и, как заявлено в рекламе, отныне это отношение будет известно как «отношение Pepsi» – поистине впечатляющий ребрендинг! И вот тут-то все становится по-настоящему странным. На следующих страницах мы видим «энергетические поля Pepsi» и их связь с магнитосферой Земли, а также такую иллюстрацию, демонстрирующую связь эйнштейновской теории гравитации и привлекательности бренда в продуктовом отделе:

Как ни абсурдно все это звучит, но арнелловский глобус десять лет спустя все еще находится на банках с пепси-колой. Так что, возможно, золотое сечение действительно настоящий природный арбитр того, что красиво и хорошо. А может, люди просто любят пепси?!

Ральф Нельсон Эллиотт занимался бухгалтерским учетом в Канзасе, работал в руководстве железных дорог в Мексике, проводил финансовую реорганизацию в Никарагуа (в то время страна находилась под американским контролем), трудился в Гватемале. В 1926 году он заразился паразитическими амебами и был вынужден вернуться в США. Через несколько лет[460] фондовый рынок рухнул и погрузил мир в депрессию, так что у Эллиотта было много времени и достаточно мотивации, чтобы привнести хоть какой-то порядок в финансовый мир, который больше не вписывался в точные записи двойной бухгалтерии. Разумеется, Эллиотт не знал о работе Луи Башелье о случайном блуждании цен на акции, а если бы и знал, то не уделил бы ей ни минуты. Он не желал верить, что цены на акции колеблются случайно, словно пыль, взвешенная в жидкости. Он хотел нечто более похожее на физические законы, которые надежно удерживают планеты на их орбитах. Эллиотт сравнивал себя с Эдмундом Галлеем, который в XVII веке понял, что кажущиеся случайными приходы и уходы комет на самом деле подчинены строгому расписанию. «Человек – такой же приодный объект[461], как Солнце и Луна, – писал Эллиотт, – и ритмизованная последовательность его действий также подлежит анализу».

Эллиотт тщательно изучил котировки за семьдесят пять лет, вплоть до минутных изменений, пытаясь найти закономерности во взлетах и падениях. Итогом стала волновая теория Эллиотта, которая постулировала, что фондовый рынок регулируется взаимосвязанным набором циклов – от мельчайших (которые занимают минуты) до большого суперцикла, начавшегося в 1857 году и продолжающегося до сих пор. Чтобы все это помогало инвестору зарабатывать, нужно знать, когда рынок разворачивается вверх или вниз. Ответ дает волновая теория. Эллиотт полагал, что движение рынка определяется предсказуемыми закономерностями восходящих и нисходящих трендов, которые специалисты, посвященные в теорию волн, могут спрогнозировать, исходя из принципа, что отношение между длиной нынешнего и длиной прошлого тренда имеет тенденцию быть золотым сечением 1,618. В этом случае Эллиотт был предшественником Макса Коэна из «Пи», который строчил числа Фибоначчи на биржевых страницах газеты.

Правило 1,618 не было абсолютным; следующая волна может быть длиннее на 61,8 %, потому что в этом случае длина последующего тренда в 1,618 раз больше, чем предыдущего. Или она может быть длиннее на 38,2 %, потому что это 61,8 % от 61,8 %. Тут много места для маневров, а чем больше места для маневров допускает теория, тем проще описывать то, что уже происходило, с уверенным «Я так и думал!». Честно говоря, постороннему человеку трудно точно осознать, что именно Эллиотт предсказывает и не предсказывает. Волновая теория, как и все теории, разработанные людьми, много времени проводящими в одиночестве, изобилует специфической терминологией: «Треть трети – мощная средняя часть в импульсной волне. Прорыв – импульсная волна после завершения треугольника». Не удовлетворившись решением проблем фондового рынка, последние десять лет жизни Эллиотт посвятил написанию обобщающей монографии, труда всей жизни под названием «Закон природы – секрет Вселенной». (Спойлер: это волны.)

Эта теория могла быть всего лишь еще одной из странных разработок, оказавшихся на свалке финансовой истории наряду с теориями Роджера Бэбсона, который считал[462], что фондовым рынком управляют законы движения Ньютона, предсказал великий крах 1929 года, затем – неминуемый[463] конец Депрессии в 1930 году, основал колледж Бэбсона в Массачусетсе и колледж Утопия в Юрике в Канзасе (это географический центр Соединенных Штатов, где, по его мнению, будет безопасно в случае взрыва атомной бомбы), баллотировался в президенты США от Партии запрета в 1940 году и потратил большую часть денег, заработанных на книгах и статьях о бизнесе, на попытки разработать антигравитационный металл.

Но разница в том, что волновая теория Эллиотта по-прежнему дееспособна. Руководство по техническому анализу от инвестиционного банка Merrill Lynch включает о ней целую главу – «Концепция Фибоначчи», где излагаются обычные рекламные россказни о золотом сечении:

Как и все иные методы анализа[464], отношение Фибоначчи не является надежным на все 100 %. Тем не менее просто невероятно, насколько часто оно предсказывает важные критические точки. Существует множество предположений о том, почему отношение Фибоначчи и его производные постоянно появляются в жизни. Дело в том, что это загадочное отношение часто обнаруживается в природе. Оно повсеместно встречается на картинах Ренессанса, определяя пропорции и перспективу. Оно также выявлено в архитектуре античных греческих храмов – задолго до времени Фибоначчи.

Ваш блумбергский терминал[465] (если у вас достаточно средств, чтобы его иметь) будет рисовать на ваших биржевых диаграммах маленькие «линии Фибоначчи», чтобы вы знали, до какого уровня поднимется цена, прежде чем будет вынуждена повторить предыдущий тренд с масштабом (сторонники теории волн называют это коррекциями Фибоначчи). В апреле 2020 года Wall Street Journal предупредил своих читателей[466], что у пострадавшего от коронавируса индекса S&P 500 «впереди, вероятно, еще больше проблем»; цены подскочили на 23 % после того, как рынок достиг в конце марта дна, но коррекции Фибоначчи предсказывали дальнейшие потери. Через два месяца S&P вырос еще на 10 %[467].

У меня есть состоятельная знакомая, которая использует методы Фибоначчи для своих инвестиций. Ее аргументация такова: неважно, работает ли это на самом деле, важно то, что достаточное количество людей думают, что работает, и в результате рынки хоть как-то коррелируют с предсказаниями волн Эллиотта. Волны, как и фея Динь-Динь[468], воплощаются в жизнь теми, кто в них по-настоящему верит. Возможно, моя знакомая права, но подтверждений ее взглядов крайне мало. Если ваш инвестиционный менеджер – приверженец коррекций Фибоначчи, я бы сказал, уж простите, что он некомпетентен.

ПОВТОРНЫЙ ВИЗИТ В ДАКОТЫ

Что, если мы подправим нашу модель и сделаем северодакотцев немного опаснее? Скажем, каждый инфицированный житель Северной Дакоты будет заражать не одного, а двух человек из своего штата. Если мы начнем, как и ранее, с одного инфицированного в Северной Дакоте и нуля в Южной, то есть:

(1 СД, 0 ЮД),

то в следующем поколении получится два новых инфицированных северодакотца и один новый зараженный южнодакотец:

(2 СД, 1 ЮД).

Затем эти два северодакотца заразят еще четверых жителей Северной Дакоты и двух – Южной, в то время как единственный зараженный южнодакотец заразит одного нового северодакотца:

(5 СД, 2 ЮД).

Теперь число зараженных в Северной Дакоте образует последовательность

1, 2, 5, 12, 29…

в которой каждое число – это сумма удвоенного предыдущего и предпредыдущего. У нее тоже есть название – последовательность чисел Пелля. Это не геометрическая прогрессия, но, как и последовательность Фибоначчи, тоже к ней стремится. Отношение между последовательными членами равно:

2/1 = 2;

5/2 = 2,5;

12/5 = 2,4;

29/12 = 2,416666…

Продвиньтесь в ней подальше, и найдете число 33 461, за которым следует 80 782; отношение этих величин равно 2,4142…, то есть почти точно 1 + 2. И чем дальше вы заберетесь в эту последовательность, тем ближе отношения будут к этой управляющей константе.

Мы бы наблюдали то же самое, если бы каждый житель Северной Дакоты заражал трех жителей своего штата; тогда магическое отношение было бы (3 + 13) / 2, то есть чуть больше 3,3. Или можем расширить нашу исходную модель, добавив в нее штат Небраска[469] и предположив, что каждый житель Небраски заражает одного южнодакотца, каждый южнодакотец – одного небрасканца, а друг друга жители Небраски не инфицируют. Это сложное взаимодействие между тремя штатами дает такую последовательность для числа больных в Северной Дакоте:

1, 1, 2, 3, 6, 10, 19, 33…

У нее нет собственного названия[470], но ее свойства похожи на описанные выше; последовательные отношения ее членов постепенно приближаются к числу 1,7548…, которое, если уж вы настаиваете на точном выражении, равняется:

Подобные закономерности (а не конкретно золотое сечение) будут базовым принципом повсюду. Неважно, сколько штатов вы включите, сколько именно жителей Ют заразит в среднем житель Вайоминга и т. д., – количество инфекций в каждом штате будет стремиться к какой-то геометрической прогрессии[471]. Платон был прав: природа действительно в каком-то смысле к ней благоволит.

Это до странности сложное число, управляющее скоростью геометрического роста, называется собственным значением. Золотое сечение – всего лишь один из вариантов; его приятные свойства проистекают из того факта, что оно – собственное значение очень простой системы. У других систем – другие собственные значения; на самом деле в большинстве систем их больше одного. В самом первом сценарии для Дакот эпидемия состояла из двух разных вспышек: в обоих случаях рост был геометрическим, только в первом еженедельно происходило утроение числа больных, а во втором – удвоение. Со временем начала доминировать более мощная вспышка: суммарное число заболеваний стало примерно геометрической прогрессией со знаменателем 3. В такой ситуации у вас есть два собственных значения – 2 и 3, причем важно наибольшее из них.

В системах, где разные части взаимодействуют между собой, не так просто понять, как разделить процесс на отдельные идеальные геометрические прогрессии. Но вы сможете! Например, вот геометрическая прогрессия, которая начинается с числа, примерно равного 0,7236… а каждый последующий ее член в  раз больше предыдущего:

0,7236… 1,1708… 1,8944… 3,0652… 4,9596…

А вот еще одна, которая начинается с 0,2764… и имеет отрицательный знаменатель – 0,618… (на самом деле это просто число 1 – ). У этой последовательности наблюдается экспоненциальное убывание к нулю, а не экспоненциальный рост, как у эпидемий с маленьким показателем R0. (Ну, возможно, не совсем так, поскольку у нас каждое второе число получается отрицательным.)

0,2764… –0,1708… 0,1056… –0,0652… 0,0403…

Сложите эти два геометрических ряда – и произойдет нечто замечательное: хвосты после десятичных точек исчезнут, а вы получите в точности последовательность Фибоначчи:

1, 1, 2, 3, 5…

Другими словами, последовательность Фибоначчи – это не геометрическая прогрессия, а сумма двух геометрических прогрессий, одна из которых определяется золотым сечением , а другая – числом 1 –  = –0,618… Это два собственных значения. В долгосрочной перспективе реальное значение имеет только большее из них.

Но откуда взялись эти два числа? Это не какое-то северное и южное собственное значение; каждое из чисел 1,618… и – 0,618… отражает нечто глубокое и глобальное в поведении системы. Это не свойство отдельных частей системы, а результат взаимодействия между ее частями. Алгебраист Джеймс Джозеф Сильвестр (о котором мы скоро расскажем) назвал эти числа скрытыми корнями. Как он ярко объяснял, «скрытыми в том смысле[472], в каком можно сказать, что пар скрыт в воде или дым в табачном листе». К сожалению, англоговорящие математики предпочли наполовину перевести предложенное Давидом Гильбертом слово Eigenwert, означающее по-немецки «собственная стоимость или значение»[473][474].

Мы не обязаны разделять пандемию по географическому признаку и можем использовать любые категории. Например, разделим дакотцев не на северных и южных, а на две (или пять, или десять) возрастные группы, отслеживая во всех случаях степень взаимодействия внутри каждой группы и между группами. В ситуации с десятью группами получается довольно много информации; чтобы упорядочить ее, вы можете взять таблицу 10  10 и, например, на пересечении третьей строки и седьмого столбца вписать число близких личных контактов между участниками третьей и седьмой возрастных групп. (Это может быть несколько избыточно, поскольку то же самое число вы поставите на пересечении седьмой строки и третьего столбца; однако если вы считаете, что молодые передают инфекцию пожилым с большей вероятностью (или наоборот), то вполне можете использовать для этих клеток разные числа.) Такую таблицу чисел Сильвестр назвал матрицей, и название прижилось. Вычисление собственного значения матрицы – скрытого числа, которое определяет рост системы, состоящей из многих частей и описываемых такой таблицей чисел, – математики стали считать одним из фундаментальных. Большинство математиков вычисляют собственные значения ежедневно.

Собственные значения могут дать вам гораздо более точную картину развития пандемии и ее предполагаемого будущего, нежели базовые модели, обсуждавшиеся ранее. В частности, если некоторые подгруппы населения заражаются и передают вирус с гораздо большей вероятностью по сравнению с другими, то первоначальное высокое значение показателя R0 не обязательно означает пандемию, которая распространится на большую часть популяции. Возможно, начальные высокие показатели обусловлены большим количеством заболевших в самой восприимчивой подгруппе населения, а как только вирус охватит всю эту небольшую часть населения (и она, возможно, временно приобретет иммунитет), в оставшейся части его передача замедлится настолько, что ее не хватит для поддержания роста пандемии. Вы можете создать подобные модели[475], где пандемия останавливается после заражения очень небольшой части людей, всего 10 или 20 %, даже при высоком значении R0. Чтобы узнать эти количества, придется вычислять собственные значения для различных подгрупп, но вы можете уловить основную идею, представив себе простой пример. Допустим, для вируса уязвимы всего 10 % популяции (а 90 % имеют иммунитет), но каждый из инфицированных во время периода заразности может в среднем заразить двадцать человек. Однако рост инфекции будет соответствовать показателю R0 = 2, а не R0 = 20, потому что каждый больной человек хотя и встретится с двадцатью людьми, заразит только двоих, наиболее уязвимых. Когда же среди 10 % населения заразятся практически все, у вируса закончатся потенциально восприимчивые жертвы.

Как мы уже знаем, геометрические прогрессии не описывают всей истории. Показатель R0 во время эпидемии может меняться в результате действий правительства или отдельных лиц. Кроме того, есть подъем и спад, которые предсказывает модель Росса – Хадсон и Кермака – Маккендрика, когда вирус охватывает популяцию, приходит к точке коллективного иммунитета и медленно болезненно исчезает. Вы можете провести такой анализ для популяции, разделенной на пространственные или демографические подгруппы, и тогда изучите не столько одну эпидемию, сколько целый набор, где каждая влияет на другие. В итоге, когда вы сложите все результаты, получится нечто, выглядящее смутно реалистичным: вспышки и затишья в разных популяциях в различное время.

При этом, чтобы ваше моделирование оказалось правильным, оно должно быть стохастичным. Это означает, например, что вы не просто присваиваете каждому человеку его персональное точное значение R0 – как если бы вы на этой неделе определенно заразили шесть своих сверстников и одного пожилого человека, – а считаете этот параметр случайной величиной. И если она меняется не очень существенно, то это, возможно, не будет иметь значения: половина инфицированных заразят одного человека, половина – двух, и вы не много потеряете, если положите, что число инфекций на следующей неделе будет в полтора раза больше, чем на этой, и построите модель с параметром R0 = 1,5. Но что, если 90 % не заражают никого, 9 % заражают по десять человек, а 1 % – по шестьдесят? Это по-прежнему дает в среднем 1,5 новые инфекции на человека, но динамика эпидемии будет другой. Возможно, эта небольшая доля людей сверхзаразна по какой-то биологической причине, а может, они предпочитают посещать многолюдные мероприятия в помещении; неважно – математика будет одинаковой. Такие сверхраспротранения – масштабные события, но при этом они редки. В любом конкретном регионе какое-то время может не наблюдаться ни одного такого события, болезнь какое-то время потихоньку будет протекать, но если извне и проникает инфекция, то взрыва не происходит. Но вдруг подряд случаются несколько крупных событий со сверхраспространением, и внезапно происходит локальный всплеск заболевания. Однако вы не уверены в причинах. Если в двух разных местах болезнь протекает по-разному, то, возможно, потому, что в одном из них проводилась соответствующая политика. Но это может быть и просто стохастичность. Чем выше степень доминирования сверхраспространения над инфекцией, тем сильнее влияние глупой случайности в распределении болезни.

Это не означает, что местные органы здравоохранения должны опустить руки, отказаться от действий и молиться, чтобы судьба оказалась к ним благосклонной. Знание, что причина эпидемии – сверхраспространение, может быть полезным. Вы можете подавить передачу, подавляя сверхраспространение. Никаких многолюдных свадеб в помещениях, никаких баров, никакого хорового пения – и, возможно, вам удастся обойтись более мягкими ограничениями в отношении остальных форм контактов между людьми.

КАК РАБОТАЕТ GOOGLE, ИЛИ ЗАКОН ДОЛГИХ БЛУЖДАНИЙ

Появление Google разделило интернет на до и после. Людям, впервые вышедшим онлайн после середины 1990-х, практически невозможно объяснить, насколько радикально все тогда поменялось. Внезапно, вместо того чтобы знать, по какой последовательности ссылок переходить, или вручную набирать HTML-адрес, чтобы добраться до нужной информации, вы могли просто… спросить. Это казалось чудом. На самом деле это были собственные значения.

Лучший способ увидеть, как это работает, – вернуться к пандемии. Предположим, у вас есть усовершенствованная модель, где население делится не просто на две Дакоты или на десять возрастных групп. Вы идете дальше и дробите его на все более мелкие категории, пока каждый человек не становится отдельной категорией. Это называется агентным моделированием, и это прекрасная штука, если вы каким-то образом можете отслеживать (или разумно аппроксимировать) огромный массив данных о взаимодействиях каждого конкретного человека со всеми остальными. Такая модель во многом похожа на случайные блуждания, которые изучал Рональд Росс. Но теперь блуждает не зараженный комар, а сам вирус, перепрыгивая с какой-то вероятностью с инфицированного человека на восприимчивого, с которым тот контактирует. Далее применяется такой же анализ собственных значений, просто размер вашей матрицы колоссален: число строк и столбцов в ней равно числу людей в популяции!

Вы можете подумать, что вероятность заражения в подобных моделях зависит от количества контактов с другими людьми. В какой-то степени это так. Но важно и то, с кем именно вы контактируете. Супруги, разумеется, взаимодействуют друг с другом практически каждый день. Но если они редко общаются с другими людьми, то их контакты не влияют на общее распространение инфекции. Если вы сведете социальное общение к минимуму, ограничившись, скажем, лучшим другом, это может показаться весьма безопасным; но если ваш лучший друг регулярно посещает места большого скопления людей, где не носят масок, вы подвергаетесь высокому риску заболеть, несмотря на небольшое количество контактов.

В реальности агентные модели не доминировали при моделировании COVID-19, поскольку на самом деле у нас нет (и не может быть!) ничего похожего на такие детализированные данные об отдельных контактах людей, без которых агентное моделирование не будет работать.

Но мы говорим уже не о COVID-19, а о поиске в интернете. Сеть ссылок между веб-страницами гораздо легче измерить, чем сеть контактов между людьми. Однако структура схожа. Есть множество отдельных страниц, и каждая пара либо связана, либо нет.

Если ваш поисковый запрос – пандемия, то вам вовсе не нужна случайная страница, выбранная наугад из всех страниц интернета, где упоминается это слово. Вы хотите лучшую! Естественно, вы можете решить, что лучшая страница по этой теме – с наибольшим количеством ссылок на нее. Однако это не всегда так. Распространитель какого-нибудь текста типа «Пандемии – это всего лишь побочные эффекты муниципального фторирования воды» вполне может создать сто сайтов на эту тему, и все они будут ссылаться друг на друга. Если вы на основании этого присвоите высокий рейтинг странице «Чистка зубов или смерть?!», то сделаете большую ошибку.

Важно, откуда идут ссылки. Страницы о фторировании, активно ссылающиеся друг на друга, но без ссылок извне, подобны живущим изолированно супругам, контакты которых замкнуты. Наличие друга – завсегдатая вечеринок – это аналог ссылки на вашу страницу компании CNN; ссылка должна иметь большой вес, если она исходит со страницы, на которую ведет много ссылок. Вы можете смоделировать важность в интернете с помощью случайного блуждания, подобно агентному моделированию распространения болезни. Если вы случайно бродите по интернету, следуя наугад выбранной ссылке на каждой странице, то какие страницы будете посещать часто, а на какие вообще никогда не зайдете?[476]

Весьма приятное свойство случайных блужданий – то, что у этого вопроса есть ответ. И уходит он корнями во времена Андрея Андреевича Маркова и закона долгих блужданий: если у комара есть конечное множество болот, куда он может приземлиться; если у каждого из болот есть определенное множество связанных с ним других болот; если комар в любой момент выбирает болото, в которое полетит, случайным образом из доступных ему болот, то для него существует какая-то предельная вероятность оказаться в каждом из болот. Иными словами, каждому болоту присваивается определенная процентная доля, и комар, блуждающий долгое время, скорее всего, проведет в каждом болоте почти точно такой процент времени.

Несколько проще понять эту ситуацию на примере игры «Монополия». Это случайное блуждание: ваша фишка перемещается между сорока полями в соответствии с указаниями игрального кубика. В 1972 году Роберт Эш и Ричард Бишоп вычислили предельные вероятности[477] для этой игры. Самым вероятным полем для фишки оказалась тюрьма: там в среднем проводится 11 % всего времени[478]. Но если вы хотите знать, где должны строить дома и отели, вам нужно определить, на какие поля с собственностью фишки попадают с наибольшей вероятностью. Лучше всего поле «Иллинойс-авеню», где фишка проводит 3,55 % времени, что существенно выше, чем те 2,5 %, которых вы могли ожидать при равномерном случайном распределении по сорока имеющимся на доске полям. Конечно же, в любой конкретной партии вы можете вообще не попадать сюда (во всяком случае, так вечно происходит с моими везучими детьми, когда я строю дома на Иллинойс-авеню, подчиняясь законам вероятности). Но в целом, если вы будете отслеживать, куда попадают все игроки во всех играх за длительный промежуток времени, то, согласно закону долгих блужданий, именно к таким долям вы будете приближаться.

Для каждого из сорока полей существует предельная вероятность, и поэтому у вас есть список из сорока чисел. Такая штука называется вектором, но этот вектор не просто вектор, а собственный вектор. Как и собственное значение, он фиксирует нечто присущее долговременному поведению системы, что не очевидно при простом взгляде на нее, нечто скрытое, как дым в табачном листе.

То, что Эш и Бишоп сделали для «Монополии», создатели Google сделали для всего интернета. Точнее, тут надо сказать «делают», потому что в интернете, в отличие от «Монополии», постоянно появляются новые сайты и исчезают старые. Предельная вероятность для сайта дает вам оценку, которую они назвали PageRank, и она отражает истинную геометрию интернета лучше, чем что-либо ранее.

Это действительно осуществляется красиво. Вероятность оказаться в определенном месте интернета – это сложная сумма геометрических прогрессий, как это было с общим количеством зараженных в двух Дакотах, только сейчас у нас не две, а миллиарды Дакот. Кажется, что такое невозможно проанализировать. Однако помните: геометрическая прогрессия может экспоненциально расти, экспоненциально затухать, а на границе между этими вариантами оставаться постоянной. Для описанного случайного блуждания одна из геометрических прогрессий постоянна, а все остальные экспоненциально затухают. Их вклад становится все меньше и меньше по мере блуждания. Мы можем увидеть это даже на примере простого блуждания комара по двум болотам из главы 4. Анализ показал, что треть времени комар проведет на одном из болот. Однако мы можем уточнить: если комар начинает свой путь с болота 1, то вероятность того, что он окажется в болоте 1 через день, равна 0,8, через два дня – 0,66, а через три дня – 0,562[479]; мы можем объединить их в такой ряд:

1, 0,8, 0,66, 0,562, 0,493…

и со временем они будут стремиться к числу 1/3 – долгосрочной вероятности нахождения комара в этом болоте. Эта последовательность не геометрическая прогрессия, а результат (полагаю, это вас уже не удивит) сложения двух прогрессий. Одна их них – постоянная:

1/3, 1/3, 1/3, 1/3, 1/3

Страницы: «« 23456789 »»

Читать бесплатно другие книги:

7-дневный интенсив по личному развитию от ведущего тренера Норвегии и автора бестселлера «Без жалост...
Один из финансовых гениев корпорации Arasaka попадает в альтернативный мир Японии восьмидесятых, где...
Далекое будущее, люди ведут ожесточенную войну с инопланетной расой. С каждой потерянной планетой ст...
«Игра мистера Рипли» (1974) – третья книга в серии о самом известном персонаже американской романист...
В своей новой книге Райан Холидей воспевает удивительную силу самодисциплины и тех, кто ею овладел. ...
Сегодня и во все времена Англия была и остается самым последовательным, коварным и опасным геополити...