Величайшие математические задачи Стюарт Иэн
В 1983 г. Фальтингс опубликовал эффектное доказательство того, что фантастическое предположение Морделла на самом деле верно. Его доказательство было построено на методах алгебраической геометрии. Совершенно другое доказательство, основанное на аппроксимации действительных чисел рациональными, вскоре нашел Пауль Войта, а в 1990 г. Энрико Бомбиери опубликовал упрощенное доказательство, основанное примерно на тех же принципах. Существует приложение теоремы Фальтингса к Великой теореме Ферма — проблеме, о которой мы будем подробно говорить в главе 7. Оно утверждает, что для любого целого n, большего или равного 3, уравнение xn + yn = 1 имеет конечное число целых решений. Род соответствующей кривой равен (n 1) (n 2)/2, а это по крайней мере 3, если n 4. Теорема Фальтингса прямо подразумевает, что при любом n 4 уравнение Ферма имеет в лучшем случае конечное число рациональных решений. Ферма утверждал, что оно вовсе не имеет решений, за исключением случаев, когда x или y равны нулю, так что это было очень серьезное продвижение. В следующей главе мы вернемся к истории Великой теоремы Ферма и посмотрим, как заявление ученого подтвердилось.
7. «Недостаточные» поля. Великая теорема Ферма
Впервые мы столкнулись с Ферма в главе 2, где его элегантная теорема о степенях чисел обеспечила метод проверки чисел на простоту. Эта глава посвящена куда более сложному утверждению: Великой теореме Ферма. Название звучит загадочно. «Теорема» — это вроде бы понятно, но кто такой был Ферма и почему эту теорему называют великой, а иногда последней его теоремой? Может быть, название — всего лишь хитрый маркетинговый ход? Оказывается, нет: такое название эта задача получила в XVIII в., когда лишь несколько ведущих математиков хотя бы слышали о ней и уж тем более интересовались ею. Но Великая, или Последняя, теорема Ферма и вправду загадочна.
Пьер Ферма родился во Франции в 1601 г. по одним источникам и в 1607–1608 гг. по другим. Не исключено, что путаница возникла из-за его брата, носившего такое же имя. Его отец был зажиточным купцом, он торговал кожей и занимал высокое положение в городе, а мать происходила из семьи юристов. Пьер учился в университете в Тулузе, а в конце 1620-х гг. перебрался в Бордо, где у него проявился талант к математике. Он говорил на нескольких языках. Кроме того, он собирал материалы и работал над восстановлением одного из классических древнегреческих трудов по математике, принадлежавшего перу Аполлония и давно утраченного. Своими многочисленными открытиями Ферма делился с ведущими математиками своего времени.
В 1631 г. Ферма получил ученую степень юриста в университете Орлеана и был назначен советником в суд Тулузы. Это назначение принесло ему дворянский титул и дало право добавлять к фамилии частицу «де»: де Ферма. Советником суда и практикующим юристом он оставался до конца жизни. Однако страстью его была математика. Он почти ничего не публиковал, предпочитая излагать свои открытия в письмах к коллегам-математикам, как правило, без доказательств. В математике Ферма так и остался любителем, но его работы пользовались заслуженным признанием профессионалов, со многими из которых он был знаком достаточно близко, хотя и по переписке. По существу, он и был профессионалом; просто не занимал в математике никакого официального поста.
Некоторые из его доказательств дошли до нас в письмах и заметках; ясно, что Ферма прекрасно представлял себе, что такое настоящее доказательство. После его смерти многие из его наиболее глубоких теорем остались недоказанными, и за них взялись профессионалы. Через несколько десятилетий лишь одному из утверждений Ферма по-прежнему недоставало доказательства; естественно, именно это утверждение получило известность как его последняя теорема. В отличие от остальных, она никак не поддавалась усилиям математиков и вскоре прославилась контрастом между простотой формулировки и очевидной сложностью поиска доказательства.
Судя по всему, Ферма пришел к своей знаменитой теореме около 1630 г. Точная дата неизвестна, но произошло это вскоре после того, как он начал читать недавно изданную «Арифметику» Диофанта. Тогда у него и появилась идея этой теоремы. Опубликована она была впервые в 1670 г., через пять лет после смерти Ферма. Его сын Самюэль выпустил необычное издание «Арифметики» Диофанта, которое включало и заметки на полях, сделанные Пьером Ферма в его личном экземпляре латинского перевода. Этот перевод был сделан Клодом Гаспаром Баше де Мезириаком и издан в 1621 г. Великая теорема Ферма изложена там в виде заметки к диофантову вопросу VIII Книги II (см. рис. 29).
Речь в этом месте книги шла о задаче представления полного квадрата как суммы двух полных квадратов. Из главы 6 мы знаем, что таких пифагоровых троек существует бесконечное множество. Диофант задается тем же вопросом, но в несколько более сложной формулировке: как найти две меньшие стороны пифагорова треугольника, если известна самая большая его сторона. Иными словами, конкретный квадрат следует «разложить» на два квадрата и выразить в виде их суммы. Он показывает, как решить эту задачу, если большая сторона треугольника равна 4, и получает ответ
4 = (16/5) + (12/5)
в рациональных числах. Умножив все на 25, получим 20 = 16 + 12, а поделив затем на 16, получим знакомое 3 + 4 = 5. Диофант обычно иллюстрировал общие методы конкретными примерами и не приводил никаких доказательств; такая традиция восходит еще к Древнему Вавилону.
Экземпляр«Арифметики» с собственноручными заметками Ферма не сохранился, но, должно быть, такая запись в нем была, поскольку Самюэль прямо об этом говорит. Вряд ли Ферма стал бы долго таить такое сокровище, да и само предположение настолько естественно, что мысль о нем, вероятно, пришла Пьеру в голову сразу же по прочтении восьмого вопроса второй книги «Арифметики». Очевидно, ему стало интересно, можно ли проделать что-нибудь подобное с кубами вместо квадратов — согласитесь, естественный для математика вопрос. Он не нашел подобных примеров — мы можем быть в этом уверены, поскольку точно знаем, что их не существует; неудача ждала его и в случае с более высокими степенями, к примеру с четвертой. Он решил, что эти задачи не имеют решений. Заметка на полях говорит именно об этом. В переводе это звучит примерно так:
«Невозможно разложить куб на два куба, биквадрат на два биквадрата и вообще никакую степень, большую квадрата, на две степени с тем же показателем. Я нашел этому поистине чудесное доказательство, но поля книги слишком узки для него».
Говоря алгебраическим языком, Ферма, согласно его собственному заявлению, доказал, что диофантово уравнение
xn + yn = zn
не имеет целочисленных решений, если n — любое целое число, большее или равное 3. Ясно, что при этом он не рассматривал тривиальных решений, при которых x или y равны нулю. Чтобы не повторять это уравнение постоянно, я буду называть его в дальнейшем уравнением Ферма.
Если у Ферма действительно было доказательство, то найти его так никому и не удалось. В конце концов теорема была доказана в 1995 г., больше чем через три с половиной столетия после появления, но методы доказательства выходят далеко за рамки методик, доступных во времена Ферма или даже таких, которые он мог бы сам изобрести. Надо сказать, что поиски доказательства этой теоремы оказали громадное влияние на развитие математики. По существу, именно они привели к созданию алгебраической теории чисел, которая расцвела в XIX в. благодаря очередной неудачной попытке доказать теорему и блестящей идее, которая едва не спасла доказательство. В конце XX — начале XXI в. она дала толчок настоящей революции.
Вначале математики, работавшие над Великой теоремой Ферма, пытались перебирать степени одну за другой. Общего доказательства теоремы, о котором говорил ее автор в заметке на полях, могло и не быть, но нам известно, как Ферма доказал свою теорему для четвертых степеней. Главный инструмент здесь — евклидова методика поиска пифагоровых троек. Четвертая степень числа — это квадрат квадрата этого числа. Так что любое решение уравнения Ферма для четвертых степеней — это пифагоров треугольник, в котором все три числа также являются полными квадратами. Это дополнительное условие можно ввести в методику Евклида и после некоторых хитрых маневров получить еще одно решение уравнения Ферма для четвертых степеней. Может показаться, что в этом нет никакого особого прогресса; после страницы алгебраических вычислений задача сводится к первоначальной. Однако на самом деле это нам поможет: числа во втором решении меньше, чем в первом (гипотетическом). Главное, если первое решение нетривиально (т. е. если x и y в нем не равны нулю), то же можно сказать и о втором решении. Ферма указывал, что повторение этой процедуры даст нам последовательность решений, в которой числа становятся все меньше и меньше. Однако любая убывающая последовательность целых чисел должна когда-нибудь остановиться. Это логическое противоречие, так что гипотетического решения, с которого все началось, не существует. Ферма назвал этот метод доказательства методом «бесконечного спуска». Мы сегодня назвали бы его доказательством по методу математической индукции, упомянутому в главе 4. Его, кстати, тоже можно переформулировать в терминах минимальных контрпримеров, или в данном случае минимальных положительных примеров. Предположим, существует положительный пример — нетривиальное решение нашего уравнения. Тогда существует и минимальный положительный пример. Но, согласно рассуждениям Ферма, это означает, что существует еще меньший пример, а это уже противоречие. Следовательно, положительных примеров не существует. Со времен Ферма появились и другие доказательства теоремы для четвертых степеней, и на сегодняшний день их известно около 30.
Ферма использовал тот простой факт, что четвертая степень — это особый случай квадрата. Та же идея показывает, что в целях доказательства теоремы Ферма можно считать, что показатель степени n либо равен 4, либо является нечетным простым числом. Любое число n больше 2 делится либо на 4, либо на некоторое нечетное простое p, так что любая n-я степень — это одновременно либо 4-я степень, либо p-я[5]. За два столетия после Ферма его Великую теорему удалось доказать ровно для трех нечетных простых чисел: это 3, 5 и 7. С кубами разобрался Эйлер в 1770 г.; в его опубликованном доказательстве есть пробел, но его можно заполнить при помощи результата, опубликованного им же в другом месте. С пятыми степенями справились Лежандр и Петер Лежен Дирихле около 1825 г. Теорему Ферма для седьмых степеней доказал Габриель Ламе в 1839 г. Позже для этих случаев было найдено немало других доказательств. Где-то по пути несколько математиков получили доказательства для степеней 6, 10 и 14, но эти результаты перекрывались доказательствами для 3, 5 и 7.
Каждое из упомянутых доказательств использует какие-то алгебраические черты, присущие именно этим степеням. Долгое время не было никаких намеков на какую бы то ни было общую структуру, которая могла бы послужить основой доказательства теоремы для всех или хотя бы для значительного числа разных степеней. С ростом показателей степени доказательства становились все сложнее и сложнее. Требовались свежие идеи, открывающие новые горизонты. Софи Жермен, одна из величайших женщин-математиков, разделила теорему Ферма для простых степеней p на два случая. В первом случае ни одно из чисел x, y, z не делится на p. Во втором — одно из них делится. Рассмотрев особые «вспомогательные» простые числа, связанные с p, она доказала, что в первом случае уравнение Ферма не имеет решений для нечетных простых чисел меньших 100. Однако трудно было доказать что-нибудь насчет вспомогательных простых чисел в целом.
Жермен переписывалась с Гауссом, причем сначала под мужским псевдонимом, и оригинальность ее рассуждений весьма впечатлила великого математика. Когда же выяснилось, что его корреспондент — женщина, Гаусс впечатлился еще сильнее и прямо сказал об этом. В отличие от многих своих современников, Гаусс не считал женщин неспособными к высокоинтеллектуальной деятельности, в частности к математическим исследованиям. Позже Жермен предприняла неудачную попытку доказать первый случай Великой теоремы Ферма для всех четных чисел, где опять же можно было бы воспользоваться евклидовой характеристикой пифагоровых троек. Окончательно разобраться с четными степенями удалось только Гаю Тержаняну в 1977 г. Второй случай казался куда более крепким орешком, и никто особенно далеко с ним и не продвинулся.
В 1847 г. Ламе, опираясь на свое доказательство для седьмых степеней, выдвинул замечательную идею. Для ее реализации требовалось ввести комплексные числа, но к тому моменту это уже никого не смущало. Главным ингредиентом было то же, чем воспользовался Гаусс при построении своего правильного 17-угольника (см. главу 3). Любой специалист по теории чисел знал об этом, но до Ламе никому не приходило в голову, что этим можно воспользоваться для доказательства Великой теоремы Ферма.
В системе действительных чисел единица имеет ровно один корень p-й степени (если p нечетное), и корень этот равен самой единице. Но в комплексных числах 1 имеет несколько, а именно p, корней p-й степени. Этот факт — следствие основополагающей теоремы алгебры, поскольку эти корни удовлетворяют уравнению xp 1 = 0 степени p. Для комплексных корней p-й степени из единицы существует симпатичная формула, из которой явствует, что все они являются степенями 1, , 2, 3, …, p 1 некоего комплексного числа (см. прим. {25}). Определяющее свойство этих чисел подразумевает, что xp + yp раскладывается на p множителей:
xp + yp = (x + y) (x + y) (x + y) … (x + p 1y).
Согласно уравнению Ферма, это выражение равно также zp, что представляет собой p-ю степень некоего целого числа. Несложно заметить, что если произведение чисел, не имеющих общих делителей, представляет собой p-ю степень, то и каждое число в отдельности представляет собой p-ю степень. Таким образом, если оставить в стороне некоторые технические подробности, Ламе мог записать каждый из сомножителей как p-ю степень. Отсюда он вывел противоречие.
В марте 1847 г. Ламе выступил с полученным в результате доказательством теоремы Ферма в Парижской академии и сказал, что основной идеей он обязан Жозефу Лиувиллю. Лиувилль поблагодарил Ламе, но одновременно указал на потенциальную проблему в доказательстве. Дело в том, что главное утверждение о том, что каждый сомножитель представляет собой p-ю степень, вовсе не бесспорно. Все зависит от единственности разложения на простые множители — причем не для обычных целых чисел, где это свойство выполняется, но для новых типов чисел, введенных Ламе. Эти комбинации степеней известны как круговые, или циклотомические, числа. Слово «циклотомический» означает «разрезающий круг» и указывает на обстоятельство, которое исследовал еще Гаусс. Мало того, что свойство единственности разложения на простые множители для круговых чисел не доказано, сказал Лиувилль, они вполне могут им и не обладать.
У других математиков сомнения возникли даже раньше. За три года до этого Готтхольд Эйзенштейн писал одному из коллег:
«Если бы у кого-то была теорема, которая утверждала бы, что произведение двух комплексных чисел может делиться на простое число, только если на него делится один из множителей, — что кажется совершенно очевидным, — то он получил бы целую теорию [алгебраических чисел] разом; но такая теорема совершенно неверна».
Теорема, о которой идет речь, есть главный шаг, необходимый для доказательства единственности разложения на простые множители. Эйзенштейн говорил не только о числах, нужных Ламе, но и об аналогичных числах, возникающих при решении других уравнений. Они называются алгебраическими числами. Алгебраическое число — это комплексное число, удовлетворяющее полиномиальному уравнению с рациональными коэффициентами. Алгебраическое целое число — это комплексное число, удовлетворяющее полиномиальному уравнению с целыми коэффициентами, если коэффициент при наибольшей степени x равен 1. Для каждого такого полинома мы получаем связанное с ним поле алгебраических чисел (это означает, что можно складывать, вычитать, умножать и делить такие числа, получая при этом числа того же рода) и соответствующее кольцо (что означает то же самое, за исключением деления) алгебраических целых чисел. Это основные объекты изучения алгебраической теории чисел.
Если, к примеру, взять многочлен x 2, то у него есть корень. Поле включает в себя все числа a + b, где a, b — рациональные числа; кольцо целых чисел состоит из чисел такого же вида, где a, b — целые. Здесь опять же простые делители могут быть определены, и притом единственным образом. Но есть и сюрпризы: у многочлена x + x 1 есть корень (5 1)/2, так что, несмотря на дробь, это алгебраическое целое число.
В алгебраической теории чисел сложность заключается не в том, чтобы найти множители. К примеру, круговое число является делителем другого кругового числа, если второе число можно получить умножением первого на еще какое-нибудь круговое число. Определить простые числа также не сложно: круговое целое число является простым, если у него нет других делителей, кроме тривиальных единиц, которые представляют собой круговые числа — делители 1. Нет проблемы и в разложении кругового числа или любого другого алгебраического числа на простые множители. Нужно просто делить число, пока не закончатся делители. Существует простой способ доказать, что эта процедура конечна, и когда она завершится, каждый делитель окажется простым. Так в чем же проблема? В единственности. Если вы повторите процедуру, выбирая по пути иные решения, вы вполне можете получить другой набор простых делителей.
На первый взгляд, трудно представить себе такую возможность. Простые делители — наименьшие возможные кусочки, на которые можно разбить число. Это как взять собранную из «Лего» игрушку и разобрать на кирпичики. Если бы существовал другой способ сделать это, то, в конце концов, оказалось бы, что мы разделили один из кирпичиков еще на несколько деталей. Но тогда кирпичик не был бы кирпичиком. К несчастью, аналогия с «Лего» обманчива. Алгебраические числа ведут себя не так. Они больше похожи на кирпичики с мобильными связями, способные соединяться между собой в разных сочетаниях. Разбейте кирпичик одним способом — получите одни составные части, которые сцепляются друг с другом и дальше уже не делятся. Разбейте его иначе — и получите еще один набор с теми же свойствами, но уже других деталей.
Я приведу два примера. В первом будут только обычные целые числа. Он несложен для понимания, но обладает некоторыми нерепрезентативными чертами. А затем я покажу вам настоящий пример.
Представьте, что мы живем во Вселенной, где существуют только числа 1, 5, 9, 13, 17, 21, 25 и т. д. — числа, которые в нашей нынешней Вселенной имели бы вид 4k + 1. Если перемножить два таких числа, получится еще одно число такого же вида. Определим такое число как «простое», если оно не является произведением двух меньших чисел того же вида. К примеру, число 25 — не простое, поскольку равняется 5 5, а 5 тоже есть в нашем списке. Но число 21 — простое в этом новом смысле, потому что его обычных делителей (3 и 7) в списке нет. Они имеют вид 4k + 3, а не 4k + 1. Несложно убедиться, что любое число заданного вида есть произведение простых (в новом смысле) чисел. Причина в том, что множители, если они существуют, должны становиться меньше, и со временем процесс факторизации непременно остановится. Когда это произойдет, полученные множители будут простыми.
Однако такое разложение на простые множители не единственно. Рассмотрим число 4389. 4389 = 4 1097 + 1, т. е. это число интересующего нас вида. Вот три различных разложения на множители заданного вида:
4389 = 21 209 = 33 133 = 57 77.
Я утверждаю, что, согласно принятому нами определению, все эти множители простые. К примеру, 57 — простое число, так как его обычные делители 3 и 19 не относятся к требуемому виду. То же можно сказать о числах 21, 33, 77, 133 и 209. Теперь мы можем объяснить неединственность разложения на простые множители. В обычных целых числах
4389 = 3 7 11 19,
и все эти числа «не того» вида, они нам не подходят и имеют вид 4k + 3. Три различных разложения на простые в этом новом смысле числа возникают при трех разных вариантах группировки этих чисел в пары:
(3 7) (11 19), (3 11) (7 19), (3 19) (7 11).
Мы вынуждены брать эти числа парами, так как два числа вида 4k + 3 при перемножении дают число вида 4k + 1.
<>Этот пример показывает, что аргумент «множители должны быть единственными, поскольку они минимальны», в данном случае не работает. Правда, здесь есть числа и меньше (21 = 3 7, к примеру), но эти числа не принадлежат к интересующей нас системе. Главная же причина того, что этот пример не является полностью репрезентативным, заключается в том, что, хотя при умножении числа вида 4k + 1 дают числа того же вида, при сложении этого не происходит. К примеру, 5 + 5 = 10, но 10 — не число нужного нам вида. Поэтому, говоря языком абстрактной алгебры, мы имеем дело не с кольцом.Второй пример не имеет этого недостатка, но он более сложен. Это кольцо алгебраических целых для многочлена x 15. В это кольцо входят все числа a + b15, где a и b целые. В нем число 10 имеет два варианта разложения:
10 = 2 5 = (5 + 15) (5 — 15).
Можно доказать, что все четыре множителя (2, 5, 5 + 15, 5 — 15) являются простыми{26}.
Сегодня все это выглядит гораздо понятнее, чем в 1847 г., но математикам не потребовалось много времени, чтобы показать обоснованность сомнений Лиувилля. Через две недели после доклада Ванцель проинформировал Академию, что для небольших p единственность разложения соблюдается, но для 23-й степени его метод доказательства уже не годится. Вскоре после этого Лиувилль доложил Академии, что единственность разложения на простые множители не соблюдается для круговых целых чисел, соответствующих p = 23. (Эрнст Куммер открыл этот факт тремя годами раньше, но никому не сказал, поскольку искал способ обойти это препятствие.)
Доказательство Ламе работало для небольших значений p, включая некоторые новые (11, 13, 17, 19), но в общем случае неизбежно рассыпалось. Это был наглядный урок: нельзя принимать правдоподобные математические утверждения на веру, даже если они кажутся очевидными. Может оказаться, что они вообще неверны.
Куммер тоже искал доказательство Великой теоремы Ферма, и мысль его работала примерно в том же направлении, что и у Ламе. Он вовремя заметил потенциальное препятствие и отнесся к нему серьезно: проверил и обнаружил, что оно губит этот подход к доказательству. Он нашел конкретный пример неединственного разложения на простые делители для круговых чисел на основе корней 23-й степени из единицы. Но Куммер был не из тех, кто легко сдается, и ему удалось обойти препятствие или по крайней мере смягчить худшие его следствия. Его идею можно продемонстрировать особенно наглядно на примере все тех же чисел вида 4k + 1. Чтобы сделать разложение по-прежнему единственным, достаточно добавить кое-какие новые числа, не принадлежащие к интересующей нас системе. Для этого примера нам нужны недостающие числа вида 4k + 3. А можно не мелочиться и добавить к тому же четные целые числа; тогда мы получим множество целых чисел, замкнутое относительно сложения и умножения. Иными словами, при сложении или умножении двух целых чисел результат тоже будет целым.
Куммер предложил другой вариант этой же идеи. К примеру, чтобы восстановить единственность разложения на простые множители в кольце чисел a + b15, достаточно добавить к нему еще одно число, а именно 5. Далее выясняется, что, чтобы получить кольцо, мы должны добавить еще 3. Теперь
2 = (5 + 3) (5 — 3), 5 = 5 5
и
5 + 15= 5 (5 + 3), 5 — 15 = 5 (5 — 3).
Таким образом, при разных вариантах группировки четырех чисел 5, 5, 5 + 3, 5 — 3 возникает два варианта факторизации.
Куммер назвал эти новые множители идеальными числами, поскольку в его общих формулировках они вообще не считались числами в полной мере. Они были символами, которые вели себя в значительной степени как числа. Он доказал, что любое круговое целое число может быть единственным образом разложено на простые идеальные числа. Довольно тонкая схема: ни круговые числа, ни идеальные числа сами по себе не имели единственного разложения на простые множители. Но если воспользоваться идеальными числами как ингредиентами разложения для круговых чисел, то результат получался единственно возможным.
Позже Рихард Дедекинд нашел более цивилизованную интерпретацию процедуры Куммера, и ею мы пользуемся до сих пор. Каждому идеальному числу вне интересующего нас кольца он поставил в соответствие некий набор чисел внутри кольца. Этот набор он назвал идеалом. Каждое число в кольце определяет идеал: в него входят все числа, кратные данному. Если разложение на простые множители единственно, таков и каждый идеал. Если разложение не единственно, то возникают дополнительные идеалы. Мы можем определить произведение и сумму идеалов, а также простые идеалы, и Дедекинд доказал, что разложение идеалов на простые множители единственно для всех колец алгебраических целых чисел. Это позволяет предположить, что при решении большинства задач работать следует с идеалами, а не с самими алгебраическими числами. Конечно, здесь не обходится без новых сложностей, но альтернативой такому методу, как правило, является тупик.
Куммер научился работать со своими идеальными числами — по крайней мере научился достаточно хорошо, чтобы доказать вариант Великой теоремы Ферма при некоторых дополнительных предположениях. Но остальным смертным идеальные числа показались сложными и даже слегка загадочными. Однако, если посмотреть с позиции Дедекинда, идеальные числа разумны и полезны, и алгебраическая теория чисел начала свой путь. Из нее, в частности, возникла весьма важная идея о том, как можно измерить степень неединственности разложения в кольце алгебраических целых чисел. Каждому такому кольцу ставится в соответствие целое число, именуемое классом. Если класс равен 1, разложение на простые множители однозначно; в противном случае — нет. Чем выше класс, тем «менее однозначно» (почти в буквальном смысле) разложение на простые множители.
Возможность количественно оценить неоднозначность разложения стала серьезным шагом вперед: при помощи некоторых дополнительных усилий она спасала стратегию Ламе, но лишь в некоторых случаях. В 1850 г. Куммер объявил, что может доказать Великую теорему Ферма для большого числа простых чисел, которые он назвал регулярными. Из всех простых чисел до 100 к ним не относятся только 37, 59 и 67. Для всех остальных простых чисел до этого предела и очень многих после Куммер доказал Великую теорему Ферма. Для определения регулярного простого числа необходимо привлечь понятие класса: простое число регулярно, если оно не является делителем номера класса соответствующего кольца круговых целых чисел. Так что для регулярного простого числа разложение хотя и не является единственным, но это не затрагивает существенным образом интересующее нас простое число.
Куммер утверждал, что существует бесконечно много регулярных простых чисел, но это утверждение до сих пор остается недоказанным. По иронии судьбы, в 1915 г. К. Йенсен доказал, что существует бесконечно много иррегулярных простых чисел. Неожиданный критерий регулярности простых чисел выявился в связи с математическим анализом. В нем задействована последовательность чисел, открытая независимо японским математиком Сэки Такакадзу и швейцарским математиком Якобом Бернулли и известная как числа Бернулли. Этот критерий показывает, что в первый десяток иррегулярных простых чисел входят 37, 59, 67, 101, 103, 131, 149, 157, 233 и 257. Углубившись в структуру круговых чисел, Дмитрий Мириманов разобрался с первым из иррегулярных простых чисел — 37 — в 1893 г. К 1905 г. он доказал теорему Ферма до степеней p вплоть до 257. Гарри Вандивер разработал компьютерный алгоритм, который позволил расширить этот предел. При помощи этих методов Джон Селфридж и Бари Поллак в 1967 г. доказали теорему вплоть до 25 000-й степени,а С. Вагстафф в 1976 г. повысил этот предел до 100 000.
Свидетельства истинности Великой теоремы Ферма накапливались и накапливались, но главным, пожалуй, было то, что в случае ее ложности контрпример, т. е. пример, наглядно демонстрирующий нарушение теоремы, оказался бы настолько сложным, что никто и никогда не сумел бы его отыскать. Еще из результатов работы ученых следовало, что методы, такие как у Куммера, сталкивались с теми же проблемами, что и работы более ранних исследователей: большие степени требовали особых очень сложных процедур и особого обращения. Так что эта линия атаки постепенно затормозилась и сошла на нет.
Если при решении математической задачи вы оказались в тупике, последуйте совету Пуанкаре: отвлекитесь и займитесь чем-нибудь другим. Если вам повезет и ветер будет попутным, у вас рано или поздно появится новая идея. Специалисты по теории чисел вряд ли осознанно следовали этому совету, но тем не менее они поступали именно так. Как и утверждал Пуанкаре, такая тактика срабатывала. Некоторые специалисты по теории чисел перенесли внимание на эллиптические кривые (см. главу 6). По иронии судьбы, со временем именно в этой области математики выявились поразительные и неожиданные связи с Великой теоремой Ферма, которые и привели, в конце концов, к доказательству Уайлса. Для описания этих связей нам потребуется еще одно понятие — модулярной функции. С этого момента наше обсуждение приобретет несколько технический характер, но за всем этим стоит вполне разумная история, да нам и нужны-то лишь самые общие положения. Следите за моими рассуждениями.
В главе 6 мы видели, что теория эллиптических функций сильно повлияла на развитие комплексного анализа. В 1830-е гг. Жозеф Лиувилль открыл, что разновидностей эллиптических функций не так уж много. Для любых двух периодов существует особая эллиптическая функция, известная как функция Вейерштрасса, и любая другая эллиптическая функция с теми же двумя периодами является просто ее вариантом. Тем самым подразумевается, что из функций с двойной периодичностью достаточно разобраться в функциях Вейерштрасса — по одной на каждую пару периодов.
Геометрически двойную периодическую структуру эллиптической функции можно интерпретировать как решетку на комплексной плоскости: это все комбинации вида mu + nv двух периодов u и v (см. рис. 30). Если мы возьмем комплексное число z и добавим к нему одну из точек нашей решетки, то значение эллиптической функции в новой точке будет тем же, что и в первоначальной. Иными словами, эллиптическая функция обладает той же симметрией, что и описанная решетка.
Аналитики открыли гораздо более богатый источник симметрий комплексной плоскости, известный как преобразования Мёбиуса. Эти преобразования превращают z в (az + b)/(cz + d), где a, b, c, d — комплексные константы. Симметрии, определяемые решеткой, представляют собой особые случаи преобразований Мёбиуса, но существуют и другие. Однако в более общем случае тоже присутствует набор точек, аналогичный рассмотренной нами решетке. Решетка определяет на евклидовой плоскости ячеистую структуру: достаточно взять в виде ячейки параллелограмм и поместить его углы в узлы решетки (см. рис. 26 и 30). При помощи преобразований Мёбиуса мы можем построить ячеистую структуру в подходящей неевклидовой геометрии, на гиперболической поверхности. Мы можем установить тождественность этой поверхности и части комплексной плоскости, где прямые заменяются дугами окружностей.
В гиперболической геометрии существуют весьма симметричные ячеистые структуры. Для каждой из них можно построить комплексные функции, которые на каждой ячейке повторяют свои значения. Такие функции известны как модулярные и представляют собой естественное обобщение эллиптических функций. Гиперболическая геометрия — очень насыщенная область математики, и диапазон ячеистых структур здесь намного шире, чем на евклидовой плоскости. Поэтому специалисты по комплексному анализу всерьез заинтересовались неевклидовой геометрией. При этом выявилась глубокая связь между математическим анализом и теорией чисел. Модулярные функции играют для эллиптических кривых ту же роль, что тригонометрические функции для окружности.
Напомню, что единичная окружность состоит из точек (x, y), таких, что x + y = 1. Пусть A — действительное число, и
x = cos A, y = sin A.
Тогда определение синуса и косинуса говорит о том, что данная точка лежит на единичной окружности. Более того, любая точка единичной окружности имеет такую форму. Говоря математическим языком, эти тригонометрические функции представляют окружность в параметрическом виде. Что-то очень похожее происходит и с модулярными функциями. Если мы определим x и y при помощи подходящих модулярных функций параметра A, то соответствующая точка будет лежать на эллиптической кривой — одной и той же эллиптической кривой, какое бы значение ни принимал параметр A. Существуют и более абстрактные способы сформулировать вышеизложенное, и специалисты пользуются именно ими, потому что они удобнее, но этот вариант позволяет выявить аналогию с тригонометрическими функциями и окружностью. Эта связь порождает свою эллиптическую кривую для каждой модулярной функции, а разнообразие модулярных функций громадно — ведь это все симметричные ячеистые структуры на гиперболической поверхности. Итак, огромное количество эллиптических кривых может быть соотнесено с модулярными функциями. Но какие эллиптические кривые можно получить таким способом? Именно этот вопрос оказался главным.
Впервые это «недостающее звено» привлекло внимание ученых в 1975 г., когда Ив Эллегуар обратил внимание на занятную связь между Великой теоремой Ферма и эллиптическими кривыми. Герхард Фрей в двух статьях, опубликованных в 1982 и 1986 гг., развил эту идею. Пусть p, как всегда, нечетное простое число. Предположим — в надежде прийти к противоречию, — что существуют ненулевые целые числа a, b и c, удовлетворяющие уравнению Ферма, так что ap + bp = cp. А теперь с надлежащей помпой извлечем из шляпы заранее припасенного кролика: рассмотрим эллиптическую кривую
y = x (x — ap) (x — bp).
Эта кривая называется эллиптической кривой Фрея. Фрей применил к ней механизм работы с эллиптическими кривыми и получил цепочку еще более причудливых совпадений. Его гипотетическая эллиптическая кривая выглядит и правда очень странно. На первый взгляд, она вообще лишена смысла. Фрей доказал, что смысла в ней настолько мало, что она не может существовать. И это обеспечивает нам желанное противоречие и тем самым, разумеется, доказывает Великую теорему Ферма.
Однако в этом доказательстве есть пробел, и Фрей прекрасно знал о нем. Чтобы доказать, что такая эллиптическая кривая не существует, необходимо показать, что если бы она существовала, то была бы модулярной, т. е. одной из тех кривых, что возникают из модулярных функций. Мы только что убедились, что таких кривых множество; на тот момент никому не удавалось отыскать хотя бы одну эллиптическую кривую, которая не была бы модулярной. Казалось логичным, что и кривая Фрея должна быть модулярной, но это была гипотетическая кривая, коэффициенты a, b и c не были известны. К тому же, если бы кривая и правда была модулярной, то она просто не могла бы существовать. Был, однако, один способ раз и навсегда разобраться со всеми этими вопросами: доказать, что все эллиптические кривые модулярны. Тогда кривая Фрея, гипотетическая или нет, тоже была бы модулярной, если бы существовала. А если бы ее не было, то доказательство от этого никак бы не пострадал.
Утверждение, что всякая эллиптическая кривая является модулярной, называется гипотезой Таниямы — Симуры. Она названа в честь двух японских математиков Ютаки Таниямы и Горо Симуры. Встретились они случайно: оба одновременно с одной и той же целью хотели получить в университетской библиотеке одну и ту же книгу. Результатом же стало долгое сотрудничество. В 1955 г. Танияма был в Токио на математической конференции, где молодым участникам предложили составить список открытых вопросов. Танияма предложил четыре вопроса, и все они были связаны с отношениями между модулярными функциями и эллиптическими кривыми. Еще до этого он вычислил некоторые числа, связанные с конкретной модулярной функцией, и заметил, что в точности те же числа появлялись в связи с конкретной эллиптической кривой. Подобные совпадения часто свидетельствуют о том, что все это вовсе не совпадение и что замеченным фактам должно быть какое-то разумное объяснение. Сегодня мы знаем: равенство этих чисел напрямую означает, что эллиптическая кривая является модулярной, более того, именно так чаще всего определяется модулярность в специальной литературе. Так или иначе, Танияма был достаточно заинтригован, чтобы рассчитать соответствующие числа еще для нескольких модулярных функций и выяснить, что они тоже соответствуют конкретным эллиптическим кривым.
Он заинтересовался, не найдется ли подобной черты у каждой эллиптической кривой. Специалисты в этой области в большинстве своем считали, что это слишком хорошо, чтобы быть правдой, — бесплодная мечта, в пользу которой нет почти никаких свидетельств. Симура был одним из немногих, кто считал, что эта гипотеза достойна серьезного рассмотрения. Но в 1957–1958 гг. Симура уехал на год в Принстон, а Танияма, пока его не было, покончил с собой. В оставленной им записке, в частности, говорилось: «Причину моего самоубийства я не могу и сам понять, но это не результат какого-то конкретного события, нет никаких особенных причин. Единственное, что я точно знаю, — я потерял веру в будущее».
Примерно месяц спустя его невеста Мисако Судзуки тоже покончила с собой. В ее прощальной записке было сказано: «Теперь, когда его нет, я тоже должна уйти, чтобы присоединиться к нему».
Симура продолжил работу над гипотезой. По мере того как накапливались свидетельства в ее пользу, он начал склоняться к мысли о том, что она действительно может оказаться верной. Большинство других специалистов были с ним не согласны. Саймон Сингх рассказывает об интервью с Симурой, в котором тот вспоминал, как пытался объяснить все это одному из коллег:
«Профессор поинтересовался: “Я слышал, вы предполагаете, что некоторые эллиптические уравнения могут быть связаны с модулярными формами”.
“Нет, вы не понимаете, — ответил Симура. — Речь не о некоторых эллиптических уравнениях, так ведут себя все эллиптические уравнения!”»
Несмотря на общий скептицизм, Симура продолжал упорно работать, и с годами это предположение приобрело достаточную респектабельность, чтобы о нем стали говорить как о гипотезе Таниямы — Симуры. Затем Андре Вейль, один из крупнейших специалистов по теории чисел XX столетия, нашел дополнительные свидетельства в ее пользу, опубликовал их и высказал уверенность в том, что она на самом деле вполне может быть верна. После этого гипотезу стали называть гипотезой Таниямы — Симуры — Вейля. Вообще, название ее окончательно не устоялось, и в публикациях о ней можно встретить самые разные комбинации имен трех этих математиков. Я буду придерживаться названия «гипотеза Таниямы — Симуры».
В 1960-е гг. еще один математический тяжеловес Роберт Ленглендс понял, что гипотезу Таниямы — Симуры можно рассматривать как один из элементов куда более обширной и амбициозной программы, способной объединить алгебраическую и аналитическую теорию чисел. Он сформулировал целый набор гипотез, связанных с этой идеей и известных сегодня как программа Ленглендса. Она была еще более спекулятивна, чем гипотеза Таниямы — Симуры, но обладала неотразимой элегантностью: подобная математика настолько красива, что просто обязана быть истинной. В течение последующего десятилетия математический мир постепенно оценил красоту программы Ленглендса, и ее исполнение начали воспринимать как одну из главных целей алгебраической теории чисел. Программа Ленглендса представляется верным направлением развития, если, конечно, кому-то удастся сделать в этом направлении первый шаг.
В 1980-е Фрей заметил, что применение гипотезы Таниямы — Симуры к его эллиптической кривой означало бы доказательство Великой теоремы Ферма. Однако к тому времени выявилась еще одна проблема с его идеей. Когда в 1984 г. он прочел лекцию на эту тему, аудитория заметила прореху в ключевом аргументе: его кривая настолько необычна, что просто не может быть модулярной. Один из ведущих специалистов в этой области Жан-Пьер Серр быстро закрыл прореху, но для этого ему пришлось задействовать еще один результат, также нуждавшийся в доказательстве, — специальную гипотезу о понижении уровня. К 1986 г., однако, Кен Рибет доказал эту гипотезу. Теперь единственным препятствием на пути к доказательству теоремы Ферма была гипотеза Таниямы — Симуры, и мнение математического сообщества начало потихоньку смещаться. Серр предсказал, что Великая теорема Ферма, вероятно, будет доказана в течение ближайших десяти лет или около того. Как именно доказана, оставалось вопросом, но в воздухе уже витала общая уверенность в успехе: методики, связанные с модулярными функциями, обретали такую мощь, что очень скоро кто-нибудь должен был реализовать наконец подход Фрея.
Этим кем-то оказался Эндрю Уайлс. В телепрограмме, целиком посвященной доказательству теоремы Ферма, он рассказал:
«Мне было 10 лет, когда я нашел книгу по математике, в которой рассказывалось немного об истории этой задачи [Великой теоремы Ферма], — что один человек написал ее 300 лет назад, но никто никогда не видел ее доказательства, никто не знал, существует ли оно, и с тех пор люди искали его. Передо мной была задача, которую я, десятилетний мальчик, был в состоянии понять, но которую никто из великих математиков прошлого не смог решить. И с того момента я, конечно, пытался решить ее сам. Это был такой вызов, такая красивая задача».
В 1971 г. Уайлс получил в Оксфорде диплом по математике и переехал в Кембридж работать над докторской диссертацией. Его руководитель Джон Коутс сказал ему (и был совершенно прав), что теорема Ферма слишком сложна для докторской диссертации и отсоветовал за нее браться. Так что Уайлс занялся эллиптическими кривыми, которые тогда считались куда более многообещающим полем для исследований. К 1985 г. он был уже в Париже в Институте высших научных исследований — одном из ведущих мировых центров математических исследований. Большинство лучших ученых в тот или иной момент проходят через это учреждение, и, если вы математик, это великолепное место для работы и общения. В то время в Институте бывал и Рибет, и его доказательство специальной теоремы о понижении уровня буквально наэлектризовало Уайлса. Теперь он мог заниматься в высшей степени респектабельным исследованием эллиптических кривых и пытаться доказать гипотезу Таниямы — Симуры — и в то же время стремиться к исполнению своей детской мечты доказать Великую теорему Ферма.
Поскольку все теперь знали о связи между этими областями, это вызывало некоторое беспокойство. Предположим, Уайлс сумел бы собрать почти полное доказательство, в котором оставалось бы лишь несколько небольших пробелов, требующих дополнительных усилий. Предположим также, что кто-то другой узнал бы об этом и заполнил оставшиеся пробелы. Тогда технически именно этот человек стал бы автором доказательства Великой теоремы Ферма. Как правило, математики так себя не ведут, но приз был слишком велик, и Уайлс благоразумно решил принять меры предосторожности. Он вел свои исследования в тайне, что математикам несвойственно. И дело было не в том, что Уайлс не доверял коллегам. Он просто не хотел допустить даже малейшей вероятности того, что кто-нибудь обойдет его перед финишной чертой.
Семь лет Уайлс работал на чердаке своего дома, где был оборудован кабинет. Только жена и непосредственный начальник знали, чем именно он занимается. В тишине и уединении он атаковал задачу всеми методами, какие мог вспомнить и освоить, и, в конце концов, стены крепости начали сотрясаться под его ударами. В 1991 г. Коутс познакомил его с новыми результатами и доказательствами, полученными Маттеусом Флахом. Осада продвигалась успешно: по крепостной стене уже пошли трещины.
К 1993 г. работа над доказательством была завершена. Оставалось лишь представить его миру. Однако Уайлс все еще осторожничал: ему не хотелось рисковать и объявлять о своем достижении только для того, чтобы тут же выявилась какая-нибудь ошибка. Примерно так произошло с Йоити Мияокой в 1988 г.: средства массовой информации поспешили разнести по всему миру его заявление о том, что получено доказательство Великой теоремы Ферма, в котором очень быстро была обнаружена ошибка. Поэтому Уайлс решил провести серию из трех лекций в кембриджском Институте Исаака Ньютона — недавно организованном международном исследовательском центре по математике. Тема лекций звучала безобидно: «Модулярные формы, эллиптические кривые и теория Галуа». Иносказание, однако, мало кого обмануло: все понимали, что Уайлс собирается объявить о серьезном открытии.
На третьей лекции Уайлс коротко изложил доказательство одного особого случая гипотезы Таниямы — Симуры. Он выяснил, что можно обойтись и чуть менее строгим утверждением. Достаточно доказать, что кривая Фрея, если она существует, должна принадлежать к особому классу эллиптических кривых, известных как «полустабильные», а затем доказать, что все кривые этого класса модулярны. Уайлс доказал и то и другое. В конце той лекции он записал на доске следствие — дополнительную теорему, которая непосредственно следует из того, что было только что доказано. Этим следствием была Великая теорема Ферма.
Симура, услыхав о заявлении Уайлса, высказался кратко и по существу: «Я же говорил!»
Но если бы все было так однозначно! У судьбы в запасе нашелся еще один неожиданный поворот. Доказательство нуждалось в одобрении и признании специалистов, и в процессе его рассмотрения, как обычно, выявилось несколько моментов, по которым требовались дополнительные разъяснения. Уайлс справился с большей частью подобных комментариев, но один из них заставил его задуматься. В конце 1993 г. он опубликовал заявление: отозвал свои претензии на доказательство Великой теоремы до тех пор, пока ему не удастся заполнить выявленный логический пробел. Но теперь работать ему приходилось в обстановке полной публичности, т. е. произошло именно то, чего он надеялся избежать.
К марту 1994 г. исправленное доказательство не появилось, и Фальтингс выразил широко распространенное в математическом сообществе мнение: «Если бы [исправить доказательство] было просто, он бы уже решил эту проблему. Строго говоря, то, что было заявлено, не доказательство». Вейль заметил: «Я считаю, что у него есть несколько хороших идей, но доказательства нет… Доказать Великую теорему Ферма — это как взобраться на Эверест. Если кто-то хочет покорить Эверест и не доходит до вершины 100 ярдов, это означает, что он не покорил Эверест». Каждый мог легко представить себе, чем все кончится. Все это уже было. Доказательство рухнуло, его придется полностью пересматривать, и теорема Ферма останется непобежденной до следующего сражения.
Но Уайлс отказывался признавать поражение. К поискам присоединился его бывший студент Ричард Тейлор. Корень проблемы теперь был ясен: результаты Флаха не слишком хорошо подходили к этой задаче. Уайлс и Тейлор попытались доработать методы Флаха, но ничего не получалось. Затем Уайлса осенило: он внезапно понял, в чем состоит главное препятствие. «Я понял, что та самая штука, из-за которой перестал работать метод Флаха, может заставить работать другой метод, который я тоже когда-то пробовал». Солдаты, осаждающие замок, вдруг поняли, что их таран никогда не проломит ворота, поскольку осажденные постоянно сбрасывают на него большие камни, но можно этими самыми камнями зарядить требушет и пробить ворота иначе.
К апрелю 1995 г. новое доказательство было завершено, и на этот раз в нем не оказалось ни прорех, ни ошибок. Оно было опубликовано в виде двух статей в Annals of Mathematics — одном из самых уважаемых математических журналов. Уайлс стал мировой знаменитостью, удостоился нескольких престижных премий и рыцарского звания… и вернулся к своим исследованиям. Его жизнь почти не изменилась.
По-настоящему важно в достижении Уайлса вовсе не доказательство Великой теоремы Ферма как таковое. Я уже говорил, что от того, верна эта теорема или нет, практически ничего не зависит. Если бы кто-то отыскал три 100-значных числа и 250-значный простой показатель степени, из которых сложился бы контрпример к утверждению Ферма, то ни одна важная область математики от этого не пострадала бы. Конечно, прямой компьютерный расчет не осилил бы таких больших чисел, так что вам пришлось бы проявить недюжинный ум, чтобы отыскать что-нибудь подобное, но отрицательный результат в данном случае не вызвал бы ни у кого особой тревоги.
Подлинное значение найденного Уайлсом решения проблемы заключается в доказательстве гипотезы Таниямы — Симуры для полустабильного случая. Не прошло и шести лет, как Кристоф Брейль, Брайан Конрад, Фред Даймонд и Ричард Тейлор расширили методы Уайлса и разобрались не только с полустабильными, но и со всеми остальными эллиптическими кривыми. Они доказали полный вариант гипотезы Таниямы — Симуры, и теория чисел уже никогда не будет прежней. Теперь, если кто-то столкнется с эллиптической кривой, она гарантированно будет модулярной, что открывает перед исследователями множество новых аналитических методов. Эти методы уже используются для решения других задач теории чисел, а в будущем их появится еще больше.
8. Орбитальный хаос. Задача трех тел
Если верить старой шутке, то о продвинутости физической теории можно судить по тому, с каким количеством взаимодействующих тел она не в состоянии разобраться. Закон всемирного тяготения Ньютона сталкивается с проблемами уже на трех телах. Общая теория относительности с трудом справляется с двумя. Квантовая теория и для одного-то тела непомерно сложна, а квантовая теория поля попадает в беду даже там, где тел нет вообще — в вакууме. В этой шутке, как и во многих других, есть доля истины{27}. Так, над задачей гравитационного взаимодействия всего лишь трех тел, которые вроде бы подчиняются ньютонову обратно-квадратичному закону тяготения, математический мир бился не одну сотню лет. И до сих пор бьется, если говорить о красивой формуле для орбит этих тел. Правда, сегодня мы знаем, что динамика трех тел хаотична — настолько нерегулярна, что несет в себе элементы случайности.
Все это выглядит достаточно странно на фоне поразительного успеха гравитационной теории Ньютона, которая объяснила, помимо всего прочего, движение планет вокруг Солнца. Ответом было то, что Кеплер уже вывел эмпирически из астрономических наблюдений Марса: эллипс. Здесь задействованы только два тела: Солнце и планета. Очевидный следующий шаг заключается в том, чтобы записать уравнение для орбит трех тел и решить его. Но у этих орбит нет точных геометрических характеристик, нет даже формулы в геометрических координатах. До конца XIX в. о движении трех небесных тел было известно очень немного, даже в том случае, если одно из них настолько мало, что его массой можно пренебречь.
С тех пор наши представления о динамике трех (или более) тел сильно обогатились, а понимание того, насколько сложен этот вопрос и почему, выросло. Это может показаться ретроградством, но иногда, чтобы продвинуться вперед, лучше всего организовать стратегическое отступление и попробовать другие методы. Для задачи трех тел этот план кампании неоднократно приносил успех в случаях, когда лобовая атака безнадежно завязла бы в обороне.
Древние люди не могли не замечать, что Луна постепенно сдвигается по ночному небу относительно звездного фона. Звезды тоже вроде бы движутся, но все вместе, как единое целое, как крохотные световые точки на громадном вращающемся куполе небес. Луна же, очевидно, совершенно особый объект: это великолепный сияющий диск, меняющий форму от узенького полумесяца новой Луны до полного круга и обратно. Это не светящаяся точка, как звезды.
Некоторые светящиеся точки тоже не подчиняются общим правилам. Они блуждают по небу. Они не меняют своего положения относительно звезд так быстро, как Луна, но все же не обязательно слишком долго наблюдать за небом, чтобы заметить, что они движутся отдельно. Пять таких «блуждающих звезд» видимы невооруженным глазом. Греки назвали их планетами (planetes) — блуждающими. И, конечно, это и есть планеты (planets), сегодня мы называем их Меркурием, Венерой, Марсом, Юпитером и Сатурном — в честь римских богов. С помощью телескопов мы узнали о существовании еще двух: Урана и Нептуна. Плюс наша Земля, разумеется. А вот Плутон уже не считается планетой благодаря спорному решению по терминологии, принятому в 2006 г. Международным астрономическим союзом.
Изучая небеса, древние философы, астрономы и математики пришли к выводу, что планеты блуждают по небу не беспорядочно. Они следуют собственными извилистыми, но достаточно предсказуемыми путями и через строго определенные промежутки времени возвращаются примерно в ту же позицию на ночном небе. Сегодня мы объясняем эти маршруты периодическим движением по замкнутой орбите плюс некоторым влиянием со стороны собственного орбитального движения Земли. Мы признаем также, что периодичность здесь не строгая, но близкая к тому. У Меркурия путь вокруг Солнца занимает около 88 суток, а у Юпитера — почти 12 лет. Чем дальше от Солнца находится планета, тем больше времени у нее уходит на полный оборот вокруг светила.
Первую количественно точную модель движения планет дала система Птолемея. Свое название она получила в честь Клавдия Птолемея, описавшего ее в своем трактате «Альмагест» (что означает «Величайшее построение») около 150 г. н. э. Это геоцентрическая, т. е. с Землей в центре мироздания, модель, в которой все небесные тела движутся вокруг нашей планеты так, будто поддерживаются серией гигантских сфер, каждая из которых вращается с постоянной скоростью вокруг неподвижной оси. Комбинации множества вращающихся сфер требовались для того, чтобы представить сложное движение планет в виде космического идеала равномерного движения по кругу — экватора сферы. Если сфер достаточно, а их оси и скорости выбраны правильно, эта модель очень точно отражает реальность.
Николай Коперник доработал схему Птолемея в нескольких отношениях. Самым радикальным изменением было то, что он заставил все тела, кроме Луны, обращаться не вокруг Земли, а вокруг Солнца, что сильно упростило модель. Это не понравилось католической церкви, но со временем научные взгляды взяли верх, и все образованные люди приняли как данность то, что Земля обращается вокруг Солнца. В 1596 г. Кеплер защищал систему Коперника в своей книге «Тайна мира» (Mysterium Cosmographicum), в которой описал связь между расстоянием от Солнца до планеты и ее орбитальным периодом. Если двигаться от Солнца наружу, прирост периода обращения вдвое превышает прирост расстояния от светила. Позже Кеплер решил, что это соотношение слишком неточно, чтобы быть верным, но именно оно посеяло семена будущих более точных выводов. Кроме того, Кеплер объяснил расстояния между планетами через пять правильных многогранников, аккуратно вписанных друг в друга и разделенных удерживающими их сферами. Пять многогранников поясняли, с его точки зрения, почему планет пять, но сегодня мы знаем о существовании восьми планет, так что данная особенность уже не является аргументом в пользу такой гипотезы. Вообще говоря, существует 120 способов последовательно вписать пять правильных многогранников друг в друга, и, вполне возможно, один из этих способов даст соотношение, близкое к соотношению орбит. Так что это просто случайное приближение, приписывающее природе искусственную и бессмысленную закономерность.
В 1600 г. астроном Тихо Браге нанял Кеплера в качестве ассистента, но их совместная работа продлилась недолго. После смерти Браге Кеплер получил место придворного математика при дворе императора Рудольфа II. В свободное время он анализировал результаты наблюдений Браге за Марсом. Одним из результатов этой работы стала «Новая астрономия» (Astronomia Nova), которая вышла в 1609 г. и представила миру два закона планетарного движения. Первый закон Кеплера гласит, что планеты двигаются по эллипсам — он установил этот факт для Марса, и казалось вероятным, что другие планеты подчиняются тому же закону. Первоначально он считал, что данные хорошо лягут на яйцевидную орбиту, но с этим ничего не получилось; тогда он попробовал эллипс. После проверки эллипс тоже был отвергнут, и Кеплер нашел другое математическое описание формы орбиты, однако в конце концов понял, что его описание — всего лишь иной способ определения эллипса.
«Я отложил [новое определение] в сторону и вернулся к эллипсам, будучи уверенным, что это совершенно иная гипотеза, тогда как обе они, как я докажу в следующей главе, суть одно и то же… Ах, каким глупым я был!»
Второй закон Кеплера гласит, что радиус-вектор планеты заметает за равные промежутки времени равные площади. В 1619 г. в работе «Гармония мира» (Harmonices Mundi) Кеплер завершил изложение своих трех законов куда более точным соотношением, связывающим расстояния и периоды: куб расстояния (большой полуоси эллипса) пропорционален квадрату периода обращения.
Можно сказать, что этим завершилась подготовка сцены к появлению на ней Исаака Ньютона. В работе 1687 г. «Математические начала натуральной философии» (Philosophiae Naturalis Principia Mathematica) Ньютон доказал, что три закона Кеплера эквивалентны единственному закону тяготения: два тела притягиваются друг к другу с силой, пропорциональной их массам и обратно пропорциональной квадрату расстояния между ними. Закон Ньютона обладал громадным преимуществом: он был применим к любой системе тел, сколько бы их ни было. Но за это приходилось платить: закон описывал орбиты не как геометрические формы, а как решения дифференциального уравнения, в которое входили, в частности, ускорения планет. Совершенно непонятно, как из такого уравнения определить форму планетарных орбит или, скажем, положение планет в заданный момент времени. Откровенно говоря, не совсем ясно даже, как найти эти самые ускорения планет. Тем не менее неявно вся эта информация в уравнении содержалась. Проблема заключалась в том, чтобы получить ее в явном виде. Кеплер уже проделал такую операцию для двух тел, и ответом стала эллиптическая орбита и скорость, при которой радиус-вектор каждой планеты описывает равные площади за равные промежутки времени.
Как же обстоит дело с тремя телами?
Хороший вопрос. Согласно закону Ньютона, все тела Солнечной системы притягивают друг друга. Более того, все тела во Вселенной притягивают друг друга. Но никто в здравом уме не стал бы пытаться записывать дифференциальные уравнения для каждого тела во Вселенной. Как всегда, чтобы продвинуться вперед, нужно было упростить задачу, но не слишком сильно. Звезды так далеки от нас, что их гравитационным влиянием на Солнечную систему можно пренебречь, если только вы не собираетесь описывать движение Солнца в Галактике или вращение самой Галактики. Движением Луны в значительной мере управляют два тела — Земля и Солнце — плюс некоторые тонкие эффекты от влияния других планет. В начале XVIII в. этот вопрос вышел за рамки чистой астрономии и приобрел практическое значение: ученые осознали, что движение Луны по небу можно использовать для навигации. (В те времена не было не только системы GPS, но и хронометров для определения долготы.) Но этот метод требовал более точных предсказаний, чем те, что позволяла сделать существующая теория. Очевидно, для начала следовало записать следствия из закона Ньютона для трех тел, которые в данном случае можно было рассматривать как точечные массы, поскольку планеты чрезвычайно малы по сравнению с расстояниями между ними. Затем следовало решить полученные дифференциальные уравнения. Однако методы, позволившие в задаче для двух тел перейти к эллипсам, в задаче для трех тел оказались неприменимы: добавление третьего тела портило всю картину. Несколько предварительных шагов сделать удалось, но затем вычисления зашли в тупик. В 1747 г. Жан д’Аламбер и Алексис Клеро, вечные соперники, приняли участие в конкурсе, объявленном Парижской академией наук по «задаче трех тел», которую оба пытались решить при помощи численных приближений. Задача для трех тел обрела название и вскоре стала одной из великих загадок математики.
Некоторые частные случаи этой задачи удавалось решить. В 1767 г. Эйлер обнаружил решения, в которых все три тела лежат на вращающейся прямой. В 1772 г. Лагранж нашел аналогичные решения для случая, когда тела образуют вращающийся равносторонний треугольник, который может расширяться или сжиматься. Оба решения оказались периодическими: тела повторяли одну и ту же последовательность движений до бесконечности. Однако даже кардинальное упрощение не позволяло получить хоть что-нибудь более общее. Можно было считать, что масса одного из тел пренебрежимо мала или что другие два тела движутся вокруг общего центра масс по идеальным окружностям (версия, известная как «ограниченная задача трех тел»), но найти точное решение уравнений все равно не удавалось.
В 1860 и 1867 гг. астроном и математик Шарль-Эжен Делоне пытался решить задачу для конкретного случая — системы Солнце — Земля — Луна — с использованием теории возмущений. Эта теория рассматривает действие солнечного притяжения на Луну как небольшие добавки, которые накладываются на действие земного притяжения. Делоне вывел приближенные формулы в виде сумм бесконечных рядов: результата сложения множества последовательных членов. Он опубликовал свои результаты в виде двух томов по 900 страниц в каждом. Эти тома были заполнены преимущественно формулами. В конце 1970-х гг. его расчеты были проверены с использованием компьютерной алгебры и подтвердились почти полностью: в них обнаружились всего две незначительные ошибки.
Это был поистине героический расчет, но ряд у Делоне сходился к своему пределу слишком медленно, чтобы этими выкладками можно было пользоваться на практике. Однако работа Делоне подтолкнула других математиков к поиску рядов, которые сходились бы быстрее. Она также вскрыла серьезное техническое препятствие, с которым неизменно встречается подобный подход: это препятствие — малые знаменатели. Некоторые члены последовательности представляют собой дроби, и знаменатель этих дробей вблизи резонанса (состояния, в котором периоды тел кратны друг другу) становится очень маленьким. К примеру, у трех внутренних спутников Юпитера — Ио, Европы и Ганимеда — периоды обращения вокруг планеты составляют 1,77, 3,55 и 7,15 суток, т. е. относятся один к другому почти точно как 1:2:4. Особенно мешает вычислениям секулярный резонанс, при котором кратны друг другу скорости поворота осей двух почти эллиптических орбит, — здесь при вычислении дроби с малым знаменателем погрешность становится очень большой.
Если задача трех тел сложна, то задача n тел, т. е. произвольного числа точечных масс, движущихся под действием ньютонового тяготения, безусловно, еще сложнее. Тем не менее природа представляет нам наглядный и очень важный пример: Солнечную систему. В нее входят восемь планет, несколько карликовых планет, таких как Плутон, и тысячи астероидов, в том числе довольно крупных. Это не говоря о спутниках планет, некоторые из которых — Титан, к примеру, — превосходят по размеру планету Меркурий. Таким образом, Солнечная система — это задача 10, или 20, или 1000 тел в зависимости от степени детализации.
Для краткосрочных прогнозов вполне достаточно численных аппроксимаций (в астрономии 1000 лет — это немного), а вот понять, как будет развиваться Солнечная система в ближайшие несколько сотен миллионов лет, — совсем другое дело. Но есть один серьезный вопрос, ответ на который зависит от подобных долгосрочных прогнозов: речь идет о стабильности Солнечной системы. Планеты в ней, судя по всему, обращаются по относительно стабильным, почти эллиптическим орбитам. Эти орбиты слегка изменяются, когда их возмущают другие планеты, так что период обращения и размеры эллипса могут чуть-чуть меняться. Можем ли мы быть уверены, что и в будущем не будет происходить ничего, кроме этого мягкого влияния? И так ли вела себя Солнечная система в прошлом, особенно на ранних стадиях развития? Останется ли она стабильной или какие-нибудь две ее планеты могут когда— нибудь столкнуться? Наконец, может ли планета оказаться выброшенной из системы прочь, на просторы Вселенной?
В 1889 г. королю Норвегии и Швеции Оскару II должно было исполниться 60 лет. Норвежский математик Геста Миттаг-Лефлер убедил короля объявить к юбилею конкурс на решение задачи n тел с немаленьким призом. Решение должно было представлять собой не точную формулу — к тому моменту было уже ясно, что это означало бы требовать слишком многого, — а некий сходящийся ряд. Пуанкаре, заинтересовавшийся конкурсом, решил начать с очень простой версии: ограниченной задачи трех тел, где масса одного из тел пренебрежимо мала, как, скажем, у пылинки. Если вы наивно примените закон Ньютона к такой пылинке, приложенная к ней сила будет равняться произведению масс, деленному на квадрат расстояния. При нулевой массе результат тоже будет равняться нулю. Это не слишком помогает, поскольку получается, что пылинка мирно летит своей дорогой, не взаимодействуя с остальными двумя телами. Вместо этого можно применить модель, в которой пылинка испытывает влияние остальных двух тел, а вот они полностью ее игнорируют. В этом случае орбиты двух массивных тел оказываются круговыми, и движутся они с постоянной скоростью. Вся сложность движения в такой системе приходится на пылинку.
Пуанкаре не решил задачу, поставленную королем Оскаром, — она была попросту слишком сложной. Но его методы были настолько новаторскими и продвинуться ему удалось так далеко, что приз он все же получил. Исследование было опубликовано в 1890 г. Из него явствовало, что даже ограниченная задача трех тел может не иметь предполагаемого решения. Пуанкаре разделил свой анализ на несколько отдельных случаев в зависимости от общих параметров движения. В большинстве случаев решение в виде ряда вполне можно было получить. Но был один случай, в котором орбита пылинки становилась чрезвычайно путанной.
Пуанкаре вывел эту неизбежную путаность при помощи некоторых других методов, над которыми работал в то время. Эти методы давали возможность описать решения дифференциальных уравнений, не решая их. Его «качественная теория дифференциальных уравнений» стала зерном, из которого выросла современная нелинейная динамика. Основной идеей, которая легла в основу новой теории, было исследование геометрии решений, точнее, их топологии — темы, глубоко интересовавшей Пуанкаре (см. главу 10). В такой интерпретации положения и скорости тел представляют собой координаты в многомерном пространстве. По мере того как идет время, первоначальное состояние системы движется в этом пространстве по некоей криволинейной траектории. Топология этого пути или даже системы всех возможных путей могут рассказать нам много полезного о решениях.
Периодическое решение, к примеру, представляет собой замкнутую траекторию в форме петли. По ходу времени состояние системы вновь и вновь проходит по этой траектории, бесконечно повторяя одно и то же поведение. Тогда и система является периодической. Пуанкаре предположил, что для удобного поиска подобных петель удобно было бы провести многомерную поверхность так, чтобы она рассекла петлю. Мы сегодня называем такую поверхность сечением Пуанкаре. Решения, берущие начало на этой поверхности, могут со временем вернуться на нее. Сама петля при этом возвращается в точности в ту же точку, а решения, проходящие через ближайшие к этой точки, всегда возвращаются на наше сечение примерно через один период. Так что периодическое решение можно интерпретировать как неподвижную точку на «отображении первого возвращения». Это отображение сообщает нам, что происходит с точками поверхности, когда они в первый раз на нее возвращаются, если, конечно, возвращаются. Это может показаться не ахти каким достижением, но такой подход снижает размерность пространства — число переменных в задаче. А это почти всегда хорошо.
Значение великолепной идеи Пуанкаре становится понятно, когда мы переходим к следующему по сложности типу решения — комбинации нескольких периодических движений. Вот простой пример такого движения: Земля обходит вокруг Солнца примерно за 365 дней, а Луна обходит вокруг Земли примерно за 27 дней. Так что движение Луны совмещает в себе эти два разных периода. Разумеется, весь смысл задачи трех тел заключается в том, что это описание не совсем точно, но «квазипериодические» решения такого рода часто встречаются в задачах с участием многих тел. Сечение Пуанкаре помогает распознать квазипериодические решения: когда они возвращаются к интересующей нас поверхности, то не попадают в точности в ту же точку, но точка, в которую они попадают раз за разом, крохотными шажочками обходит на поверхности замкнутую кривую.
Пуанкаре понял, что если бы все решения были такими, то можно было бы подобрать подходящий ряд и смоделировать их количественно. Но, проанализировав топологию отображения первого возвращения, он заметил, что все может быть куда сложнее. Две конкретные кривые, связанные динамикой, могут пересечься. Само по себе это не слишком плохо, но если вы пройдете по кривым до того места, где они вновь вернутся на нашу поверхность, то результирующие кривые вновь должны будут пересечься, но в другом месте. Проведите их еще круг, и они снова пересекутся. Мало того: эти новые кривые, полученные передвижением первоначальных кривых, на самом деле не новы. Они представляют собой части первоначальных кривых. Чтобы разобраться в этой топологии, потребовалось немало размышлений — ведь никто раньше подобными играми не занимался. В результате получается очень сложная картина, напоминающая сеть, сплетенную каким-то безумцем: кривые в ней ходят зигзагами туда-обратно, пересекая друг друга, а зигзаги эти сами, в свою очередь, ходят зигзагами туда-обратно и т. д. до любого уровня сложности. В конце концов, Пуанкаре заявил, что зашел в тупик:
«Когда пытаешься описать фигуру, образованную этими двумя кривыми и их бесконечными пересечениями, каждое из которых соответствует дважды асимптотическому решению, то эти пересечения образуют своего рода сеть, паутину или бесконечно тонкое сито… Поражает сложность этой фигуры, которую я даже не пытаюсь нарисовать».
Сегодня мы называем его картину гомоклинным («замкнутым на себя») плетением (см. рис. 31). Благодаря новым топологическим идеям, высказанным в 1960-е гг. Стивеном Смейлом, мы сегодня видим в этой структуре старого друга. Главное, что она помогла нам понять, — это то, что динамика хаотична. Хотя в уравнениях нет выраженного элемента случайности, их решения очень сложны и нерегулярны. В чем-то они похожи на по-настоящему случайные процессы. К примеру, существуют орбиты — более того, к этому типу относится большинство орбит, — движение которых в точности имитирует многократное случайное бросание монетки. Открытие того факта, что детерминистская система (т. е. система, будущее которой всецело и однозначно определяется ее текущим состоянием) может тем не менее обладать случайными чертами — замечательное достижение, оно изменило многие области науки. Мы уже не можем считать, что простые правила порождают простое поведение. Речь идет о том, что в обиходе часто называют теорией хаоса, и все это восходит непосредственно к Пуанкаре и его работе на приз короля Оскара.
Ну, почти все. На протяжении многих лет историки математики рассказывали об этом именно так. Но примерно в 1990 г. Джун Бэрроу-Грин обнаружила в недрах Института Миттага-Леффлера в Стокгольме печатный экземпляр работы Пуанкаре; пролистав его, она поняла, что он отличается от того варианта, который можно обнаружить в бесчисленных математических библиотеках по всему миру. Это оказалась официальная пояснительная записка к заявке Пуанкаре на приз, и в ней была ошибка. Подавая работу на конкурс, Пуанкаре упустил из виду хаотические решения. Он заметил ошибку прежде, чем работа была опубликована, доработал ее, выведя все, что было необходимо, — а именно хаос, — и заплатил (надо сказать, больше, чем стоил приз) за то, чтобы оригинальная версия была уничтожена, а в печать пошел исправленный вариант. Но по какой-то причине в архиве Института Миттага-Леффлера сохранился экземпляр первоначально ошибочной версии, хотя сама история забылась, пока Бэрроу-Грин не откопала ее и не опубликовала свое открытие в 1994 г.
Пуанкаре, судя по всему, считал, что хаотические решения несовместимы с разложениями в ряд, но это тоже оказалось ошибкой. Прийти к такому выводу было несложно: ряды казались слишком регулярными, чтобы представлять хаос, — на это способна только топология. Хаос — это сложное поведение, определяемое простыми правилами, так что это умозаключение небесспорно, но структура задачи трех тел определенно не допускает простых решений того рода, которые Ньютон вывел для двух тел. Задача двух тел интегрируема. Это означает, что в уравнениях достаточно сохраняющихся величин, таких как энергия, импульс и момент импульса, для однозначного определения орбиты. «Сохраняющихся» означает, что эти величины не меняют своего значения при движении тел по своим орбитам. Но задача трех тел неинтегрируема.
При всем том решения в виде рядов существуют, однако они не универсальны. Они не годятся для начальных состояний с нулевым моментом импульса — мерой суммарного вращения. Такие состояния бесконечно редки, поскольку нуль — всего лишь одно число среди бесконечного количества действительных чисел. Более того, в этих рядах фигурирует не время как таковое, а корень кубический из времени. Все это выяснил в 1912 г. финский математик Карл Фритьёф Зундман. Нечто аналогичное верно даже для задачи n тел опять же с редкими исключениями. Такой результат получил в 1991 г. Ван Цюдун. Но для системы из четырех или более тел у нас нет никаких достоверных данных о том, при каких именно обстоятельствах ряд не сходится, и мы никак не можем классифицировать эти обстоятельства. Мы знаем, однако, что такая классификация должна получиться очень сложной, потому что существуют решения, в которых все тела убегают в бесконечность или через некоторый конечный промежуток времени начинают колебаться с бесконечной частотой (см. главу 12). Физически такие решения — следствие нашего допущения, что все тела представляют собой точки, хотя и массивные. Математически они подсказывают нам, где искать самые дикие варианты поведения системы.
Серьезный успех в решении задачи n тел был достигнут для того частного случая, когда все тела обладают одинаковой массой. Такое допущение нечасто работает в небесной механике, но вполне разумно для некоторых неквантовых моделей элементарных частиц. А главный интерес такая постановка вопроса представляет, конечно же, для математиков. В 1993 г. Кристофер Мур нашел решение задачи трех тел для случая, когда все тела гоняются друг за другом по одной и той же орбите. Удивительна форма орбиты: это восьмерка, показанная на рис. 32. Несмотря на то что у орбиты есть точка самопересечения, тела никогда не сталкиваются.
Расчет Мура был численным и проводился на компьютере. В 2001 г. Ален Ченсинер и Ричард Монтгомери заново независимо открыли это решение. Для этого они, с одной стороны, воспользовались давно известным в классической механике принципом наименьшего действия, а с другой — привлекли весьма хитроумную топологию, чтобы доказать, что такое решение существует. Орбиты тел периодичны во времени: через определенный временной промежуток все тела возвращаются к первоначальным позициям и скоростям, а затем повторяют те же движения до бесконечности. Для любой заданной суммарной массы существует по крайней мере одно такое решение для любого периода.
В 2000 г. Карлес Симо провел численный анализ и получил указания на стабильность восьмерки, за исключением, возможно, очень медленного долгосрочного дрейфа, известного как диффузия Арнольда и связанного с мелкими особенностями геометрии отображения карты возвращений Пуанкаре. При стабильности такого рода почти любые возмущения приводят объекты на орбиту, очень близкую к первоначальной, а среди мелких возмущений доля именно таких приближается к 100 %. При тех редких возмущениях, при которых стабильность все же нарушается, орбита дрейфует от своего первоначального положении чрезвычайно медленно. Результат Симо вызвал удивление, поскольку в задаче трех тел равной массы стабильные орбиты встречаются редко. Численные расчеты показывают, что стабильность сохраняется даже в том случае, когда массы тел слегка различаются. Так что вполне возможно, что где-то во Вселенной три звезды с почти идентичными массами бесконечно преследуют одна другую на орбите в форме восьмерки. По оценке Дугласа Хегги, сделанной в 2000 г., число таких тройных звезд лежит между одной на галактику и одной на Вселенную.
Для орбиты в форме восьмерки характерна интересная симметрия. Возьмем для начала три тела A, B и C. Пройдем с ними треть орбитального периода и обнаружим тела на тех же позициях с теми же скоростями, как в начальный момент, только на тех же местах будут находиться соответственно тела B, C и A. После двух третей периода там же мы найдем тела C, A и B. Через полный период мы увидим в точности первоначальную картину. Решение такого рода известно как хореография — танец планет, в котором они через определенные промежутки времени меняются местами. Численные данные свидетельствуют о существовании хореографий в системах более чем трех тел: на рис. 33 представлены некоторые примеры таких систем. Сам Симо, в частности, отыскал огромное количество хореографий.
Но даже здесь многие вопросы остаются без ответа. У нас до сих пор нет строгого доказательства существования хореографий. Для систем более чем из трех тел все они представляются нестабильными. Скорее всего, так и есть, но это тоже надо доказать. Орбита в виде восьмерки для трех тел заданной массы при заданном периоде представляется единственной, но доказательства тому опять же нет, хотя в 2003 г. Томаш Капела и Петр Згличинский опубликовали компьютерное доказательство того, что она локально единственна — ни одна из близлежащих орбит не работает. Возможно, хореографии — это зерно еще одной великой задачи.
Итак, стабильна ли Солнечная система?
Может, да, а может, и нет.
Продолжая исследовать великое озарение Пуанкаре — возможность существования хаоса, — мы сегодня гораздо лучше разбираемся в теоретических вопросах, связанных с достижением стабильности. Оказалось, что это тонкая и сложная задача. К тому же она, как ни смешно, практически никак не связана с существованием или отсутствием решений в виде рядов. Работа Юргена Мозера и Владимира Арнольда позволила доказать, что различные упрощенные модели Солнечной системы стабильны почти при любых начальных состояниях, за исключением, возможно, эффекта диффузии Арнольда, который не допускает более сильных форм стабильности почти во всех задачах такого рода. В 1961 г. Арнольд доказал, что идеализированная модель Солнечной системы стабильна в этом смысле, но только при допущении, что планеты обладают чрезвычайно малыми массами по сравнению с массой центральной звезды, что их орбиты очень близки к круговым и находятся почти в одной плоскости. Если говорить о строгом доказательстве, то «почти» и «очень близки» здесь означает «различаются не более чем на 1043 долю», и даже в этом случае точная формулировка гласит, что вероятность нестабильности равна нулю. Там, где речь идет о возмущениях, результаты часто бывают гораздо шире, чем то, что удается строго доказать, так что из всего этого следует, что планетная система, в разумной степени близкая к идеальной, вероятно, стабильна. Однако в нашей Солнечной системе допуски составляют 103 по массе и 102 по степени приближения к окружности и наклонению. Понятно, что это несколько больше, чем 1043, так что о применимости результатов Арнольда речь может идти лишь чисто теоретически. Тем не менее приятно, что в этом вопросе хоть о чем-то можно говорить определенно.
Практические стороны подобных задач тоже прояснились благодаря развитию мощных численных методов приближенного решения уравнений при помощи компьютера. Вообще-то это тонкий вопрос, ведь у хаоса есть одно важное свойство: маленькие ошибки способны очень быстро вырасти и погубить все решение целиком. Наши теоретические представления о хаосе и об уравнениях, подобных уравнениям Солнечной системы, в которой отсутствует трение, привели к развитию численных методов, свободных от многих наиболее неприятных свойств хаоса. Их называют симплектическими интеграторами. С их помощью удалось выяснить, что орбита Плутона хаотична. Однако это не означает, что Плутон беспорядочно носится по всей Солнечной системе, разрушая все вокруг себя. Это означает, что через 200 млн лет Плутон по-прежнему будет находиться где-то поблизости от своей нынешней орбиты, но где именно — мы не имеем ни малейшего представления.
В 1982 г. в рамках проекта Longstop под руководством Арчи Роя на суперкомпьютере проводилось моделирование внешних планет (начиная с Юпитера). В них не обнаружилось крупных нестабильностей, хотя некоторые планеты получали энергию за счет других планет странными путями. С тех пор две исследовательские группы занимаются развитием использовавшихся в проекте вычислительных методов и применением их к различным задачам, касающимся нашей Солнечной системы. Руководят этими группами Джек Уиздом и Жак Ласкар. В 1984 г. группа Уиздома предсказала, что спутник Сатурна Гиперион, вместо того чтобы вращаться честь по чести, должен беспорядочно кувыркаться, и последующие наблюдения подтвердили этот факт. В 1988 г. эта же группа в сотрудничестве с Джерри Сассменом построила собственный компьютер, спроектированный специально для работы с уравнениями небесной механики. В сущности, это цифровая модель Солнечной системы (в отличие от обычной механической модели, где движение планет — шариков на палочках — имитируется при помощи штырьков и шестеренок). Первый же расчет, смоделировавший следующие 845 млн лет Солнечной системы, вскрыл хаотичную природу Плутона. На данный момент группа Уиздома и ее последователи успели смоделировать динамику Солнечной системы на следующие несколько миллиардов лет.
Группа Ласкара опубликовала первые результаты по долгосрочному поведению Солнечной системы в 1989 г. При этом в расчетах использовалась усредненная форма уравнений, восходящих еще к Лагранжу. Понятно, что в таком расчете некоторые мелкие подробности размываются и исключаются из рассмотрения. Расчеты группы показали, что положение Земли на орбите хаотично, почти как у Плутона: если мы измерим сегодняшнее положение нашей планеты и ошибемся на 15 м, то ее положение на орбите через 100 млн лет невозможно будет предсказать сколько-нибудь определенно.
Единственный способ снизить влияние хаоса состоит в многократном моделировании с чуть разными начальными данными. Это позволяет получить спектр возможных вариантов вместе с вероятностью каждого из них. В 2009 г. Ласкар и Микаэль Гастино применили эту методику к Солнечной системе, рассмотрев 2500 различных сценариев. Различия между ними чрезвычайно малы — к примеру, это может быть сдвиг положения Меркурия на 1 м. Примерно в 1 % вариантов будущего Меркурий становится нестабильным: он сталкивается с Венерой, рушится на Солнце или выбрасывается за пределы системы.
В 1999 г. Норман Мюррей и Мэтью Холман исследовали несоответствие результатов Арнольда и др., указывающих на стабильность, и моделирования, указывающего на нестабильность. «В чем дело? — спрашивали они. — Может быть, неверны численные результаты, а может быть, классические расчеты здесь неприменимы?» Воспользовавшись аналитическими, а не численными методами, они продемонстрировали, что классические расчеты применят нельзя. Возмущения, необходимые для отражения реальности, слишком велики. Главный источник хаоса в Солнечной системе — близкое к резонансному состояние системы Юпитера, Сатурна и Урана и еще одной системы — Сатурна, Урана и Нептуна, хотя ее близость к резонансу не столь важна. Для проверки этого положения они использовали численные методы; получилось, что горизонт предсказания — мера времени, за которое небольшие ошибки приобретут достаточные масштабы, чтобы вызвать серьезные последствия, — составляет приблизительно 10 млн лет{28}. Их моделирование показывает, что Уран иногда опасно сближается с Сатурном, поскольку эксцентриситет его орбиты меняется хаотически и существует вероятность, что когда-нибудь он будет вообще выброшен прочь из Солнечной системы. Однако вероятное время такого события наступит через 1018 лет. Солнце взорвется и превратится в красный гигант гораздо раньше, примерно через 5 млрд лет. Это событие, естественно, скажется на всех планетах, не в последнюю очередь потому, что само Солнце при этом потеряет 30 % массы. Земля отодвинется прочь от Солнца и, возможно, сумеет избежать захвата необычайно расширившимся светилом. Однако в настоящее время считается, что приливные взаимодействия со временем все же затянут Землю внутрь Солнца, а океаны нашей планеты вскипят и испарятся задолго до этого. Но поскольку типичная продолжительность жизни вида, с эволюционной точки зрения, не превышает 5 млн лет, нам вряд ли стоит беспокоиться обо всех этих потенциальных катастрофах. Мы погибнем гораздо раньше от каких-нибудь других причин.
При помощи этих же методов можно исследовать прошлое Солнечной системы: берем те же уравнения и пускаем время назад — простой математический фокус. До недавнего времени астрономы склонны были считать, что планеты всегда находились примерно на нынешних своих орбитах, — с тех самых пор, как сконденсировались из газопылевого облака, окружавшего зарождающееся Солнце. Более того, на основании их состава и формы орбит делались выводы о размерах и составе того самого первичного газопылевого облака. Сегодня же ученые склоняются к мнению, что планеты начинали свое существование вовсе не на нынешних орбитах. По мере того как из пылевого облака под действием внутреннего тяготения образовывались планеты, Юпитер — самая массивная из них — начал выстраивать остальные тела, да и сами они постоянно влияли друг на друга. Такую гипотезу предложили в 1984 г. Хулио Фернандес и Винг-Хуен Ип, но какое-то время их работу рассматривали скорее как любопытную, но незначительную диковинку. В 1993 г. Рену Малхотра всерьез задумался о том, как изменения в орбите Нептуна могли влиять на остальные планеты-гиганты. К нему присоединились другие исследователи, и постепенно проявилась картина чрезвычайно динамичной юности нашей Солнечной системы.
Планеты продолжали формироваться, и пришло время, когда Юпитер, Сатурн, Уран и Нептун были уже почти готовы, но между ними циркулировало громадное количество скальных и ледяных планетезималей — небольших тел около 10 км в поперечнике. После этого эволюция Солнечной системы шла путем миграции и столкновения планетезималей. Многие из них были выброшены в пространство, что снизило суммарную энергию и момент импульса четырех планет-гигантов. Поскольку все эти миры обладали разными массами и находились на разных расстояниях от Солнца, то и реагировали они по-разному. Нептун стал одним из победителей в орбитальной схватке за энергию и в результате отошел подальше от светила. Уран и Сатурн сделали то же самое, но в меньшей степени. Юпитер же в смысле энергии остался в проигравших и сместился внутрь системы. Но он был столь массивен, что далеко не ушел.
Остальные, меньшие тела Солнечной системы, тоже испытали на себе действие этих перемен. Текущее состояние системы, вроде бы стабильное, возникло в результате затейливого танца гигантов, в ходе которого разыгравшийся хаос бросил мельчайшие тела навстречу друг другу. Так стабильна ли Солнечная система? Вероятно, нет, но человечеству не удастся убедиться в этом на практике.
9. Закономерности простых чисел. Гипотеза Римана
В главе 2 мы рассматривали индивидуальные свойства простых чисел, и я сравнил их с зачастую непоследовательным и непредсказуемым поведением людей. Но люди обладают свободой воли, они могут принимать решения, исходя из своих соображений. А простые числа делают то, что подсказывает им логика арифметики, хотя нередко создается впечатление, что они тоже обладают собственной волей. Их поведение управляется странными совпадениями и часто лишено какой бы то ни было разумной структуры.
Тем не менее в мире простых чисел не правит анархия. В 1835 г. Адольф Кетле поразил современников, обнаружив математические закономерности в мире социальных явлений, которые зависят от сознательных решений разных людей или вмешательства судьбы: в мире рождений, свадеб, смертей, самоубийств. Закономерности были статистическими и касались не отдельных людей, а усредненного поведения больших человеческих масс. Именно так статистики извлекают порядок из индивидуальной свободы воли. Примерно в то же время математики начали осознавать, что такой фокус можно проделать и с простыми числами. Пусть каждое из них в отдельности — ярый индивидуалист, все вместе они подчиняются закону. Существуют скрытые закономерности.
Статистические закономерности проявляются тогда, когда мы рассматриваем сразу все множество простых чисел. К примеру: сколько простых чисел содержится в натуральном ряду до некоего определенного предела? На этот вопрос очень сложно ответить точно, но существуют прекрасные аппроксимации, и чем выше предел, тем точнее становятся приближенные значения. Иногда можно добиться, чтобы разница между приближенным и точным ответами была очень мала, но, как правило, это означало бы хотеть слишком многого. Большинство приближений в этой области являются асимптотическими. Это означает, что отношение приближенного значения к точному можно сделать очень близким к 1. При этом, хотя ошибка в процентах стремится к нулю, абсолютная ошибка может быть сколь угодно велика.
Если вы пытаетесь понять, как такое может быть, представим последовательность чисел — для некоего трудного для понимания свойства простых чисел — состоящую из степеней 100:
100, 10 000, 1 000 000, 100 000 000.
Но реальные числа при этом таковы:
101, 10 010, 1 000 100, 100 001 000,
т. е. лишняя единица сдвигается на каждом шаге влево на одну позицию. В этом случае отношение соответствующих чисел, чем дальше, тем ближе подходит к 1, а вот разность между ними приобретает вид:
1, 10, 100, 1000
и может достигать сколь угодно больших значений. Подобное поведение наблюдается в тех случаях, когда ошибка — разность между точным и приближенным ответом — беспредельно растет, но медленнее, чем растут сами числа.
Поиск асимптотических формул, имеющих отношение к простым числам, вдохновил математиков на создание новых методов теории чисел, основанных не на целых числах, а на комплексном анализе. Анализ — это строгое описание дифференциального и интегрального исчисления, включающего, как явствует из названия, два ключевых аспекта. В первом из них — дифференциальном исчислении — речь идет о скорости, с которой некая величина, называемая функцией, растет по отношению к другой величине. К примеру, положение тела зависит от времени, и скорость, с которой это положение изменяется со временем, представляет собой мгновенную скорость тела. Второй аспект — интегральное исчисление — имеет дело с расчетом площадей, объемов и тому подобных величин путем складывания большого числа очень маленьких кусочков. Процесс этот называется интегрированием. Примечательно, что интегрирование — это операция, обратная дифференцированию. Первоначальные формулировки Ньютона и Готфрида Лейбница требовали некоторых маневров с бесконечно малыми величинами, в связи с чем возникали вопросы о логической обоснованности этой теории. Со временем ученые разобрались с этими концептуальными вопросами, определив понятие предела — величины, к которой можно приблизиться на сколь угодно малое расстояние, но которой зачастую невозможно достичь. Именно в таком виде, в более строгих формулировках, метод получил название анализа.
Во времена Ньютона и Лейбница величины, о которых шла речь, представляли собой действительные числа, и результатом их работы, соответственно, стал действительный анализ. Когда же комплексные числа завоевали признание математиков, методы анализа естественным образом распространили и на них. Получился комплексный анализ, оказавшийся необычайно красивым и мощным инструментом. Вообще, когда дело доходит до анализа, комплексные функции ведут себя намного лучше, чем действительные. У них, конечно, есть свои особенности, но преимущества работы с комплексными функциями многократно перевешивают все их недостатки.
В какой-то момент математики с удивлением обнаружили, что арифметические свойства целых чисел можно с большой пользой переформулировать в терминах комплексных функций. До этого две системы ставили перед учеными очень разные вопросы и требовали использования очень разных методов. Но сегодня при помощи комплексного анализа — мощнейшего набора методик — можно открывать особые свойства функций теории чисел, а из них, в свою очередь, можно извлекать асимптотические формулы и многое другое.
В 1859 г. немецкий математик Бернхард Риман взял давнюю идею Эйлера и развил ее совершенно по-новому, определив так называемую дзета-функцию. Одним из результатов этой работы стала точная формула для количества простых чисел до заданного предела. Формула представляла собой бесконечную сумму, но специалистам по анализу к этому не привыкать. И это не было бесполезной игрой ума: благодаря этой формуле удалось получить новые подлинные знания о мире простых чисел. Мешала только одна маленькая неувязка. Хотя Риман мог доказать, что его формула точна, самые важные потенциальные следствия из нее полностью зависели от одного простого утверждения, касающегося дзета-функции, и вот это-то простое утверждение Риман никак не мог доказать. И сегодня, полтора столетия спустя, мы все еще не сумели сделать это. Сегодня это утверждение называется гипотезой Римана и представляет собой, по сути, священный Грааль чистой математики.
В главе 2 мы видели, что простые числа обыкновенно встречаются тем реже, чем они больше. Поскольку казалось, что точных формул для их распределения наверняка не существует, возникало естественное желание поискать статистические закономерности. В 1797–1798 гг. Лежандр подсчитал, сколько простых чисел помещается в натуральном ряду вплоть до различных пределов. Для этого он воспользовался таблицами простых чисел, которые незадолго до того составили Георг Вега и Антон Фелькель. Веге, судя по всему, вообще нравились сложные расчеты: он составил таблицы логарифмов и в 1789 г. стал обладателем мирового рекорда по вычислению числа , которое он посчитал до 140-го десятичного знака (из них 126 были посчитаны верно). А Фелькелю просто нравилось искать простые числа. Его главная работа вышла в 1776 г. и называлась «Таблица всех простых делителей чисел до 10 000 000, за исключением тех, что делятся на 2, 3 или 5». Для проверки делимости на 2, 3 и 5 есть простые способы, упомянутые в главе 2, и он сэкономил в книге много места, опустив эти числа. Лежандр открыл эмпирическую приближенную формулу для количества простых чисел, меньших заданного числа x, и обозначил это количество (x). Если вы привыкли воспринимать только как символ для обозначения числа 3,14159, это потребует привыкания, но в любом контексте несложно понять, что именно имелось в виду, даже если вы не заметили, что символы даны в несколько разном начертании. В 1808 г. в тексте Лежандра по теории чисел утверждалось, что значение (x), судя по всему, очень близко к значению выражения x/(log x 1,08366).
В 1849 г. в письме к астроному Иоганну Энке Гаусс сообщил, что в свое время, лет в 15, сделал на полях таблицы логарифмов запись, в которой утверждалось количество простых чисел, меньших или равных x, составляет x/log x для больших x. Гаусс не опубликовал это наблюдение (как и многие другие свои открытия), возможно, потому, что не имел доказательства. В 1838 г. Дирихле сообщил Гауссу об аналогичной приближенной формуле, найденной им самим. По существу, эта формула сводится к логарифмической интегральной функции{29}
По мере того как x становится большим, отношение Li(x) к x/log x стремится к 1; это означает, что если одно из них асимптотически равно (x), то асимптотически равно и второе, но рис. 34 позволяет предположить (совершенно верно), что Li(x) — лучшее приближение, чем x/log x. Точность Li(x) впечатляет. К примеру,
(1 000 000 000) = 50 847 534,Li(1 000 000 000) = 50 849 234,9.
Аппроксимация в виде x/log x хуже: в данном случае ее значение 48 254 942,4.
Приближенная формула с использованием Li(x) или x/log x стала известна как теорема о распределении простых чисел, где слово «теорема» использовалось в смысле «предположение». Поиск доказательства того, что эти формулы асимптотичны к (x), стал одной из ключевых открытых задач теории чисел. Многие математики пытались одолеть ее при помощи традиционных методов этой области науки, и некоторые подошли к ответу достаточно близко, однако всегда оставалась какая-то хитрая посылка, которую никак не удавалось доказать. Нужны были новые методы. Они появились в результате любопытного переформулирования двух древних, еще евклидовых, теорем о простых числах.
Теорема о распределении простых чисел была ответом на евклидову теорему о том, что простые числа уходят в бесконечность и могут быть сколь угодно большими. Другая фундаментальная евклидова теорема говорит о единственности разложения на простые множители: каждое положительное целое число есть произведение простых чисел, причем только одного их набора. В 1737 г. Эйлер понял, что первую теорему можно переформулировать в виде поразительной формулы из действительного анализа, и тогда второе утверждение становится простым следствием этой формулы. Для начала я представлю формулу, а затем попытаюсь разобраться в ней. Вот она:
Здесь p принимает все простые значения, а s — константа. Эйлера интересовал в основном случай, при котором s — целое число, но его формула работает и для действительных чисел, в случае если s больше единицы. Это условие необходимо для того, чтобы ряд в правой части сошелся, т. е., будучи продолжен до бесконечности, принял бы осмысленное значение.
Это необыкновенная формула. В левой части мы перемножаем бесконечно много выражений, которые зависят только от простых чисел. В правой — складываем бесконечное число выражений, которые зависят от всех положительных целых чисел. Эта формула выражает, на языке анализа, некоторое отношение между целыми и простыми числами. Главное отношение такого рода — это единственность разложения на простые множители, именно она оправдывает существование формулы.
Я кратко опишу основной этап, чтобы показать, что за всем этим стоит разумная идея. Воспользовавшись школьной алгеброй, мы можем разложить выражение в ряд по p. Этот ряд напоминает правую часть формулы, но включает только степени p. А именно:
Когда мы перемножим все эти ряды, для всех простых p, и раскроем все скобки, мы получим комбинации с любыми степенями простых чисел, т. е. с любыми цеыми положительными степенями. Все они выглядят как величины, обратные (т. е. единица, деленная на) s-й степени данного числа, и все возникают лишь единожды в связи с единственностью разложения на простые множители. Таким образом, получаем ряд в правой части.
Никому до сих пор не удалось найти простой алгебраической формулы для суммы этого ряда, хотя формул с интегралами немало. Поэтому мы присвоили ей особый символ — греческую букву дзета () — и определили новую функцию:
Вообще говоря, Эйлер не использовал символ и рассматривал только положительные целые значения s, но я буду и дальше называть приведенный выше ряд эйлеровой дзета-функцией. Воспользовавшись своей формулой, Эйлер заключил, что существует бесконечно много простых чисел (для этого он рассматривал значения s, близкие к единице). Главной его целью было получить формулы вроде (2) = /6 и найти сумму ряда для четных целых s. Развивать свою революционную идею дальше он не стал.
Другие математики заметили упущение Эйлера и рассмотрели нецелые значения s. В двух работах 1848 и 1850 гг. русский математик Пафнутий Чебышев предложил великолепную идею: попытаться доказать теорему о распределении простых чисел при помощи анализа. Начал он со связи между простыми числами и математическим анализом, обеспечиваемой эйлеровой дзета-функцией. Он не добился полного успеха, поскольку считал s действительным числом, а аналитические возможности действительного анализа весьма ограничены. Зато он сумел доказать, что для больших x отношение (x) к x/log x лежит между двумя константами, одна из которых чуть больше единицы, а вторая — чуть меньше. Это был уже реальный результат, хотя пока еще не такой, как хотелось. Он позволил Чебышеву доказать постулат Бертрана, предложенный в 1845 г.: если взять любое натуральное число (2) и удвоить его, то между двумя этими числами обязательно найдется простое число.
Вот теперь сцена была готова к появлению Римана. Он тоже понял, что дзета-функция — это ключ к теореме о распределении простых чисел, но для реализации этого подхода ему пришлось предложить смелое расширение: определить дзета-функцию не только действительной, но и комплексной переменной. А начать можно с ряда Эйлера. Он сходится для любых действительных s больше единицы, и если использовать для комплексного s в точности ту же формулу, то ряд будет сходиться при любых s, у которых действительная часть больше 1. Однако Риман обнаружил, что можно сделать и лучше. Применив процедуру так называемого аналитического продолжения, он расширил определение (s) на все комплексные числа, за исключением 1. Это значение s исключено потому, что при s = 1 значение дзета-функции становится бесконечным{30}.
В 1859 г. Риман собрал все свои мысли о дзета-функции в одну статью, заголовок которой можно перевести как «О количестве простых чисел, не превышающих заданной величины». В ней он привел полную и точную формулу (x){31}. Я опишу более простую формулу, эквивалентную римановой, чтобы показать, как появляются нули дзета-функции. Идея заключается в том, чтобы подсчитать, сколько простых чисел, или степеней простых чисел, укладывается до любого заданного предела. Однако вместо того чтобы сосчитать каждое число по одному разу, как функция (x) делает с простыми числами, мы придаем большим простым числам дополнительный вес. Более того, любая степень простого числа учитывается в соответствии с логарифмом этого простого числа. Так, для предела 12 мы имеем следующие степени простых чисел:
2, 3, 4 = 2, 5, 7, 8 = 2, 9 = 3, 11,
поэтому взвешенный подсчет дает
log 2 + log 3 + log 2 + log 5 + log 7 + log 2 + log 3 + log 11,
что составляет примерно 10,23.
Воспользовавшись методами анализа, информацию об этом более хитроумном способе подсчета простых чисел можно превратить в информацию об обычном способе. Однако этот метод приводит к более простым формулам, и присутствие логарифма — не слишком дорогая цена за это. В этих терминах точная формула Римана говорит о том, что взвешенный подсчет до предела x эквивалентен
где обозначает сумму по всем числам , для которых () равна нулю, исключая отрицательные четные целые числа. Эти значения называются нетривиальными нулями дзета-функции. Тривиальные нули — это отрицательные четные целые числа 2, 4, 6… Во всех этих точках дзета-функция равняется нулю из-за формулы, которая используется в определении аналитического продолжения, но, как выяснилось, для римановой формулы эти нули несущественны (как и почти везде в других местах).
На случай, если формула вас немного пугает, я укажу главное: хитрый способ подсчета простых чисел до заданного предела x, который при помощи кое-каких аналитических фокусов можно превратить в обычный способ, в точности эквивалентен сумме по всем нетривиальным нулям дзета-функции простого выражения x/ плюс некая несложная функция от x. Если вы специалист по комплексному анализу, вы сразу увидите, что доказательство теоремы о распределении простых чисел эквивалентно доказательству того, что взвешенный подсчет до предела x асимптотически сходится к x. Воспользовавшись комплексным анализом, получим: это утверждение верно, если у всех нетривиальных нулей дзета-функции действительная часть лежит между 0 и 1. Чебышев не смог этого доказать, но подошел достаточно близко, чтобы извлечь полезную информацию.
Почему нули дзета-функции так важны? Одна из базовых теорем комплексного анализа утверждает, что при некоторых формальных условиях функция комплексной переменной полностью определяется значениями переменной, при которых функция равна нулю или бесконечности, плюс некоторая дополнительная информация о поведении функции в этих точках. Эти особые точки известны как нули и полюсы функции. В действительном анализе эта теорема не работает — и это одна из причин, по которым комплексный анализ завоевал такую популярность, несмотря на необходимость извлекать корень квадратный из 1. У дзета-функции один полюс (при s = 1), так что все ее характеристики определяются нулями (если, конечно, не забывать о существовании этого единственного полюса).
Для удобства Риман работал в основном с зависимой кси-функцией (x), которая тесно связана с дзета-функцией и получается из метода аналитического продолжения. Он заметил:
«Весьма вероятно, что все [нули кси-функции] действительны. Хотелось бы, конечно, иметь строгое доказательство этого факта, но после нескольких бесплодных попыток я отложил поиск такого доказательства, поскольку этого не требуется для непосредственных целей моего исследования».
Это заявление о кси-функции эквивалентно аналогичному заявлению о зависимой от нее дзета-функции. А именно: все нетривиальные нули дзета-функции представляют собой комплексные числа вида: они лежат на критической линии «действительная часть равна 1/2» (см. рис. 35). Эта версия замечания и есть знаменитая гипотеза Римана.
Замечание Римана звучит достаточно небрежно, как будто высказано между делом и эта гипотеза не имеет особого значения. И это действительно так, если говорить только о программе Римана по доказательству теоремы о распределении простых чисел. Но во многих других вопросах верно обратное. Многие считают гипотезу Римана важнейшим из остающихся на сегодняшний день открытыми математических вопросов.
Чтобы понять, почему это так, мы должны последовать за рассуждениями Римана чуть дальше. В тот момент ученый был нацелен на теорему о распределении простых чисел. Его точная формула предлагала верный путь к этму достижению: нужно было разобраться в нулях дзета-функции или эквивалентной ей кси-функции. Полная риманова гипотеза для этого не нужна, достаточно доказать, что у всех нетривиальных нулей дзета-функции действительная часть лежит в промежутке от 0 до 1, т. е. что сами комплексные корни лежат на расстоянии не более 1/2 от римановой критической линии — в так называемой критической полосе. Это свойство нулей подразумевает, что сумма по всем нулям дзета-функции, фигурирующая в приведенной выше точной формуле, представляет собой конечную константу. Асимптотически для больших x она вообще может потеряться. Единственный член формулы, который сохранит свое значение при очень больших x, это сам x. Все остальные сложные слагаемые асимптотически пропадают в сравнении с x. Следовательно, взвешенная сумма асимптотически стремится к x, и это доказывает теорему о распределении простых чисел. Так что, по иронии судьбы, роль нулей дзета-функции заключается в том, чтобы доказать, что они не вносят существенного вклада в точную формулу.
Риман так и не довел свою программу до логического конца. Более того, он никогда больше ничего не писал по этому вопросу. Но два других математика, приняв у него эстафету, показали, что догадка Римана верна. В 1896 г. Жак Адамар и Шарль-Жан де ла Валле Пуссен независимо друг от друга вывели теорему о распределении простых чисел, доказав, что все нетривиальные нули дзета-функции лежат в пределах критической полосы. Доказательства у обоих получились очень сложными и техничными, но тем не менее свою задачу они выполнили. Возникла новая мощная область математики — аналитическая теория чисел. Применение ей нашлось в самых разных уголках теории чисел: с ее помощью решали давние задачи и выявляли новые закономерности. Другие математики позже нашли несколько более простых доказательств теоремы о числе простых, а Атле Сельберг и Пал Эрдеш открыли даже очень сложное доказательство, вовсе не требовавшее применения комплексного анализа. Но к тому моменту при помощи идеи Римана было доказано бесчисленное множество важных теорем, включая аппроксимации многих функций теории чисел. Так что это новое доказательство хоть и добавило в эту историю каплю иронии, но ни на что, в сущности, не повлияло. В 1980 г. Дональд Ньюман нашел гораздо более простое доказательство, для которого достаточно оказалось всего лишь одной из самых базовых теорем комплексного анализа — теоремы Коши.
Хотя Риман объявил свою гипотезу ненужной для достижения ближайших целей, оказалось, что она жизненно необходима для разрешения многих других вопросов теории чисел. Прежде чем обсуждать гипотезу Римана, нам стоит взглянуть на некоторые теоремы, которые — если бы гипотеза была доказана — из нее следуют.
Одно из важнейших следствий — это величина погрешности в теореме о распределении простых чисел. Теорема, как вы помните, утверждает, что для большого x отношение (x) к Li(x) приближается к 1, причем чем дальше, тем сильнее. Иными словами, разница между двумя функциями снижается до нуля относительно величины x{32}. Однако реальная разница при этом может расти (и растет). Просто она делает это медленнее, чем растет сам x. Компьютерные расчеты позволяют предположить, что величина погрешности примерно пропорциональна xlogx. Если гипотеза Римана верна, это утверждение можно доказать. В 1901 г. Хельге фон Кох доказал, что гипотеза Римана логически эквивалентна оценке
для всех x 2657. Здесь вертикальными линиями обозначена абсолютная величина: разность, умноженная на ±1, чтобы сделать ее положительной. Эта формула дает наилучшие возможные ограничения для разницы между (x) и Li(x).
Из гипотезы Римана можно получить немало других оценок для функций теории чисел. К примеру, из нее прямо следует, что сумма делителей n меньше
en log log n
для всех n 5040, где — постоянная Эйлера ( = 0,57721){33}. Эти утверждения могут показаться случайными и странными фактами, но хорошая оценка для важной функции жизненно важна во многих приложениях, и большинство специалистов по теории чисел отдали бы свою правую руку ради того, чтобы доказать любую из них.
Кроме того, гипотеза Римана говорит нам, насколько велико может быть расстояние между последовательными простыми числами. Типичный размер промежутка между ними можно вывести на основании теоремы о распределении простых чисел: в среднем промежуток между простым числом p и следующим простым числом сравним с log p. Некоторые промежутки могут быть меньше, некоторые больше, но математикам жилось бы легче, если бы можно было сказать наверняка, насколько велики могут быть самые большие из них. Харальд Крамер доказал в 1936 г., что если гипотеза Римана верна, то промежуток при простом числе p не может превышать величины plog p, домноженной на некую константу.
Но подлинное значение гипотезы Римана куда глубже. Существуют далеко идущие обобщения и сильное подозрение, что тот, кто сумеет доказать гипотезу Римана, сможет, вероятно, доказать и связанную с ней обобщенную гипотезу Римана. А это, в свою очередь, даст математикам власть над обширными областями теории чисел.
Обобщенная гипотеза Римана вырастает из более подробного описания простых чисел. Все простые числа, кроме двойки, нечетные, и в главе 2 мы видели, что все нечетные простые можно разделить на два типа: те, что на 1 больше числа, кратного 4, и те, что на 3 больше числа, кратного 4. Говорят, что это числа вида 4k + 1 или 4k + 3, где k — число, на которое вы умножаете 4, чтобы получить данное простое число. Приведем короткий список первых нескольких простых чисел того и другого типа, вместе с соответствующими числами, кратными 4:
Прочерки указывают на то, что соответствующее число не простое.
Сколько существует простых чисел того и другого типа? Как они распределены среди всех простых чисел или среди всех целых чисел? Евклидово доказательство того факта, что простых чисел существует бесконечно много, можно без больших усилий модифицировать, доказав при этом, что существует бесконечно много простых чисел вида 4k + 3. Доказать, что простых чисел вида 4k + 1 тоже бесконечно много, гораздо сложнее, — это можно сделать, но лишь при помощи некоторых достаточно сложных теорем. Разница в подходах обусловлена тем, что любое число вида 4k + 3 имеет делитель того же вида, а в отношении чисел вида 4k + 1 это не всегда верно.
В числах этих двух видов нет ничего чудесного или священного. Все простые числа, кроме 2 и 3, имеют вид 6k + 1 или 6k + 5, и мы можем задать в отношении них аналогичные вопросы. Если уж на то пошло, все простые числа, кроме 5, имеют вид 5k + 1, 5k + 2, 5k + 3, 5k + 4. Мы оставляем в стороне числа вида 5k, поскольку они кратны 5 и, соответственно, все, кроме 5, не являются простыми.
Кстати говоря, на любой из подобных вопросов нетрудно выдвинуть разумное предположение — простые числа в арифметической последовательности. Случай с 5k достаточно типичен. Эксперимент быстро показывает, что числа приведенных выше четырех видов имеют примерно равные шансы оказаться простыми. Вот похожая таблица:
Так что должно существовать бесконечное количество простых чисел каждого вида, и в среднем к каждому виду должна относиться четверть всех простых чисел до заданного предела.
Для некоторых видов доказать, что простых чисел такого вида существует бесконечно много, совсем несложно. Для других видов требуются более изощренные рассуждения. Но до середины XIX в. никому не удавалось доказать, что существует бескнечно много простых чисел каждого возможного вида, не говоря уже о том, чтобы доказать их более или менее равномерное распределение. Лагранж в 1785 г. в работе, посвященной закону квадратичной взаимности — глубокому свойству квадратов простых модулей, — принимал этот факт без доказательства. Результаты дали очевидно полезные следствия, и пора было кому-нибудь это доказать. В 1837 г. Дирихле выяснил, как применить идеи Эйлера, связанные с теоремой о распределении простых чисел, для доказательства обоих этих утверждений. Первым делом следовало определить аналоги дзета-функции для этих типов простых чисел. То, что получилось, называется L-функциями Дирихле. К примеру, в случае 4k + 1/4k + 3 возникает следующая функция:
L (s, ) = 1 3s + 5s 7s + 9s …,
где коэффициенты равны +1 для чисел вида 4k + 1, 1 для чисел вида 4k + 3 и 0 для остальных. Греческую букву называют характером Дирихле, и это напоминает нам о том, какие именно знаки следует использовать.
Для римановой дзета-функции важен не только ряд, но и его аналитическое продолжение, придающее функции значения во всех комплексных точках. То же относится и к L-функции, и Дирихле определил подходящее аналитическое продолжение. Приспособив к случаю идеи, которые использовались для доказательства теоремы о распределении простых чисел, он сумел доказать аналогичную теорему о простых числах особых видов. К примеру, число простых чисел вида 5k + 1, меньших или равных x, асимптотически приближается к Li(x)/4; то же относится и к остальным трем случаям 5k + 2, 5k + 3, 5k + 4. Это означает, что простых чисел каждого вида бесконечно много.
Риманова дзета-функция — это особый случай L-функции Дирихле для простых чисел вида 1k + 0, т. е. для всех простых чисел. Обобщенная гипотеза Римана представляет собой очевидное обобщение оригинальной гипотезы: нули любой L-функции Дирихле либо имеют действительную часть, равную 1/2, либо являются тривиальными нулями, действительная часть которых отрицательна или больше единицы.
Если обобщенная гипотеза Римана верна, то верна и обычная его гипотеза. Многие следствия обобщенной гипотезы Римана аналогичны следствиям обычной. К примеру, схожие границы ошибки можно доказать для аналогичных версий теоремы о распределении простых чисел в применении к простым числам любого конкретного вида. Однако обобщенная гипотеза Римана подразумевает много такого, что совершенно отличается от всего, что мы можем вывести из обычной гипотезы Римана. Так, в 1917 г. Годфри Харди и Джон Литтлвуд доказали, что из обобщенной гипотезы Римана следует гипотеза Чебышева, в том смысле, что (буквально) простые числа вида 4k + 3 встречаются чаще, чем числа вида 4k + 1. Согласно теореме Дирихле, оба вида равновероятны в конечном итоге, но это не мешает простым числам вида 4k + 3 выигрывать у чисел 4k + 1, конечно, в правильной игре.
У обобщенной гипотезы Римана есть также важные следствия, имеющие отношение к проверке на простоту, такие как тест Миллера 1976 г., упомянутый в главе 2. Если обобщенная гипотеза Римана верна, то тест Миллера дает нам эффективный алгоритм проверки. Оценка эффективности более поздних тестов тоже зависит от обобщенной гипотезы Римана. Существуют и важные приложения для алгебраической теории чисел. Помните, в главе 7 говорилось, что новое определение идеальных чисел Куммера, данное Дедекиндом, привело к рождению новой фундаментальной концепции — понятия идеала. Разложение на простые множители в кольцах алгебраических целых чисел существует, но может не быть единственным. Разложение идеалов на простые множители работает много лучше: и существование, и единственность гарантированы. Так что имеет смысл заново рассмотреть все вопросы о множителях в терминах идеалов. В частности, существует понятие «простого идеала» — разумной и удобной аналогии простого числа.
Зная это, естественно спросить, есть ли у эйлеровой связи между обычными простыми числами и дзета-функцией аналог для простых идеалов. Если да, то весь мощный аппарат аналитической теории чисел применим к алгебраическим числам. Оказывается, это можно сделать, с глубокими и очень серьезными последствиями. Результат — дзета-функция Дедекинда — по одной такой функции на каждую систему алгебраических чисел. Существует глубокая связь между комплексными аналитическими свойствами дедекиндовой дзета-функции и арифметикой простых чисел в соответствующей системе алгебраических целых чисел. И, разумеется, существует аналог гипотезы Римана: все нетривиальные нули дедекиндовой дзета-функции лежат на критической линии. Понятие «обобщенная гипотеза Римана» теперь включает в себя и это утверждение.
Даже генерализация — еще не конец истории дзета-функции. Она вдохновила ученых на определение аналогичных функций в нескольких других областях математики — от абстрактной алгебры до теории динамических систем. Во всех этих областях существуют еще более масштабные аналоги гипотезы Римана. Некоторые из них даже доказаны. В 1974 г. Пьер Делинь доказал такой аналог для многообразий над конечными полями. Обобщения, известные как дзета-функции Сельберга, тоже удовлетворяют аналогу гипотезы Римана. То же можно сказать о дзета-функции Госса. Однако существуют другие обобщения — дзета-функции Эпштейна, для которых аналог гипотезы Римана неверен. Здесь бесконечное множество нетривиальных нулей лежит на критической линии, но некоторые — нет, что продемонстрировал Эдвард Титчмарш. С другой стороны, эти дзета-функции не имеют эйлеровой формулы в виде произведения и потому не похожи на римановы дзета-функции в аспекте, который вполне может оказаться принципиально важным.
Имеется множество косвенных свидетельств того, что гипотеза Римана — как оригинальная, так и обобщенная — справедлива. Много хорошего следовало бы из истинности этих гипотез. Ни одно из этих следствий за все время не удалось опровергнуть, а ведь сделать это — то же самое, что опровергнуть гипотезу Римана. Но ни доказательства, ни опровержения пока нет. Широко распространено мнение, что доказательство оригинальной гипотезы Римана открыло бы дорогу и к доказательству обобщенного ее варианта. Но на самом деле, возможно, лучше было бы атаковать сразу обобщенную гипотезу Римана во всей ее грозной красе — воспользоваться всем арсеналом доступных на сегодняшний день методов, доказать, а затем вывести оригинальную гипотезу Римана как ее частный случай.
В пользу гипотезы Римана имеется также огромное количество экспериментальных данных — по крайней мере огромное на первый взгляд, пока кто-нибудь не плеснет холодной воды, чтобы остудить горячие головы. По данным Карла Людвига Зигеля, Риман вычислил несколько первых нулей своей дзета-функции, но не стал публиковать результат. Они находятся в точках
Нетривиальные нули всегда располагаются парами, как здесь. Я написал в них, а не 0,5, потому что действительная часть в этих случаях известна точно, выяснена при помощи общих результатов комплексного анализа и известных свойств дзета-функции. То же можно сказать и о компьютерных расчетах, о которых речь пойдет ниже. Они не просто показывают, что нули находятся очень близко к критической линии; они действительно находятся на ней.
В 1903 г. Йорген Грам продемонстрировал численно, что первые десять нулей (т. е. ±-пар) лежат на критической линии. К 1935 г. Титчмарш увеличил число таких нулей до 195. В 1936 г. Титчмарш и Лесли Комри доказали, что первая 1041 пара нулей лежит на критической линии. Это был последний раз, когда подобные расчеты проводились вручную.
Алан Тьюринг больше всего известен тем, что во время войны работал в Блетчли-парке, где участвовал в разгадывании германского кода «Энигма», а также своими работами, заложившими фундамент компьютерных вычислений и искусственного интеллекта. Но, помимо всего этого, Тьюринг интересовался и аналитической теорий чисел. В 1953 г. он открыл более эффективный способ вычисления нулей дзета-функции и определил при помощи компьютера, что первые 1104 пары нулей лежат на критической линии. Свидетельства того, что все нули до некоторого предела лежат на критической линии, множились и множились. Нынешний рекорд, полученный Янником Саутером и Патриком Демишелем в 2004 г., составляет 10 трлн (10). Тем временем математики и компьютерщики проверяли другие диапазоны нулей. На сегодня все без исключения нетривиальные нули, когда-либо кем-либо рассчитанные, лежат на критической линии.
Все это может показаться исчерпывающим доказательством, но математики не спешат принимать его на веру, и не без причины. Может показаться, что 10 трлн — это очень много, но в теории чисел часто значение имеет не само число, а его логарифм, а он пропорционален числу знаков в числе. Натуральный логарифм от 10 трлн чуть меньше 30. Мало того, во многих задачах фигурирует логарифм от логарифма или даже логарифм от логарифма от логарифма. В этих терминах 10 трлн — это крохотная величина, так что численное доказательство до 10 трлн включительно почти ничего не значит.
Существуют и кое-какие обобщенные аналитические доказательства, к которым эта критика не относится. Харди и Литтлвуд доказали, что на критической линии лежит бесконечное число нулей. Другие математики показали в точном смысле, что почти все нули лежат очень близко к критической линии. Сельберг доказал, что ненулевая доля нулей лежит непосредственно на критической линии. Норманн Левинсон доказал, что эта доля — по крайней мере треть и теперь она увеличена по крайней мере до 40 %. Все эти результаты позволяют предположить, что если гипотеза Римана неверна, то нули, не лежащие на критической линии, очень велики и встречаются очень редко. К несчастью, главное следствие из всего этого заключается в том, что если такие исключения существуют, то найти их будет необычайно трудно.
Но зачем волноваться? Ведь численных свидетельств должно быть достаточно, чтобы убедить любого разумного человека? К несчастью, нет. Численные свидетельства не убеждают математиков, и в данном случае это не просто педантизм и придирки: они действуют разумно. В математике в целом, а особенно в теории чисел, обширные, на первый взгляд, «экспериментальные» данные часто имеют гораздо меньший вес, чем может показаться.
Наглядным примером служит гипотеза Пойа, которую в 1919 г. выдвинул венгерский математик Дьердь Пойа. Он предположил, что по крайней мере половина всех целых чисел вплоть до заданной величины имеет нечетное число простых множителей. Повторяющиеся множители в данном случае учитываются отдельно, а начинаем мы с 2. К примеру, число простых множителей для предела 20 приведено в табл. 2, где последняя колонка отражает процент чисел до данного предела с нечетным числом простых множителей.
Все значения в последней колонке выше 50 %, а более обширные расчеты позволяют предположить, что это всегда так. В 1919 г., без всяких компьютеров, исследователи не смогли найти чисел, которые опровергли бы эту гипотезу. Но в 1958 г. Брайан Хазелгроув доказал при помощи аналитической теории чисел, что гипотеза Пойа неверна для некоего числа — числа, не превосходящего 1,845 10361, если быть точным. Как только на сцене появились компьютеры, Шерман Леман показал, что гипотеза неверна для 906 180 359. К 1980 г. Минору Танака доказал, что минимальное из таких чисел 906 150 257. Так что вы могли бы собрать экспериментальные данные по всем числам почти до миллиарда и не понять, что гипотеза неверна.
Тем не менее приятно знать, что число 906 150 257 необычайно интересно.