Величайшие математические задачи Стюарт Иэн
Разумеется, сегодняшние компьютеры, если их как следует запрограммировать, опровергли бы гипотезу Пойа в несколько секунд. Но иногда не помогают даже они. Классический пример — число Скьюза, где первоначально громадное количество численных данных указывало на то, что некая знаменитая гипотеза верна, но на самом деле она неверна. Это гигантское число появилось в задаче, тесно связанной с гипотезой Римана: аппроксимацией (x) функции Li(x). Как мы только что видели, теорема о распределении простых чисел утверждает, что, когда x становится большим, отношение этих двух величин стремится к 1. Численные расчеты указывают на более сильное утверждение: это отношение всегда меньше 1, т. е. (x) меньше Li(x). В 2008 г. численные расчеты Тадея Котника показали, что это верно для x меньше 1014. К 2012 г. Дуглас Столл и Демишель повысили этот предел до 1018, и такой же результат независимо от них получил Андрей Кульша. А расчеты Томаша Оливейра-и-Сильва позволяют предположить, что предел может быть увеличен до 1020.
Таблица 2. Процент чисел до заданного предела, имеющих нечетное число простых множителей
Звучит, кажется, исчерпывающе. Данные здесь сильнее, чем лучшие численные результаты, полученные до сих пор для гипотезы Римана. Но в 1914 г. Литтлвуд доказал, что эта гипотеза неверна — и как доказал! По мере того как x проходит через положительные действительные значения, разность (x) — Li(x) меняет знак (с отрицательного на положительный или наоборот) бесконечно часто. В частности, (x) больше Li(x) для некоторых достаточно больших значений x. Однако доказательство Литтлвуда ничего не говорило о конкретных значениях x.
В 1933 г. его ученик, южноафриканский математик Стенли Скьюз, оценил, насколько большим должен быть x: не более 10101034, где знак обозначает «возвести в степень». Это настолько гигантское число, что если все его цифры напечатать в книге — довольно скучной книге, состоящей из 1 с бесконечными нулями, — то Вселенная не вместила бы этой книги, даже если бы каждая цифра была размером с элементарную частицу. Более того, чтобы доказательство работало, Скьюзу пришлось принять на веру истинность гипотезы Римана. К 1955 г. он нашел способ обойтись без гипотезы Римана, но не бесплатно: его оценка увеличилась до 101010963.
Эти числа слишком велики даже для прилагательного «астрономический», но дальнейшие исследования помогли снизить их до величин, которые уже можно охарактеризовать как космологические. В 1966 г. Леман заменил числа Скьюза на 101165. Те Риеле в 1987 г. понизил эту оценку до 7 10370, а в 2000 г. Картер Бейз и Ричард Хадсон свели ее к 1,39822 10316. Затем Чжоу Куок Фай и Роджер Плаймен срезали еще немножко и довели ограничение до 1,39801 10316. Это изменение может показаться несущественным, но на самом деле данная оценка меньше предыдущей на 2 10312. А Саутер и Демишель еще улучшили этот результат, сведя его к 1,3971667 10316.
Но пока суд да дело, в 1941 г. Аурел Уинтнер доказал, что маленькая, но ненулевая доля целых чисел удовлетворяет неравенству (x) > Li(x). В 2011 г. Столл и Демишель просчитали первые 200 млрд нулей дзета-функции, что позволяет судить о (x) для всех x вплоть до 1010 000 000 000 000, и нашли доказательство того, что если x меньше, чем 3,17 10114, то (x) меньше Li(x). Так что для данной конкретной проблемы все свидетельства по крайней мере до 1018, а очень может быть, что и до 10114 или даже больше, только вводят в заблуждение. Переменчивые боги теории чисел любят пошутить за счет людей.
Было предпринято немало попыток доказать или опровергнуть гипотезу Римана. На сайте Мэттью Уоткинса «Предлагавшиеся доказательства гипотезы Римана» перечислены около 50 таких попыток, сделанных уже после 2000 г. Во многих доказательствах найдены ошибки, и ни одно из них профессиональное сообщество не признало верным.
Одной из самых разрекламированных в последние годы стала попытка Луи де Бранжа, предпринятая в 2002 г. Он распространил среди математиков рукопись, в которой попытался доказать гипотезу Римана при помощи области анализа, имеющей дело спреобразованиями на пространствах бесконечной размерности и известной как функциональный анализ. У специалистов были основания принять попытку де Бранжа всерьез. Незадолго до того он так же распространил доказательство гипотезы Бибербаха о разложении в ряд комплексных функций. В первоначальном доказательстве обнаружились ошибки, но со временем было установлено, что основная его идея работает. Однако в данном случае казалось, что предложенный де Бранжем метод доказательства гипотезы Римана не имеет шансов на успех. Брайан Конри и Ли Сяньцзинь указали на некоторые непреодолимые, как пока представляется, препятствия.
Возможно, самая серьезная надежда на доказательство гипотезы Римана заключается в новых методах или радикально новых подходах к задаче. Как мы неоднократно видели, прорывы в работе по великим математическим задачам происходят, как правило, тогда, когда кому-нибудь удается связать давно известную задачу с совершенно другой, далекой от нее областью математики. Прекрасный пример — Великая теорема Ферма: как только ее удалось интерпретировать как вопрос об эллиптических кривых, прогресс не заставил себя ждать.
Сегодня тактика де Бранжа вызывает вопросы, но сам его подход стратегически вполне оправдан. Своими корнями он уходит в устное предположение, сделанное около 1912 г. Давидом Гильбертом и независимо от него Дьердем Пойа. Эдмунд Ландау тогда спросил у Пойа, по каким таким физическим причинам должна быть верна гипотеза Римана. В 1982 г. Пойа вспоминал, что нашел-таки тогда ответ: нули дзета-функции следует связать с собственными значениями так называемого самосопряженного оператора. Речь идет о характеристических числах, связанных с особым типом преобразования. В квантовой физике — одной из важнейших областей применения — эти числа определяют энергетические уровни системы, и существует стандартная несложная теорема о том, что собственные числа этого особого типа преобразования всегда действительны. Если бы собственные числа некоего самосопряженного оператора совпадали с нулями кси-функции, то гипотеза Римана была бы несложным следствием этого факта. Пойа не стал публиковать эту идею — он не мог привести пример такого оператора, а пока примера нет — все это журавль в небе. Но в 1950 г. Сельберг доказал свою «формулу следа», которая связывает геометрию поверхности с собственными числами соответствующего оператора. Это сделало идею чуть более правдоподобной.
В 1972 г. Хью Монтгомери побывал в Институте перспективных исследований в Принстоне. В разговоре с физиком Фрименом Дайсоном он упомянул замеченные им некоторое время назад удивительные статистические свойства нетривиальных нулей дзета-функции. Дайсон сразу же отметил их сходство со статистическими свойствами случайных эрмитовых матриц — еще одного частного случая оператора, который используется для описания квантовых систем, таких как атомное ядро. В 1999 г. Ален Конн предложил формулу следа, аналогичную формуле Сельберга. Подтвердить ее — означало бы доказать обобщенную гипотезу Римана. В том же 1999 г. физики Майкл Берри и Йон Китинг предположили, что требуемый оператор может быть получен при квантовании одного хорошо известного понятия из классической физики, имеющего отношение к импульсу. Получившуюся в результате гипотезу Берри можно рассматривать как частную версию гипотезы Гильберта — Пойа.
Эти идеи, помогающие соотнести гипотезу Римана с глубинными областями математической физики, очень интересны. Они показывают, что решение может прийти из, казалось бы, никак не связанных с ней областей математики, и внушают надежду на то, что когда-нибудь вопрос с гипотезой Римана будет закрыт. Однако до сих пор они не привели к окончательному прорыву, и у нас нет оснований считать, что решение уже близко. Гипотеза Римана остается одной из самых запутанных и волнующих загадок во всей математике.
Сегодня у исследователей появился новый стимул к борьбе за доказательство гипотезы Римана: крупный приз.
В математике не существует Нобелевской премии. Самой престижной наградой в этой области является Филдсовская премия за выдающиеся открытия, вместе с которой вручается медаль. Эта премия названа в честь канадского математика Джона Филдса, который и завещал на нее средства. Раз в четыре года на Международном конгрессе математиков двум, трем или четырем молодым ученым не старше 40 лет вручают золотую медаль и денежную премию (в настоящее время это $15 000).
Многие представители математической науки считают правильным, что в их области не присуждается Нобелевская премия. В настоящее время она составляет чуть больше миллиона долларов, а такая сумма легко может исказить цели исследователей и породить споры о приоритетах. Однако отсутствие крупной математической премии также может исказить представления общества о значимости и полезности этой науки. Можно подумать, что открытия, за которые никто не хочет платить, не так уж важны. Возможно, поэтому не так давно появились две очень престижные новые математические премии. Одна из них — Абелевская — присуждается ежегодно Норвежской академией науки и словесности и названа в честь великого норвежского математика Нильса Хенрика Абеля. Вторая награда — это премии за решение семи «проблем тысячелетия», объявленные Математическим институтом Клэя. Этот институт основали в 1998 г. в Кембридже (штат Массачусетс) американский бизнесмен Лэндон Клэй и его жена Лавиния. Лэндон Клэй активно занимается паевыми инвестиционными фондами и при этом любит и уважает математику. Его организация проводит встречи, выделяет гранты на исследования, организует публичные лекции и присуждает ежегодную премию за математические исследования.
В 2000 г. сэр Майкл Атья и Джон Тейт, ведущие математики Великобритании и США, объявили, что Математический институт Клэя учредил новую премию, которая должна будет стимулировать работу над семью важнейшими нерешенными задачами математики. Эти задачи будут известны как «проблемы тысячелетия», а надлежащим образом опубликованное и отреферированное решение любой из них будет вознаграждено денежной суммой в $1 млн. Все вместе эти задачи призваны привлечь внимание к некоторым центральным для математики вопросам, до сих пор не имеющим ответов. Вопросы эти были тщательно отобраны лучшими математиками мира. Немалый приз должен ясно показать обществу: математика имеет огромную ценность. Всякий, кто имеет отношение к науке, прекрасно знает, что интеллектуальная ценность вполне может быть выше любых денег, но все же деньги помогают сосредоточиться. Самой известной и давней из задач тысячелетия является гипотеза Римана. Это единственный вопрос, который вошел одновременно и в список Гильберта (1900), и в список задач тысячелетия. Остальные шесть проблем тысячелетия обсуждаются далее в главах 10–15. Тем не менее математики не особенно гонятся за призами, и работа над гипотезой Римана продолжалась бы и без обещанной премии. Все, что для этого нужно, — новая перспективная идея.
Стоит также помнить о том, что гипотезы, даже освященные временем, иногда оказываются ошибочными. Сегодня большинство математиков, судя по всему, считает, что когда-нибудь гипотеза Римана будет доказана. Некоторые, однако, думают, что она, возможно, все-таки неверна, и где-то в дебрях очень больших чисел может скрываться нуль дзета-функции, который не лежит на критической линии. Если такой «контрпример» существует, то он, скорее всего, окажется очень-очень большим.
Однако на переднем крае математики просто мнение стоит немного. Интуиция зачастую очень помогает ученым, но известно немало случаев, когда это замечательное чувство ошибалось. Житейский здравый смысл может лгать, оставаясь при этом и общепризнанным, и здравым. Литтлвуд, один из лучших знатоков комплексного анализа, выразился вполне однозначно: в 1962 г. он сказал, что уверен в ошибочности гипотезы Римана, и добавил, что нет никаких мыслимых причин, по которым она была бы верна. Кто прав? Поживем, увидим.
10. Какой формы сфера? Гипотеза Пуанкаре
Анри Пуанкаре был одним из величайших математиков конца XIX в., слегка эксцентричным, но исключительно прозорливым ученым. Он был членом французского Бюро долгот — организации, созданной для решения астрономических задач для целей навигации, слежения за временем и измерения Земли и других планет. Членство в ней привело Пуанкаре к мысли об установлении международной системы временны`х зон. Кроме того, оно вдохновило ученого на размышления о времени и, в частности, на предвосхищение некоторых открытий Эйнштейна в области теории относительности. Вклад Пуанкаре виден в математике всюду, от теории чисел до математической физики. В частности, он был одним из основателей топологии, математики непрерывных преобразований.
В 1904 г. Пуанкаре наткнулся на простой, казалось бы, вопрос и вдруг понял, что ответ на него, который он прежде использовал в работе как нечто очевидное, доказать не в состоянии. «Этот вопрос увел бы нас далеко в сторону», — написал он, погрешив против истины: на самом деле, этот вопрос упрямо отказывался вести его куда бы то ни было. Хотя сам Пуанкаре сформулировал задачу в виде вопроса, известность она приобрела как гипотеза Пуанкаре — все были уверены в том, что ответом на вопрос должно быть «да». Это еще одна из семи «проблем тысячелетия» по версии Института Клэя, что вполне справедливо, поскольку несложная на вид задача оказалась одной из самых сложных во всей топологии. Ответ на вопрос Пуанкаре дал в 2002 г. молодой русский математик Григорий Перельман. Его решение привнесло в науку массу новых идей и методов — так много, что математическому сообществу потребовалось несколько лет, чтобы «переварить» представленное доказательство и признать его верным.
За свое достижение Перельман был удостоен самой престижной в математике Филдсовской премии, но отказался от нее. Он избегает всякой публичности. Ему предложили миллион долларов — премию Института Клэя, — но и ее Перельман не принял. Деньги ему тоже не нужны. Он хотел лишь, чтобы его труд был принят математическим сообществом. Со временем так и произошло, но, к несчастью, процесс занял немало времени. Да и вообще, наивно было ожидать признания без публичности и премий. Но склонная к затворничеству натура Перельмана не смогла принять эти неизбежные следствия успеха.
Мы уже встречались с топологией в связи с теоремой о четырех красках, и я прибегал тогда к расхожему сравнению: «геометрия на резиновом листе». Евклидова геометрия имеет дело с прямыми линиями, окружностями, длинами и углами. Она разворачивается на плоскости или в пространстве трех измерений, где становится более сложной. Плоскость похожа на бесконечный лист бумаги, и у нее с бумагой есть одна общая черта: она не растягивается, не сжимается и не сгибается. Бумагу можно скатать в трубочку, и она может слегка съежиться или растянуться — особенно если пролить на нее кофе. Но невозможно обернуть бумагой шар так, чтобы на листе не образовалось складок. Математически евклидова плоскость — штука жесткая. В геометрии Евклида две фигуры — два треугольника, квадрата или круга — равны, если один из них получен из другого посредством жесткого перемещения. А «жесткость» перемещения означает, что расстояния при этом не меняются.
Но что если использовать вместо бумаги эластичный резиновый лист? Он, в отличие от бумаги, растягивается и сгибается, при некотором желании его можно даже сжать. Длины и углы на эластичном листе не имеют фиксированных значений. Более того, если лист достаточно эластичен, треугольников, квадратов и кругов на нем тоже нет. Можно деформировать треугольник на резиновом листе так, что у него появится дополнительный угол. Можно даже превратить его в круг (см. рис. 36). Какими бы понятиями ни оперировала геометрия на резиновом листе, ясно, что традиционным евклидовым концепциям в ней места нет.
Может показаться, что «геометрия на резиновом листе» будет настолько гибкой, что в ней вообще не найдется места для сколько-нибудь постоянных смыслов, а значит, и доказать ничего невозможно. Но это не так. Нарисуйте, к примеру, треугольник и поставьте внутри него точку. Если вы начнете растягивать и деформировать лист, превращая треугольник в круг, то одно свойство вашего чертежа все же сохранится: точка останется внутри. Согласен, теперь она находится внутри круга, а не треугольника, но это не важно: она же все равно не снаружи. Чтобы переместить точку наружу, вам придется разорвать лист, а это будет означать нарушение правил игры.
И еще одно свойство не изменяется при искажении. Треугольник — это простая замкнутая кривая. Это линия, замкнутая сама на себя, без свободных концов и самопересечений. Восьмерка — тоже замкнутая кривая, но уже не простая — у нее есть самопересечение. При деформировании резинового листа треугольник может изменить форму, но обязательно останется простой замкнутой кривой. Невозможно, к примеру, превратить его в восьмерку, не разорвав листа.
В трехмерной топологии все пространство становится эластичным. Не так, как куб из резины, который, если снять давление, возвращается к первоначальной форме, а как гель, форму которого можно менять без всякого сопротивления. Топологическое пространство бесконечно эластично: можно взять участок размером с рисовое зернышко и раздуть его до размеров Солнца. Можно тянуть из него щупальца, пока он не начнет напоминать формой осьминога. Единственное, чего делать не разрешается, — это каким бы то ни было образом нарушать непрерывность. Не следует допускать разрывов пространства и вообще проделывать любые операции, способные разделить соседние точки.
Какие свойства пространственных фигур сохраняются при всех непрерывных деформациях? Не длина, не площадь, не объем… А вот заузленность сохраняется. Если завязать кривую узлом и соединить концы, создав замкнутую петлю, то узел уже никуда не денется. Как бы вы ни деформировали пространство, кривая останется завязанной. Таким образом, мы имеем дело с геометрией нового типа, где важные и осмысленные концепции кажутся, на первый взгляд, несколько расплывчатыми: «внутри», «замкнутый», «простой», «завязанный». Называется эта новая геометрия весьма респектабельно: топологией. Нематематику она может показаться странной или даже абсурдной, но на поверку это одна из основных областей математики ХХ в., и свое значение она сохраняет и в XXI в. А Пуанкаре — один из тех, кого мы в первую очередь должны за это благодарить.
История топологии началась почти за столетие до Пуанкаре — в 1813 г. Симон Люилье, швейцарский математик, при жизни не снискал громкой славы, но отверг крупную сумму денег, которую кто-то из его родственников предлагал ему за принятие церковного сана. Люилье предпочел карьеру в математике. Работал он в основном в тихой математической заводи: занимался теоремой Эйлера о многогранниках. В главе 4 мы упоминали один занятный и вроде бы ни с чем не связанный факт: если у многогранника F граней, V вершин и E ребер, то F — E + V = 2. Люилье большую часть жизни исследовал варианты этой формулы, и с высоты сегодняшнего дня ясно, что он сделал важнейший шаг в направлении топологии, когда обнаружил, что формула Эйлера не всегда верна. Ее применимость зависит от качественных характеристик многогранника.
Формула верна для многогранников без отверстий, которые можно нарисовать на поверхности сферы или на поверхности, полученной из сферы непрерывным преобразованием. Но если в многограннике есть отверстия, формула перестает работать. К примеру, рамка для картины, изготовленная из прямоугольного в сечении деревянного бруска имеет 16 граней, 32 ребра и 16 вершин; здесь F — E + V = 0. Люилье доработал формулу Эйлера для подобных экзотических многогранников: если в многограннике g отверстий, то F — E + V = 2 2g. Так был открыт первый важный топологический инвариант: величина, которая связана с пространством и не меняется при любых непрерывных преобразованиях пространства. Инвариант Люилье позволяет точно подсчитать, сколько отверстий имеет та или иная поверхность, не определяя строго, что такое «отверстие». Это полезно, поскольку «отверстие» — понятие достаточно сложное. Отверстие — не часть поверхности и не область вне поверхности. Очевидно, то свойство того, как поверхность располагается в окружающем пространстве. Но открытие Люилье показывает, что то, что мы интерпретируем как количество отверстий, есть свойство, изначально присущее поверхности и не зависящее от окружающего пространства. Нет необходимости определять отверстия, а затем считать их; лучше вообще не делать этого.
После Люилье следующей ключевой фигурой в предыстории топологии стал Гаусс. Работая в различных областях математики, он столкнулся с несколькими другими топологическими инвариантами. Работа в комплексном анализе, особенно над доказательством того, что каждое полиномиальное уравнение имеет по крайней мере одно решение в комплексных числах, заставила его рассмотреть порядок кривой на плоскости: сколько оборотов она делает относительно заданной точки. Задачи из области электричества и магнетизма подсказали коэффициент зацепления двух замкнутых кривых: сколько раз одна из них проходит сквозь другую. Эти и другие примеры привели Гаусса к мысли о существовании некоего пока не открытого раздела математики, в котором предлагался бы последовательный взгляд на качественные свойства геометрических фигур. Он ничего не публиковал по этой теме, но упоминал ее в письмах и рукописях.
Кроме того, он сообщил эти соображения своему ученику Иоганну Листингу и своему сотруднику Августу Мёбиусу. Я уже упоминал ленту Мёбиуса — поверхность, у которой есть лишь одна сторона и один край. Статью о ней он опубликовал в 1865 г., а саму ее можно увидеть на рис. 9 в главе 4. Мёбиус указал, что определение «имеющая одну сторону» интуитивно понятно, но тем не менее не точно, и предложил вместо него близкое свойство, которое можно определить совершенно строго. Это свойство — ориентируемость. Поверхность ориентируема, если ее можно покрыть сетью треугольников со стрелками вдоль сторон таким образом, что всюду, где два треугольника имеют общую сторону, стрелки указывают в противоположных направлениях. Если вы разместите такую сеть на плоскости и направите все стрелки в треугольниках, к примеру, по часовой стрелке, то именно так и произойдет. А вот на ленте Мёбиуса такая сеть невозможна.
Первая публикация Листинга по топологии появилась раньше, в 1847 г. Называлась она «Лекции по топологии», и это был первый текст, в котором использовалось это слово. Неформально Листинг пользовался им уже около 10 лет. Кроме того, тогда для той же цели использовалась латинская фраза analysis situs, т. е. «анализ размещения», но со временем она вышла из употребления. Книга Листинга не содержит ничего особенно значительного, но дает одно фундаментальное понятие: покрытие поверхности сетью треугольников. В 1861 г., за четыре года до Мёбиуса, Листинг описал ленту Мёбиуса и исследовал связность — вопрос о том, можно ли разбить пространство на две или более несвязанных областей. На основе работы Листинга другие математики, в том числе Вальтер фон Дик, провели полную топологическую классификацию поверхностей, считая их замкнутыми (не имеющими краев) и компактными (конечной протяженности). Оказалось, что любая ориентируемая поверхность топологически эквивалентна сфере с конечным числом g ручек (см. рис. 11 в середине и справа, глава 4). Число g называют родом поверхности, и именно его определяет инвариант Люилье. Если g = 0, это сфера, а если g > 0, мы имеем тор с g отверстиями. Аналогичный ряд поверхностей, начиная с простейшей неориентируемой поверхности — проективной плоскости, — образуют и неориентируемые поверхности. Этот метод был расширен и на поверхности с краями. Каждый край — это замкнутая петля, и единственное, что нужно знать дополнительно, это количество таких петель.
Гипотезу Пуанкаре легче понять, если рассмотреть для начала один из базовых методов, используемых при классификации поверхностей. Ранее я сравнил топологию с деформированием объекта, изготовленного из резины или геля, и подчеркнул, что преобразование обязательно должно быть непрерывным. По иронии судьбы, один из центральных методов топологии включает операцию, которая, на первый взгляд, нарушает непрерывность: разрезание объекта на кусочки. Однако непрерывность восстанавливается при помощи серии правил, описывающих, какие куски соединены друг с другом и как именно. Примером может служить то, как мы определили тор, отождествив противоположные стороны квадрата (см. рис. 12, глава 4).
Отождествление четко различимых точек позволяет нам представлять сложные топологические пространства при помощи простых составляющих. Квадрат — это всего лишь квадрат, и ничего больше, но с правилами отождествления квадрат может быть тором, бутылкой Клейна, цилиндром, лентой Мёбиуса или проективной плоскостью, в зависимости от характера правил (см. рис. 37). Так что когда я, объясняя непрерывное преобразование, сравнил его с растягиванием и сгибанием резинового листа, я, строго говоря, требовал больше необходимого. Нам разрешено также разрезать лист на промежуточной стадии при условии, что, в конце концов, мы либо соединим куски в точности так же, как было вначале, либо обозначим правила, которые позволят это сделать. С точки зрения тополога, сформулировать правило склеивания краев — это то же самое, что склеить их. Если, конечно, не забывать это правило в ходе дальнейших операций.
Классический метод классификации поверхностей начинается с рисования на поверхности сети треугольников. Затем мы делаем достаточно много разрезов вдоль сторон треугольника так, чтобы фигура развернулась в плоский многоугольник. Правила склеивания, определяемые тем, как мы делаем разрезы, подскажут нам, как отождествить разные края многоугольника, восстанавливая первоначальную поверхность. В этот момент вся интересующая нас топология заключена в правилах склеивания. Эта классификация доказывается алгебраической обработкой правил и превращением их в правила, определяющие тор с g отверстиями или одну из аналогичных ему неориентируемых поверхностей. У современной топологии есть и другие способы добиться того же самого, но и она часто пользуется техникой «разрезания и склеивания». Этот метод легко обобщается на пространства любой размерности, но он слишком ограничен, чтобы дать возможность классифицировать многоразмерные топологические пространства без дополнительной помощи.
Около 1900 г. Пуанкаре занимался тем, что развивал более раннюю свою работу по топологии поверхностей и разрабатывал значительно более общую методику, применимую к пространствам с любым числом измерений. Основной идеей его исследования был поиск топологических инвариантов: чисел или алгебраических формул, связанных с пространствами, которые при непрерывной деформации остаются неизменными. Если топологические инварианты двух пространств различны, то одно из них невозможно преобразовать в другое и, значит, они топологически различны.
Начал он с обобщения топологического инварианта Люилье F — E + V на многомерные пространства, сделанного итальянским математиком Энрико Бетти в 1870 г. Сейчас оно, отчасти несправедливо, известно как эйлерова характеристика. Бетти заметил, что наибольшее число замкнутых кривых, которые можно нарисовать на поверхности рода g, не поделив ее при этом на несвязные куски, равняется g 1. Это еще один способ топологически охарактеризовать поверхность. Бетти обобщил эту идею на «числа связности» любой размерности, которые Пуанкаре назвал числами Бетти, и этот термин используется до сих пор. Так, k-мерное число Бетти означает число k-мерных отверстий в пространстве.
Пуанкаре определил на основе чисел Бетти более чувствительный инвариант, получивший название гомологии. Для него характерна гораздо более четкая алгебраическая структура. Подробнее мы поговорим о гомологии в главе 15. Пока же достаточно сказать, что гомология анализирует наборы многомерных «граней» в подобной сети и задается вопросом о том, какие из них образуют границу топологического диска. Диск не имеет отверстий, в отличие от тора, так что мы можем быть уверены, что в пределах любого набора граней, образующего границу, отверстий нет. Напротив, мы можем обнаруживать отверстия путем разделения наборв граней на те, что образуют границу, и на те, что границы не образуют. Таким образом мы можем построить серию инвариантов пространства, известных как его гомологические группы. Слово «группа» здесь используется как термин из абстрактной алгебры, означающий, что из любых двух объектов группы при помощи операции, для которой выполняются несколько соответствующих алгебраических правил, может быть получен объект той же группы. Позже, когда нам потребуется это понятие, я расскажу о нем немного больше. Для каждого измерения от 0 до n существует одна такая группа, и для каждого пространства мы получаем серию топологических инвариантов со всевозможными интереснейшими алгебраическими свойствами.
Листинг классифицировал все топологические поверхности — пространства размерности 2. Очевидным следующим шагом было посмотреть на пространства размерности 3. И простейшим пространством для начала стала сфера, т. е. бесконечно тонкая поверхность шара. Внутренняя часть шара не считается частью сферы: это всего лишь особенность, возникающая вследствие вложения сферической поверхности в пространство. По существу, у нас есть только поверхность, топологически эквивалентная поверхности шара. Можно представить ее себе как пустотелый мяч с бесконечно тонкой оболочкой.
«Правильный» трехмерный аналог сферы, называемой трехмерной, — это не шар. Шар, конечно, трехмерен, но у него есть граница — его поверхность, сфера. Сама сфера границы не имеет, не должен иметь ее и трехмерный ее аналог. Простейший способ определить трехмерную сферу состоит в том, чтобы в точности воспроизвести координатную геометрию обычной сферы. При этом возникает пространство, которое довольно трудно зрительно представить: я не могу показать вам модель в трех измерениях, поскольку трехмерная сфера хотя и имеет всего три измерения, не вкладывается в обычное трехмерное пространство. Для нее необходимо четырехмерное пространство.
Традиционная единичная сфера в трехмерном пространстве включает в себя все точки, расположенные на расстоянии 1 от заданной точки — центра сферы. Аналогично, единичная трехмерная сфера в четырехмерном пространстве включает в себя все точки, расположенные на единичном расстоянии от ее центра. В системе координат мы можем записать формулу для этих точек, воспользовавшись для определения расстояния обобщением теоремы Пифагора{34}. В более общем случае трехмерная сфера представляет собой любое пространство, топологически эквивалентное единичной трехмерной сфере, в точности так же, как всевозможные выпуклые версии единичной двумерной сферы топологически являются двумерными сферами. Разумеется, то же относится и к более высоким размерностям.
Если этого вам недостаточно и нужен более геометрический образ, попробуйте вот что: трехмерную сферу можно представить как заполненный шар, вся поверхность которого отождествляется с точкой. Это еще один пример применения правила склеивания. В данном случае процесс аналогичен одному из способов превращения круглого диска в двумерную сферу. Если протянуть нитку вдоль края тканевого диска, а затем туго стянуть ее, как будто затягивая торбу, то результат будет топологически идентичен двумерной сфере. А теперь проведите аналогичную операцию с шаром, но не пытайтесь зрительно представить себе результат: просто представьте шар и как бы приложите к нему правила склеивания.
В любом случае Пуанкаре очень интересовался трехмерной сферой, потому что это, предположительно, простейшее трехмерное топологическое пространство конечной протяженности, не имеющее границы. В 1900 г. он опубликовал статью, в которой объявил, что группы гомологий представляют собой достаточно мощный инвариант, чтобы топологически охарактеризовать трехмерную сферу. А именно, если трехмерное топологическое пространство обладает теми же группами гомологий, что и трехмерная сфера, то оно топологически эквивалентно трехмерной сфере (т. е. может непрерывно в нее преобразовываться). К 1904 г., однако, он обнаружил, что это заявление ошибочно. Существует по крайней мере одно трехмерное пространство, которое не является трехмерной сферой, но имеет те же группы гомологий, что и она. Это пространство стало настоящим триумфом подхода, связанного с правилами склеивания, а доказательство того, что это не трехмерная сфера, привело к созданию нового инварианта, заведомо более мощного, чем гомология.
Сначала о пространстве. Оно известно как додекаэдрическое пространство Пуанкаре, потому что в современном построении используется именно заполненный додекаэдр. Пуанкаре не подозревал о родстве своего пространства с додекаэдром. Сам он поступил иначе: склеил два заполненных тора весьма неочевидным способом. Додекаэдрическую интерпретацию опубликовали в 1933 г., через 21 год после смерти Пуанкаре, Герберт Зейферт и Константин Вебер, и она намного проще для понимания. Аналогия, которую здесь следует помнить, это получение тора путем склеивания противоположных сторон квадрата. Как всегда, не нужно пытаться действительно что-то склеить, — достаточно просто помнить, что соответствующие точки рассматриваются именно таким образом. Теперь мы проведем ту же операцию, но возьмем для этого противоположные грани додекаэдра (см. рис. 38).
Пифагорейцы знали о додекаэдре еще 2500 лет назад. Граница додекаэдра состоит из 12 правильных пятиугольников, соединенных в приблизительно сферическую решетку. В каждой его вершине встречаются три пятиугольника. А теперь склеим каждую грань с противоположной… Только для этого их нужно перекрутить. Буквально. Каждую грань, чтобы она совпала с противоположной, нужно повернуть на подходящий угол. Угол берем наименьший из тех, что позволяют совместить соответствующие грани, т. е. 36°. Можно считать это правило своеобразной версией правила изготовления ленты Мёбиуса: конец ленты нужно повернуть на 180°, а затем склеить с противоположным.
Так, пространство получено. А теперь посмотрим на инвариант. Нет, я не растекаюсь мыслью по древу: все это нам потребуется для понимания гипотезы Пуанкаре.
Пуанкаре назвал свой новый инвариант фундаментальной группой. Мы до сих пор пользуемся этим термином, но иногда называем его и иначе: первой гомотопической группой. Гомотопия — это геометрическая конструкция, которая целиком размещается внутри пространства и несет в себе информацию о топологическом типе этого пространства. Она делает это при помощи абстрактной алгебраической структуры, известной как группа. Группа — это набор математических объектов, таких, что комбинация любых двух подобных объектов дает еще один объект той же группы. Для закона комбинирования — его часто называют сложением или умножением, даже если это не те простые операции, которые мы знаем из арифметики — должны выполняться несколько простых и естественных условий. Если мы называем операцию сложением, основные условия такие:
• группа содержит элемент, который ведет себя как нуль: при добавлении к любому другому элементу группы ничего не меняется;
• каждый элемент имеет в группе соответствующий ему элемент с противоположным знаком: при сложении такой пары получается нуль;
• при сложении трех элементов группы не имеет значения, какие два вы складываете первыми. Иными словами, (a + b) + c = a + (b + c). Это называется законом ассоциативности.
Единственный алгебраический закон, который не считается обязательным (хотя иногда и выполняется), — это закон коммутативности{35} a + b = b + a.
Фундаментальная группа Пуанкаре представляет собой своего рода упрощенный скелет пространства. Это топологический инвариант: топологически эквивалентные пространства имеют одну и ту же фундаментальную группу. Чтобы лучше разобраться в этом полезном понятии и, очень может быть, отчасти восстановить мотивы Пуанкаре, посмотрим, как это работает, на примере окружности. Воспользуемся образом, который восходит еще к Гауссу: представьте себе муравья, вся вселенная которого ограничена окружностью. Как он может определить, какой формы его вселенная? Сумеет ли он отличить окружность от, скажем, прямой линии? Не забывайте, что муравей не может выйти за пределы своей вселенной, не может взглянуть на нее со стороны и понять, что она круглая. Он может лишь бродить по вселенной, что бы она собой ни представляла. В частности, муравей не в состоянии понять, что его вселенная изогнута, потому что и свет в ней движется только по кругу. И не обращайте, пожалуйста, внимания на практические сложности, к примеру, на то, что объектам придется, встречаясь, проходить сквозь друг друга, — в любом случае наша аналогия достаточно свободна.
Муравей может определить форму вселенной несколькими способами. Я сосредоточусь на методе, который можно обобщить на любые топологические пространства. Для целей данного обсуждения муравей — точка. Он живет на автобусной остановке, которая тоже представляет собой точку. Каждый день муравей выходит из домика, садится в автобус (который, конечно, тоже точка), а вечером возвращается обратно. Самый простой маршрут — № 0: он просто стоит на остановке и никуда не едет. Для более интересной экскурсии муравей садится в автобус № 1, который объезжает вселенную ровно один раз против часовой стрелки и останавливается, вернувшись домой. Автобус № 2 объезжает вселенную дважды, № 3 — трижды и т. д.; один автобус, движущийся против часовой стрелки, для каждого положительного целого числа. Есть и отрицательные автобусы, которые ездят в противоположном направлении. Автобус № 1 объезжает вселенную один раз по часовой стрелке, № 2 — два раза и т. д.
Муравей быстро замечает, что две последовательные поездки на автобусе № 1, по существу, эквивалентны одной поездке на № 2, а три поездки на № 1 — одной поездке на № 3. Аналогично, следующие одна за другой поездки на автобусах № 5 и № 8 соответствуют одной поездке на автобусе № 13. Более того, для любых двух положительных номеров поездка на автобусе с первым номером плюс следующая за ней поездка на автобусе со вторым номером сводится к поездке на автобусе с номером, соответствующим их сумме.
Следующий шаг тоньше. Примерно то же соотношение сохраняется для автобусов с отрицательными номерами и для № 0. Поездка на № 0 плюс поездка на № 1 очень похожа на поездку на № 1. Однако есть и небольшая разница. В поездке 0 + 1 автобус № 0 некоторое время стоит на остановке, отрабатывая свой маршрут, а в поездке только на № 1 ничего подобного не происходит. Поэтому мы вводим понятие со странным названием гомотопия («то же место» по-гречески). Две петли гомотопичны, если одна из них может быть непрерывно преобразована в другую. Если мы позволим гомотопиям менять расписание автобусов, можно будет постепенно снизить время, которое муравей проводит в стоящем на остановке автобусе № 0, и, в конце концов, период сидения на месте просто исчезнет. Теперь между поездкой 0 + 1 и поездкой 1 нет никакой разницы, так что «с точностью до гомотопии» результат — это просто поездка на автобусе № 1. Иными словами, уравнение для автобусных номеров 0 + 1 = 1 остается верным не для поездок, а для гомотопических классов поездок.
А если за поездкой на автобусе № 1 последует поездка на автобусе № 1? Нам хотелось бы, чтобы в ответе стояла поездка № 0, но это не так. Автобус в этом случае проезжает весь путь сначала против часовой стрелки, а потом — обратно. Это далеко не то же самое, что провести все время поездки в стоящем на остановке автобусе. Поэтому 1 + (1), т. е. 11, не равно 0. На помощь опять же приходит гомотопия. Комбинация автобусов 1 и 1 в целом гомотопна поездке на автобусе 0. Чтобы понять, почему, представьте, что муравей следует по суммарному маршруту автобусов 1 и 1 на автомобиле, но, чуть-чуть не доехав до остановки, разворачивается и едет назад. Такая поездка очень близка к двойной поездке на автобусе: пропущен всего лишь крохотный кусочек маршрута. Таким образом, первоначальное двойное путешествие непрерывно уменьшилось и превратилось в немного более короткую поездку на машине. Теперь муравей может снова чуть-чуть укоротить поездку, повернув назад чуть раньше. Он может таким образом укорачивать поездку, разворачивая автомобиль все раньше и раньше, пока не окажется просто сидящим на остановке. Процесс сжимания поездки — тоже гомотопия. Она показывает, что поездка 1 плюс поездка 1 гомотопна поездке на автобусе № 0. Иными словами, 1 + (1) = 0 для гомотопических классов поездок.
Теперь любой алгебраист без труда сможет доказать, что поездка на автобусе любого маршрута плюс вторая поездка на каком-нибудь автобусе гомотопна поездке на автобусе, номер которого получается сложением двух автобусных номеров. Это верно для положительных автобусов, для отрицательных автобусов и для автобуса № 0. Так что если мы складываем поездки — или, вернее, гомотопические классы поездок, — то получаем группу. Более того, очень знакомую группу. Ее элементами являются целые числа (номера автобусов), а ее операцией — сложение. Такая группа традиционно обозначается символом Z от немецкого слова Zahl (“целый”).
Гораздо труднее, но все же можно доказать, что в кольцевой вселенной любая кольцевая автомобильная поездка — даже если она предусматривает множество возвратов, отступлений или метаний взад-вперед на одном и том же участке дороги — гомотопична одной из стандартных автобусных поездок. Более того, автобусные поездки с разными номерами не гомотопичны. Доказательство требует некоторых теоретических познаний. Его основа — гауссов порядок кривой, или число вращения. Это число полных обходов окружности против часовой стрелки, которое совершает муравей за всю поездку{36}, и это номер маршрута, которому гомотопична ваша конкретная поездка.
Если заполнить все пробелы и расставить все точки над i, это описание доказывает, что фундаментальная группа окружности совпадает с группой целых чисел Z по операции сложения. Чтобы складывать поездки, нужно просто складывать соответствующие им числа вращения. При помощи этого топологического инварианта муравей может отличить свою кольцевую вселенную от, скажем, бесконечной прямой линии. На прямой любая поездка, как ни мечись, в какой-то момент должна достичь максимально удаленной от дома точки. Тогда мы можем непрерывно сжать поездку, постепенно уменьшая все расстояния от дома в одной и той же пропорции — сначала до 99 %, затем до 98 % и т. д. Поэтому на прямой любая поездка гомотопна нулю: можно просто остаться дома. Фундаментальная группа прямой содержит только один элемент: 0. Ее алгебраические свойства тривиальны: 0 + 0 = 0, и называется она тривиальной группой. А поскольку тривиальная группа не совпадает с группой целых чисел, муравей может понять, живет ли он на прямой или на окружности.
Как я уже говорил, существуют и другие методы, но именно так муравей может заметить разницу при помощи фундаментальной группы Пуанкаре.
А теперь предположим, что наш муравей живет на поверхности и это опять же вся его вселенная. Он не может отойти в сторону и посмотреть, какая именно поверхность является его домом. Может ли он разобраться в топологии своей вселенной? В частности, сможет ли он различить сферу и тор? Ответ по-прежнему «да», а метод тот же, при помощи которого мы исследовали вселенную-окружность: сесть в автобус и совершать круговые поездки, которые начинаются и заканчиваются в одной точке — дома. Чтобы сложить такие поездки, их нужно проделать по очереди — одну за другой. Нулевая поездка — это остаться дома; поездка с обратным знаком — это точно такая же поездка в противоположном направлении. Работая с гомотопическими классами поездок, мы получим группу. Это фундаментальная группа поверхности. По сравнению с вселенной-окружностью здесь куда больше свободы в выборе маршрутов поездок и непрерывном преобразовании их в другие поездки; тем не менее основная идея та же.
Фундаментальная группа здесь тоже является топологическим инвариантом, и муравей может воспользоваться ею, чтобы выяснить, живет ли он на сфере или на торе. Если его вселенная — сфера, то любая поездка, совершенная муравьем, может быть постепенно преоразована в нулевую поездку — пребывание дома. Однако в случае, если вселенная — тор, это не так. Некоторые поездки могут быть преобразованы в нуль, но с поездкой, которая хотя бы раз обойдет вокруг центрального отверстия (см. рис. 39 слева), ничего подобного проделать нельзя. Это утверждение нуждается в доказательстве, но это не проблема. На торе тоже есть стандартные поездки, но теперь номера автобусов представляют собой пары целых чисел (m, n). Первое число m указывает, сколько раз маршрут проходит сквозь центральное отверстие. Второе число n указывает, сколько раз маршрут обвивается вокруг тора. На рис. 39 справа показан маршрут (5, 2), который пять раз проходит сквозь отверстие и дважды обвивается вокруг тора. Чтобы сложить поездки, нужно сложить соответствующие числа маршрутов, к примеру: (3, 6) + (2, 4) = (5, 10). Фундаментальная группа тора — группа пар целых чисел.
Любое топологическое пространство имеет фундаментальную группу, определенную в точности так же, с использованием поездок — или, точнее, петель, — которые начинаются и заканчиваются в одной точке. Пуанкаре придумал фундаментальную группу, чтобы доказать, что его додекаэдрическое пространство не является трехмерной сферой, хотя и имеет те же гомологические инварианты. Его первоначальный метод прекрасно приспособлен к вычислению фундаментальной группы. Более современный метод «скручивания и склеивания» приспособлен к нему еще лучше. Ответом оказывается группа из 120 элементов, связанная с додекаэдром. А вот фундаментальная группа трехмерной сферы, напротив, состоит лишь из одного элемента: нулевой петли. Так что додекаэдрическое пространство топологически не эквивалентно сфере, несмотря на одинаковые группы гомологий, и Пуанкаре доказал, что утверждение, сделанное им в 1900 г., ошибочно.
Пуанкаре продолжал рассуждать о своем новом инварианте: может быть, это и есть недостающий ингредиент топологической характеристики трехмерной сферы? А может, любое трехмерное пространство с той же фундаментальной группой, как у трехмерной сферы, т. е. с тривиальной группой, должно на самом деле быть трехмерной сферой? Он сформулировал это предположение как отрицание в виде вопроса: «Рассмотрим компактное трехмерное многообразие [топологическое пространство] V, не имеющее границы. Возможно ли, чтобы фундаментальная группа многообразия V была тривиальной, хотя V не есть трехмерная сфера [топологически не эквивалентно ей]?» Он оставил вопрос открытым, но очень правдоподобно мнение, что ответ при такой постановке вопроса очевиден — «нет». И вскоре это предположение получило известность как гипотеза Пуанкаре. И столь же быстро стало одним из самых знаменитых открытых вопросов топологии.
Фраза «тривиальная фундаментальная группа» означает, в сущности, что «любая петля может быть непрерывно преобразована в точку». Таким свойством обладает не только трехмерная сфера, но и любая аналогичная ей n-мерная сфера любой размерности n. Так что мы можем выдвинуть точно такое же предположение для сферы любой размерности. Такое утверждение известно как n-мерная гипотеза Пуанкаре. Это верно для n = 2, согласно теореме классификации для поверхностей. И это все, чего удалось достичь математикам за 50 с лишним лет.
В 1961 г. Стивен Смейл взял прием классификации поверхностей и применил его к более высоким измерениям. Один из способов представить себе тор с g отверстиями заключается в том, чтобы взять сферу и приделать к ней мысленно g ручек — точно таких, какие бывают у чайной чашки или кружки. Смейл обобщил это построение для любой размерности и назвал процесс разложением на ручки. Он проанализировал, как могут изменяться ручки при неизменной топологии пространства, и вывел гипотезу Пуанкаре во всех размерностях, больших или равных 7. Для более низких размерностей его доказательство не работало, но другие математики нашли способы с этим справиться: Джон Столлингс провел доказательство для размерности 6, а Кристофер Зиман — для 5. Однако один из существенных этапов доказательства, известный как трюк Уитни, упрямо отказывался работать в размерностях 3 и 4, потому что в таких пространствах просто не хватает места для необходимых маневров, и никто не мог найти эффективной замены этому приему. Постепенно сформировалось мнение о том, что топология пространств для этих двух размерностей может оказаться весьма необычной.
Это мнение, однако, было поколеблено в 1982 г., когда Майкл Фридман получил доказательство четырехмерной гипотезы Пуанкаре, для которого не требовался трюк Уитни. Доказательство было чрезвычайно сложным, но работало. Итак, после 50 лет топтания на месте и 20 лет лихорадочной активности топологи расправились наконец с гипотезой Пуанкаре для всех размерностей, кроме той, о которой, собственно, и шла речь изначально. Успехи впечатляли, но методы, при помощи которых они были достигнуты, не позволяли сказать почти ничего о трехмерном случае. Требовался новый подход.
Перечень того, что позволило, наконец, сдвинуться с мертвой точки, отчасти напоминает традиционный список подарков к свадьбе: что-то старинное, антикварное, что-то новенькое, что-то взятое взаймы и, наконец, если немного выходить за рамки, что-то из даров небес. Старинная идея заключалась в обращении к той области топологии, которая на фоне активной работы с пространствами более высоких размерностей представлялась почти исчерпанной: в топологию поверхностей. Новая идея была в том, чтобы заново рассмотреть классификацию поверхностей с позиции, на первый взгляд, совершенно чуждой: с позиции классической геометрии. Одолженной идеей можно считать поток Риччи, источником вдохновения для которого послужил математический аппарат общей теории относительности Эйнштейна. Ну а к дарам небес можно отнести нечто вроде попадания «пальцем в небо»: далеко идущие предположения, опирающиеся отчасти на интуицию, но куда больше — на надежду.
Вспомним, что ориентируемые поверхности без границы можно проклассифицировать: каждая из них топологически эквивалентна тору с некоторым числом отверстий. Это число — род поверхности, и когда род равен нулю, поверхность представляет собой сферу без ручек, т. е. просто сферу. Это слово сразу же напоминает нам о том, что среди всех топологических сфер одна поверхность стоит особняком и является архетипом. Конкретно речь идет о единичной сфере в евклидовом пространстве. Забудьте на мгновение все разговоры о резиновом листе — пока отложим это в сторону. Сосредоточьтесь на старой доброй евклидовой сфере. У нее много разных дополнительных математических свойств, проистекающих из жесткости и однозначности евклидовой геометрии. Важнейшее из этих свойств — кривизна. Кривизну можно квантифицировать: для каждой точки геометрической поверхности существует число, говорящее о том, насколько изогнута поверхность вблизи этой точки. Сфера — единственная в евклидовом пространстве замкнутая поверхность, кривизна которой во всех точках одинакова и положительна.
Это странно, потому что постоянная кривизна — не топологическое свойство. Еще загадочнее то, что сфера не одинока. Существует еще одна стандартная геометрическая поверхность, которая стоит особняком и представляет собой архетипический тор. А именно: начнем с квадрата на плоскости и отождествим противоположные его стороны (см. рис. 12 из главы 4). Результат в трехмерном пространстве после скатывания рулона и соединения тождественных сторон выглядит изогнутым. Однако, по существу, мы можем работать непосредственно с квадратом, применив дополнительно правила склеивания. Квадрат имеет естественную геометрическую структуру: это участок на евклидовой плоскости. Плоскость, кстати говоря, тоже имеет постоянную кривизну, на этот раз нулевую. Тор с данной конкретной геометрией тоже имеет нулевую кривизну и называется плоским тором. Возможно, название звучит как оксюморон, но для муравья, живущего на плоском торе и пользующегося линейкой и транспортиром для измерения расстояний и углов, местная геометрия вполне соответствовала бы плоской геометрии.
Геометры XVIII в., стараясь разобраться в аксиоме Евклида о существовании параллельных линий, пытались вывести ее из остальных евклидовых постулатов, но раз за разом терпели поражение. В конце концов пришло понимание, что такой вывод невозможен. Существует три различных типа геометрии, в каждом из которых выполняются все условия и требования Евклида, за исключением аксиомы о параллельных прямых. В настоящее время эти геометрии известны как евклидова (это плоскость, на которой аксиома о параллельных прямых верна), эллиптическая (геометрия на поверхности сферы с некоторыми финтифлюшками: здесь две прямые всегда пересекаются, а параллельной прямой не существует) и гиперболическая геометрия (где некоторые прямые не пересекаются, а параллельная прямая не единственна). Более того, классические математики интерпретируют эти геометрии как геометрии искривленных пространств. Евклидова геометрия соответствует нулевой кривизне, эллиптическая/сферическая геометрия — постоянной положительной кривизне, а гиперболическая геометрия — постоянной отрицательной кривизне.
Мы только что видели, как можно получить две из трех перечисленных геометрий: они возникают на сфере и на плоском торе. В терминах теоремы классификации это торы рода g для g = 0 и 1. Единственное, чего у нас пока не хватает, это гиперболической геометрии. Может быть, каждый тор с g дырками обладает естественной геометрической структурой, основанной на том, что в гиперболическом пространстве взяли некий многоугольник и отождествили у него некоторые стороны? Ответ поразителен: «да» для любой величины g, большей или равной 2. На рис. 40 показан пример для g = 2 на основе восьмиугольника. Я опущу гиперболическую геометрию и идентификацию этой поверхности как двумерного тора, но скажу, что разобраться в этом можно. Различные g возникают, если мы берем разные многоугольники, но исключений нет — можно получить любой g. Используя профессиональную лексику, скажем, что тор с двумя и более дырками имеет естественную гиперболическую структуру. Теперь можно пересмотреть список стандартных поверхностей:
• сфера: g = 0 — эллиптическая геометрия;
• тор: g = 1 — евклидова геометрия;
• тор с g дырками: g = 2, 3, 4… — гиперболическая геометрия.
Может показаться, что мы выплеснули с водой и ребенка, ведь топология должна иметь дело с геометрией на резиновом листе, а не с жесткой геометрией. Но теперь мы легко можем вернуть резину на место. Жесткая геометрия используется здесь только для того, чтобы определить стандартные поверхности. Она позволяет дать простые описания, которые оказываются еще более жесткими. А теперь ослабим жесткость, т. е. позволим пространству стать резиновым и разрешим деформироваться, что невозможно при жесткой структуре. При этом мы получим поверхности, топологически эквивалентные стандартным, но не получаемые из них путем жестких сдвигов. Согласно теореме о классификации, таким образом можно получить любую топологическую поверхность.
Топологи знали о существовании такой связи между геометрией и теоремой о классификации поверхностей, но в то время она представлялась забавным совпадением, дающим, несомненно, весьма ограниченные возможности в двух измерениях. Все понимали, что трехмерный случай намного богаче и, в частности, пространствами постоянной кривизны его возможности не исчерпываются. Но понять, что жесткая геометрия может оказаться полезной при рассмотрении трехмерной топологии, сумел лишь Уильям Терстон — один из лучших геометров мира. Несколько указаний на это уже имелось: трехмерная сфера Пуанкаре, исходя из ее определения, обладает естественной эллиптической/сферической геометрией. Хотя стандартный додекаэдр обитает в евклидовом пространстве, угол между его смежными гранями меньше 120°, так что три таких угла не образуют полной окружности. Чтобы исправить это, нам придется слегка надуть додекаэдр, чтобы его грани стали немного выпуклыми: это сразу превращает естественную геометрию фигуры из евклидовой в сферическую. Аналогично, треугольники на сфере тоже становятся выпуклыми. Трехмерный тор, полученный путем отождествления противоположных граней куба, обладает плоской, т. е. евклидовой, геометрией, в точности так же, как его двумерный аналог. Макс Ден и другие исследователи открыли несколько трехмерных топологических пространств, обладающих естественной гиперболической геометрией.
У Терстона появились первые подозрения о возможности существования общей теории, но, чтобы она обрела хотя бы относительную правдоподобность, требовались два нововведения. Во-первых, необходимо было расширить диапазон трехмерных геометрий. Исходя из здравого смысла, Терстон сформулировал некоторые условия и выяснил, что им удовлетворяет ровным счетом восемь геометрий. Три из них — это классика: сферическая, евклидова и гиперболическая геометрия. Еще две напоминают цилиндры: плоские в одном направлении, изогнутые в двух других. Изогнутая часть имеет либо положительную кривизну, как у двумерной сферы, либо отрицательную, как у гиперболической плоскости. Наконец, есть еще три, достаточно формальные, геометрии.
Во-вторых, было ясно, что некоторые трехмерные пространства не поддерживают ни одну из восьми геометрий. Но нашелся и выход: разрезать пространство на куски. Один кусок, возможно, обладает сферической геометрической структурой, другой — гиперболической и т. д. Чтобы разрезание было полезным, его надо проводить по очень строгим правилам, чтобы обратный процесс — собирание кусков в единое целое — позволил получить полезную информацию. Хорошей новостью стало то, что во многих случаях это возможно. В 1982 г. Терстон в приступе вдохновения сформулировал гипотезу о геометризации: любое трехмерное пространство может быть разрезано на куски, каждый из которых обладает естественной геометрической структурой, соответствующей одной из восьми возможных геометрий. Он доказал также, что если его гипотеза о геометризации верна, то гипотеза Пуанкаре окажется простым ее следствием.
Тем временем появилось и второе направление атаки, тоже геометрическое и тоже основанное на кривизне, но исходящее из совершенно иной области: математической физики. Гаусс, Риман и целая школа итальянских геометров создали общую теорию искривленных пространств, получивших название многообразий, причем концепция расстояния у них необыкновенно расширила и евклидову, и классическую неевклидову геометрию. Кривизна уже не обязана быть постоянной: она может плавно меняться от одного конца к другому. К примеру, фигура, напоминающая собачью косточку, имеет положительную кривизну на концах, но отрицательную посередине, и величина кривизны изменяется плавно от одного участка к другому. Кривизна квантифицируется при помощи математических инструментов, известных как тензоры. Около 1915 г. Альберт Эйнштейн понял, что тензоры кривизны — это именно то, чего ему не хватало для расширения специальной теории относительности, описывающей пространственно-временные отношения, до общей теории относительности, включающей также и гравитацию. В этой теории гравитационное поле представлено как кривизна пространства, а эйнштейновы уравнения поля описывают, как соответствующая мера кривизны — тензор кривизны — изменяется в зависимости от распределения материи. В результате кривизна пространства плывет со временем; вселенная или некая ее часть спонтанно меняет форму.
Ричард Гамильтон, специалист по римановой геометрии, понял, что тот же фокус можно применить в более общем плане и что результатом этого может стать доказательство гипотезы Пуанкаре. Идея состояла в том, чтобы работать с одной из простейших мер кривизны, именуемой кривизной Риччи в честь итальянского геометра Грегорио Риччи-Курбастро. Гамильтон записал уравнение, определявшее, как кривизна Риччи должна изменяться со временем: уравнение потока Риччи. Согласно этому уравнению, кривизна должна была постепенно перераспределиться и стать как можно более равномерной. Картина немного напоминает кошку под ковром из главы 4, но теперь кошка, хотя и не может сбежать, способна растечься по полу ровным слоем. (Говоря иначе, кошка здесь должна быть топологической.)
К примеру, в двумерном случае начнем с грушевидной поверхности (см. рис. 41). На одном конце она имеет область сильной положительной кривизны. Область на другом, более толстом конце тоже положительно искривлена, но не так сильно, а в промежутке грушу опоясывает область с отрицательной кривизной. По существу, поток Риччи переносит кривизну с сильно искривленного конца (и в меньшей степени с другого конца) в отрицательно искривленную область до тех пор, пока вся отрицательная кривизна не будет поглощена. На этой стадии результат — бугристая поверхность с повсеместно положительной кривизной. Поток Риччи продолжает перераспределять кривизну, забирая ее из сильно искривленных областей и перенося в менее искривленные. Время идет, и поверхность становится все ближе и ближе к той единственной форме, что имеет постоянную положительную кривизну, т. е. к евклидовой сфере. Топология остается прежней, хотя форма, если посмотреть подробнее, меняется. Следуя потоку Риччи, можно доказать что первоначальная грушевидная поверхность топологически эквивалентна сфере.
В этом примере топологический тип поверхности был очевиден с самого начала, однако та же общая стратегия действует для любого многообразия. Начните со сложной формы и следуйте за потоком Риччи. Со временем кривизна перераспределяется более равномерно, и форма упрощается. В конце концов вы должны получить простейшую форму с той же топологией, что и у первоначального многообразия, какой бы эта топология ни была. В 1981 г. Гамильтон доказал, что такая стратегия работает в двух измерениях, обеспечивая новое доказательство теоремы о классификации для поверхностей.
Кроме того, он добился значительного прогресса в аналогичной стратегии для трехмерных многообразий, но здесь возникло серьезное препятствие. В двух измерениях любая поверхность автоматически упрощается, следуя потоку Риччи. Это верно и в трех измерениях, если первоначальное многообразие во всех точках имеет строго положительную кривизну и нигде — нулевую или отрицательную. К несчастью, если в многообразии есть точки с нулевой кривизной — а они часто есть, — пространство, двигаясь в потоке, может запутаться. При этом возникают сингулярности — места, где многообразие перестает быть гладким. В таких точках уравнение потока Риччи не работает, и перераспределение кривизны прекращается. Естественный способ обойти это препятствие заключается в том, чтобы понять, что представляют собой сингулярности, и изменить многообразие — может быть, разрезать его на куски, чтобы можно было дать стартовый толчок потоку Риччи. Такая стратегия может оказаться успешной, если вы в достаточной степени контролируете связь топологии измененного многообразия к первоначальной. К несчастью, Гамильтон понял также, что для трехмерных пространств сингулярности потока Риччи могут быть чрезвычайно сложными — судя по всему, слишком сложными, чтобы применять подобные уловки. В общем, поток Риччи быстро стал в геометрии стандартным методом, но для доказательства гипотезы Пуанкаре его не хватило.
К 2000 г. гипотеза по-прежнему оставалась не доказанной; после вхождения в число семи проблем тысячелетия она приобрела еще более широкую известность и признание. К тому моменту стало ясно, что если каким-то образом удастся все же добиться, чтобы идея Гамильтона сработала, то тем самым будет доказана не только гипотеза Пуанкаре, но и гипотеза Терстона о геометризации. Приз был соблазнителен и близок, но в руки не давался.
В математике, как и в остальных отраслях науки, работа, чтобы ее признали, должна быть опубликована, а для этого — пройти рецензирование. Специалисты в соответствующей области должны внимательно прочитать работу, проверить логические выкладки и убедиться в безошибочности вычислений. Для сложной и значительной математической работы этот процесс может занять немало времени. Как упоминалось в главе 4, раньше выходом в каких-то ситуациях становился препринт, но сегодня существует стандартный веб-сайт arXiv.org, своеобразный архив, где после частичного рассмотрения и утверждения (чтобы отсечь всякие глупости) разрешается размещать электронные препринты. В настоящее время большинство исследователей знакомится с новыми результатами на сайте arXiv или на собственном сайте автора.
В 2002 г. Григорий Перельман разместил на сайте arXiv препринт о потоке Риччи. В работе было сделано замечательное утверждение: поток Риччи градиентоподобен. Иными словами, существует вполне определенное направление вниз — единственная числовая величина, связанная с формой многообразия, и многообразие всегда течет вниз в том смысле, что эта величина всегда уменьшается со временем. Она чем-то напоминает высоту в ландшафте и позволяет количественно оценить «упрощение» многообразия. Градиентоподобные потоки имеют немало ограничений: к примеру, они не могут ходить кругами или вести себя хаотично. Никто, похоже, не подозревал, что поток Риччи окажется таким ручным. Но Перельман не просто выдвинул предположение: он доказал это. В конце он наметил цепочку рассуждений, которые должны были бы доказать гипотезу Терстона о геометризации — а она, если помните, подразумевает гипотезу Пуанкаре, но заходит на самом деле гораздо дальше, — и пообещал подробнее изложить все это в следующих статьях на сайте arXiv. В течение следующих восьми месяцев он разместил там две статьи, содержавшие большую часть обещанных подробностей.
Первая статья вызвала немалый переполох. Перельман утверждал, что ему удалось реализовать всю программу Гамильтона — использовать поток Риччи для упрощения трехмерного многообразия и доказать, что результат получился в точности таким, как предсказывал Терстон. Две другие статьи добавили рассуждениям Перельмана убедительности: у математиков возникло чувство, что это человек знает, о чем говорит, и что его идеи — не просто очередная правдоподобная стратегия с неизменной логической прорехой или недоказанным допущением. Обычный скепсис математического сообщества по отношению к любым заявлениям о решении одной из великих задач слегка поутих. Возникло ощущение, что его попытка вполне может увенчаться успехом.
Однако дьявол, как всегда, кроется в деталях, а в математике детали бывают дьявольски непокорными! Работу необходимо было проверить, не спеша и на полную глубину, причем сделать это должны были те, кто разбирается в соответствующих областях и в состоянии распознать потенциальные ловушки. А это было непросто, поскольку Перельман в своей работе свел воедино по крайней мере четыре очень разные области математики и математической физики, а мало кто из математиков может похвастать знаниями более чем в одной-двух областях. Анализ корректности его доказательства потребовал бы много усилий и командной работы. Более того, в препринтах на сайте arXiv не было всех подробностей, необходимых в публикуемой статье. Для препринтов они были написаны довольно ясно, но точки над i там были расставлены не все. Так что экспертам нужно было реконструировать часть рассуждений Перельмана — при том, что сам-то он занимался этой работой несколько лет!
На все это требовалось время. Перельман читал лекции по своему доказательству и отвечал по электронной почте на вопросы, касавшиеся различных его этапов. Всякий раз, как кто-нибудь находил кажущуюся прореху, он быстро откликался, объяснял необходимое и заполнял пробелы. Все выглядело обнадеживающе. Однако никто не собирался рисковать репутацией и заявлять публично, что Перельман доказал гипотезу Пуанкаре и, тем паче, еще более сложную гипотезу о геометризации. Нужна была полная уверенность в том, что доказательство безошибочно. Поэтому, несмотря на общее благосклонное отношение к работе Перельмана, публичного признания она поначалу не получила. Это было ожидаемо, но время шло, и Перельмана все больше охватывало раздражение, потому что, как ему казалось, он впустую тратил время. Он-то знал, что его доказательство верно, и не мог понять, почему у остальных возникают такие сложности. Он отказался написать о своей работе подробнее или представить статью в какой-нибудь журнал. С его точки зрения, дело было сделано, а препринты на arXiv содержали всю необходимую информацию. Он перестал отвечать на вопросы, касавшиеся недостающих вроде бы деталей. Для него все было очевидно. Да ладно, ребята, вы и сами можете разобраться в этом, без моей помощи. Это не так уж сложно.
Некоторые писали, что математическое сообщество было несправедливо к Перельману. Но те, кто так говорят, просто не понимают, как принято действовать, когда появляется заявка на решение одной из великих задач. Было бы безответственно просто похлопать автора по плечу, сказать: «Отлично! Молодец!» — и забыть о том, чего не хватает в его препринтах. Вполне справедливо было попросить его подготовить более подробное изложение доказательства, пригодное для публикации. Когда речь идет о столь важной задаче, спешить нельзя. Специалисты из кожи вон лезли, тратили кучу времени на доказательство Перельмана и больше обычного старались сдержать свой естественный скептицизм. Сказать по правде, к автору отнеслись даже более благожелательно, чем обычно. И со временем, когда процесс проверки был завершен, его работу приняли и признали.
К этому моменту, однако, Перельман успел потерять терпение. Возможно, сказалось и то, что решенная им задача была настолько значительной, что ничто, по существу, уже не могло с ней сравниться. Он был как альпинист, сумевший подняться на Эверест в одиночку и без кислорода. Сравнимых вызовов просто не осталось. Успех в средствах массовой информации его не прельщал: он ждал признания со стороны равных, а не со стороны телеведущих всех сортов. Потому можно понять, почему, когда коллеги наконец признали, что он прав и предложили ему Филдсовскую медаль и премию Института Клэя, он не захотел принять эти награды.
Доказательство Перельмана отличается глубиной и элегантностью и открывает перед исследователями целый новый мир топологии. Автор сумел реализовать план Гамильтона по потоку Риччи, придумав хитрые способы обойти существование сингулярностей. Один из таких способов заключается в том, чтобы изменить масштабы пространства и времени и таким образом избавиться от сингулярности. Когда такой подход не работает, говорят, что сингулярность схлопывается. В подобных случаях Перельман анализирует геометрию потока Риччи в подробностях и разбирает, как именно может произойти схлопывание. По существу, пространство как бы выпускает бесконечно тонкие щупальца, иногда во множестве, как ветви дерева. Если какая-то ветка близка к схлопыванию, ее можно срезать и заменить гладкой крышечкой. Перед некоторыми из этих щупальцев поток Риччи буксует: если так, оставляем их в покое. Если же нет, поток Риччи можно запустить заново. В итоге некоторые щупальца заменяются гладкими крышками, а другие временно прерываются, но поток продолжает работать.
Процедура срезания и замазывания щупалец рубит пространство примерно так же, как терстоново рассечение на куски, каждый со своей геометрией (одной из восьми). Оказывается, что обе процедуры приводят к более или менее одинаковым результатам. Но есть один принципиально важный технический момент: операция обрезки не должна бесконечно ускоряться, так чтобы за конечное время проводилось бесконечное число операций. Это часть доказательства — одна из сложнейших.
Некоторые комментаторы критикуют математическое сообщество за несправедливое отношение к Перельману. Конечно, никто не должен быть закрыт для критики, да и инциденты, в которых, в принципе, можно разглядеть несправедливость или по крайней мере необдуманность, действительно имели место, но в целом математическое сообщество отреагировало на работу Перельмана быстро и положительно. Кроме того, реакция была осторожной, что абсолютно естественно в математике и науке вообще, и не без причин. Неизбежная публичность и слава, еще более яркая благодаря премии в миллион долларов, сказалась бы на любом человеке, и Перельман не исключение.
С момента размещения первой статьи Перельмана на arXiv в ноябре 2002 г. до объявления в марте 2010 г. о присуждении ему премии Института Клэя прошло восемь лет. Кажется, что это серьезная и, возможно, безосновательная задержка. Однако та, первая, публикация содержала лишь часть доказательства. Остальное по большей части было размещено на сайте в марте 2003 г. К сентябрю 2004 г., полтора года спустя после этой второй публикации, сообщество специалистов по потоку Риччи и топологии успело проработать доказательство — следует отметить, что этот процесс начался всего через несколько дней после первой публикации, — и ведущие эксперты объявили, что «поняли его». Они нашли в нем ошибки, нашли пробелы, но выразили уверенность в том, что все это можно исправить. Полтора года — совсем немного, когда речь идет о таком важном вопросе.
В конце 2005 г. Международный математический союз связался с Перельманом и предложил ему Филдсовскую премию, высшую математическую награду. Присудить ее предполагалось на Международном математическом конгрессе в 2006 г. Конгресс проводится раз в четыре года, так что это была бы первая возможность почтить ученого за серьезное достижение. Поскольку в полноте доказательства гипотезы Пуанкаре оставались некоторые сомнения — в нем все еще время от времени обнаруживались ошибки, — премия официально присуждалась за успехи в понимании потока Риччи (эта часть препринтов Перельмана к тому моменту уже считалась свободной от ошибок).
Условия присуждения премии за решение проблем тысячелетия размещены на сайте Института Клэя. В частности, предлагаемое решение должно быть опубликовано в рецензируемом журнале и принято математическим сообществом, причем отношение к нему не должно измениться за два года после публикации. После этого специальный консультативный комитет должен рассмотреть вопрос и выдать рекомендацию: присуждать автору премию или нет. Перельман не выполнил первого условия и, судя по всему, никогда уже этого не сделает. С его точки зрения, препринтов на сайте arXiv достаточно. Тем не менее Институт Клэя махнул на это рукой и объявил о начале уставного двухлетнего срока: требовалось посмотреть, не всплывут ли еще какие-нибудь ошибки или вопросы. Срок истек в 2008 г.; теперь нужно было следовать строгой (чтобы, не дай бог, не выдать премию преждевременно) процедуре.
Это правда, что некоторые эксперты не спешили выражать свою уверенность в корректности доказательства Перельмана. Причина понятна: они действительно не были в ней уверены. Не будет преувеличением сказать, что единственным человеком, способным быстро разобраться в доказательстве Перельмана, мог бы быть только второй Перельман. Невозможно читать математическое доказательство с листа, как музыканты читают ноты. Необходимо убедить самого себя в том, что здесь все разумно и имеет смысл. Всякий раз, когда аргументация усложняется, ты понимаешь, что возрастает и вероятность ошибки. То же можно сказать и о ситуации, когда излагаемые идеи становятся слишком простыми: многие перспективные доказательства споткнулись на утверждениях настолько очевидных, что ничего доказывать, казалось бы, вообще не требовалось. До тех пор, пока эксперты не убедились окончательно в том, что доказательство верно в своей основе — а именно в этот момент они признали достижение Перельмана, несмотря на оставшиеся пробелы и ошибки, — разумно было воздержаться от суждений. Вспомните, к примеру, шумиху вокруг холодного синтеза, данные о котором через некоторое время были опровергнуты. Осторожность — верная профессиональная реакция, и в данном случае вполне применимо известное изречение: чрезвычайные заявления требуют чрезвычайных доказательств.
Почему же Перельман отверг Филдсовскую премию и отказался от награды Института Клэя? Это известно лишь ему самому, но вообще-то его никогда не интересовало признание такого рода, и он не раз говорил об этом. Он и раньше отказывался от премий и призов, правда, не таких престижных и крупных. Перельман с самого начала дал понять, что не хочет преждевременной известности. По иронии судьбы, именно это стало одной из причин, по которым специалисты не спешили высказывать свое мнение. Но, по правде говоря, не было ни единого шанса на то, что средства массовой информации не заметят его работу. Много лет математическое сообщество всеми силами старалось заинтересовать этой темой газеты, радио и телевидение, и нет смысла жаловаться на то, что эти усилия увенчались успехом, или ждать, что СМИ пропустят самую громкую математическую сенсацию со времен Великой теоремы Ферма. Но Перельман смотрел на все это иначе и спрятался в раковину. Поступило предложение — и оно остается в силе — использовать премиальные деньги на образовательные или иные цели, если он согласится. До сих пор ответа на это предложение нет.
11. Не могут они все быть легкими. Задача P/NP
В настоящее время математики используют компьютеры для решения самых разных задач, даже великих, и не считают это чем-то из ряда вон выходящим. Компьютеры хороши в числовых расчетах, но математика — это далеко не только «суммирование», так что ввести задачу в компьютер, как правило, очень непросто. Часто самое сложное — это преобразовать ее в такой вид, в каком ее можно решить путем компьютерных расчетов, и даже в этом случае компьютер иногда сопротивляется. Поэтому и в наше время решения многих великих задач находятся без или почти без участия компьютеров. Примерами тому — Великая теорема Ферма и гипотеза Пуанкаре.
В тех случаях, когда компьютеры использовались при решении великих задач (к примеру, теоремы о четырех красках или гипотезы Кеплера), они эффективно выступали в роли прислуги или помощников. Но иногда роли меняются, и математика становится служанкой компьютерной науки. Большая часть работы по первоначальному проектированию компьютеров шла в математическом ключе. Значительную роль в ней сыграла связь между булевой алгеброй — алгебраическим выражением формальной логики — и коммутационными схемами, разработанными, в частности, инженером Клодом Шенноном, создателем теории информации. Сегодня компьютеры и в практическом, и в теоретическом аспекте опираются на широкое использование многих самых разных областей математики.
Одна из задач тысячелетия по версии Института Клэя лежит в пограничной области между математикой и информатикой. В данном случае ситуацию можно рассматривать двояко: то ли информатика находится на службе у математики, то ли наоборот. На самом же деле требуется, да и развивается нечто другое, более сбалансированное, — партнерство. Задача касается компьютерных алгоритмов — математических скелетов, из которых вырастают компьютерные программы. Принципиальное значение здесь имеет концепция эффективности алгоритма: за сколько вычислительных шагов будет получен результат при определенном количестве входных данных. Практически эффективность говорит о том, сколько времени потребуется компьютеру на решение задачи заданного размера.
Слово «алгоритм» восходит к Средним векам, когда Мухаммад ибн-Муса аль-Хорезми написал один из первых трудов по алгебре. Еще раньше Диофант ввел в обращение элементы, которые мы сегодня прочно связываем с алгеброй: символы. У него они, однако, использовались как сокращения, а методы решения уравнений были представлены при помощи конкретных — хотя и типичных — примеров. Там, где мы сегодня написали бы что-нибудь вроде «x + a = y, следовательно, x = y — a», Диофант написал бы: «Положим x + 3 = 10, тогда x = 10 3 = 7» — и считал бы, что читатели должны сами сообразить, что эта идея будет работать и для любых других чисел вместо 3 и 10. Он готов был объяснить свой иллюстративный пример с применением символов, но никогда не стал бы оперировать символами как таковыми. Аль-Хорезми подробно разработал эту общую рекомендацию. Он сделал это при помощи слов, а не символов, но общая идея была верной, и именно он считается отцом алгебры. Более того, сам этот термин образован из названия его книги: она называлась «Краткая книга о вычислении посредством восполнения и противопоставления» («Аль-китаб аль-мухтасар фи хисаб аль-джебр ва-ль-мукабала»). Слово «аль-джебр», от которого и пошла алгебра, при этом означало «восполнение» и имело отношение к решению уравнений. А слово «алгоритм» произошло от средневековой латинизированной версии прозвища аль-Хорезми (т. е. «из Хорезма») — Алгорисмус — и означает в настоящее время специализированный математический процесс решения задачи, который при достаточно длительном ожидании гарантирует нахождение ответа на нее.
Традиционно в математике задача считалась решенной, если для нее в принципе можно было записать алгоритм, ведущий к ответу. Слово «алгоритм» использовалось редко: математики предпочитали представлять, скажем, формулу решения — частный случай алгоритма на языке символов. При этом было не слишком важно, может ли эта формула быть применена на практике: она сама по себе являлась решением. Но появление компьютеров изменило эту ситуацию. Формула, слишком сложная для ручных вычислений, вполне могла оказаться применимой, если привлечь на помощь компьютер. Зато ситуации, когда формула оказывалась слишком сложной даже для компьютера, стали вызывать раздражение, а такое тоже иногда случалось: конечно, любой алгоритм можно было попытаться просчитать на компьютере, но иногда расчет шел слишком медленно и не позволял получить ответ. Поэтому внимание ученых сместилось к поиску эффективных алгоритмов. И математики, и компьютерщики были кровно заинтересованы в получении алгоритмов, которые действительно позволяли бы за разумный промежуток времени получить ответ.
Если алгоритм имеется, относительно несложно оценить, сколько времени (измеряемого числом необходимых вычислительных операций) потребуется на решение задачи при определенном количестве входных данных. Это может требовать усилий и технических навыков, но зато вам известно, о каком именно процессе идет речь и, по крайней мере в общих чертах, что он делает. Гораздо сложнее разработать эффективный алгоритм, если тот, с которого вы начали, неэффективен. Еще сложнее решить, насколько плохим или хорошим может быть наилучший с точки зрения эффективности алгоритм для данной задачи, — ведь для этого нужно рассмотреть все возможные варианты, а вам неизвестно, что они собой представляют.
Первые работы по этому вопросу привели к грубому, но удобному разделению алгоритмов на эффективные (в простом, но неточном смысле) и неэффективные. Если продолжительность расчетов с увеличением количества входных данных растет относительно медленно, данный алгоритм эффективен, а задача проста. Если же продолжительность расчетов с увеличением количества входных данных растет очень быстро, то данный алгоритм неэффективен, а задача сложна. Опыт подсказывает, что, хотя встречаются задачи, которые в этом смысле можно назвать простыми, большинство задач к таковым не относятся и являются сложными. В самом деле, если бы все математические задачи были простыми, математики остались бы без работы. Соответствующая задача тысячелетия заключается в том, чтобы строго доказать, что существует по крайней мере одна сложная задача или что, вопреки нашему опыту, все задачи являются простыми. Эта задача известна как задача P/NP, и никто пока не представляет, как ее нужно решать.
В главе 2 мы уже сталкивались с приближенной оценкой эффективности. Алгоритм относится к классу P, если он имеет полиномиальное время работы. Иными словами, если число шагов, которые необходимо сделать для получения ответа, пропорционально количеству входных данных в какой-либо постоянной степени (скажем, в квадрате или кубе). Такие алгоритмы эффективны в самом широком смысле. Если входные данные представлены числом, то их количество — это не само число, а количество знаков в нем. Причина в том, что количество информации, необходимой для представления числа, соответствует месту, которое оно занимает в памяти компьютера, а это место пропорционально количеству цифр. Задача относится к классу P, если существует алгоритм класса P, который ее решает.
Любой другой алгоритм (или задача) принадлежит к классу не-P, и большинство таких алгоритмов неэффективны. Среди них есть алгоритмы, время работы которых экспоненциально по отношению к входным данным, т. е. примерно равно некоему фиксированному числу в степени, соответствующей размеру входных данных. Такие алгоритмы относятся к классу E и определенно неэффективны.
p>Некоторые алгоритмы настолько эффективны, что выполняют работу намного быстрее, чем за полиномиальное время. К примеру, чтобы определить четность или нечетность числа, достаточно посмотреть на его последнюю цифру. Если (в десятичной записи) это цифра 0, 2, 4, 6 или 8, число — четное, в противном случае — нечетное. Весь алгоритм включает в себя не более шести шагов:Последняя цифра — 0? Если да, то СТОП. Число четное.
Последняя цифра — 2? Если да, то СТОП. Число четное.
Последняя цифра — 4? Если да, то СТОП. Число четное.
Последняя цифра — 6? Если да, то СТОП. Число четное.
Последняя цифра — 8? Если да, то СТОП. Число четное.
СТОП. Число нечетное.
Итак, время выполнения программы ограничено шестью шагами, вне зависимости от размера входных данных. Такой алгоритм относится к классу алгоритмов «постоянного времени».
Расстановка слов в списке в алфавитном порядке представляет собой задачу класса P. Простейший способ выполнить эту задачу — это так называемый «пузырьковый» метод, получивший название потому, что слова, находящиеся ниже по списку, чем следует, при этом «всплывают» вверх, как пузырьки в стакане газировки. Алгоритм раз за разом просматривает список, сравнивает соседние слова и меняет их местами, если порядок не соответствует алфавитному. Пусть, к примеру, список вначале выглядит так:
РОГ ДОМ БОТ АКТ
Сначала происходит следующее:
ДОМ РОГ БОТ АКТ
ДОМ БОТ РОГ АКТ
ДОМ БОТ АКТ РОГ
Полужирным шрифтом выделены те слова, сравнение которых проводилось только что и которые были (или не были) переставлены. При втором проходе получаем:
БОТ ДОМ АКТ РОГ
БОТ АКТ ДОМ РОГ
БОТ АКТ ДОМ РОГ
Третий проход:
АКТ БОТ ДОМ РОГ
АКТ БОТ ДОМ РОГ
АКТ БОТ ДОМ РОГ
На четвертом проходе ничего не происходит, так что мы понимаем, что программа завершила работу. Обратите внимание, как слово АКТ постепенно всплывает вверх (т. е. к началу списка).
Если в списке четыре слова, алгоритм на каждом шагу проводит три сравнения, а всего шагов получается четыре. Если слов в списке n, то на каждом проходе проводится n 1 сравнение, а проходов необходимо n, так что всего требуется n (n 1) шагов. Это чуть меньше, чем n, так что время работы программы полиномиально, более того, квадратично. Алгоритм может прекратить работу раньше, но в самом худшем случае, если окажется, что слова в списке стоят точно в обратном порядке, ему потребуется n (n 1) шагов. Пузырьковый алгоритм сортировки очевиден и относится к классу P, но это далеко не самый эффективный алгоритм. Самый быстрый алгоритм сортировки — алгоритм сравнения — организован более хитро и выполняется за nlogn шагов.
Простой алгоритм с экспоненциальным временем работы — алгоритм класса E — это, к примеру, задание «распечатать список всех n-значных двоичных чисел». В таком списке 2n чисел, и на печать (и вычисление) каждого уходит примерно n шагов, так что полное время работы составляет приблизительно 2nn, что больше, чем 2n, но меньше, чем 3n для достаточно больших n. Однако это довольно глупый пример, поскольку медленным его делает не сложность вычислений, а всего лишь размер выходных данных, и позже это наблюдение окажется весьма важным.
Более типичный алгоритм класса E решает задачу о коммивояжере. Этот странствующий продавец должен посетить некоторое количество городов. Делать это он может в произвольном порядке. Какой путь следует избрать, чтобы суммарное расстояние оказалось минимальным? Наивный способ решения этой задачи состоит в том, чтобы выписать все возможные маршруты, рассчитать для каждого суммарное расстояние и найти минимальное из всех. Для n городов у нас получится
n! = n (n — 1) (n — 2) … 3 2 1
маршрутов (читается «n факториал»). Эта величина растет быстрее, чем любая экспоненциальная величина{37}. Более эффективный метод, известный как динамическое программирование, позволяет решить задачу о коммивояжере за экспоненциальное время. Первый подобный метод — алгоритм Хелда — Карпа — находит кратчайший маршрут за 2nn2 шагов; при достаточно больших n это опять же попадает в интервал между 2n и 3n.
Несмотря на то что эти алгоритмы «неэффективны», при помощи специальных уловок можно ускорить расчет в случае, если число городов велико по человеческим меркам, но не слишком велико для применения подобных хитростей. В 2006 г. Д. Эпплгейт, Р. Биксби, В. Шваталь и У. Кук решили задачу о коммивояжере для 85 900 городов. На середину 2012 г. это достижение все еще оставалось рекордным.
Приведенные примеры алгоритмов не просто иллюстрируют концепцию эффективности. Кроме этого, они помогают донести до читателя мысль о сложности нахождения улучшенных алгоритмов и еще большей сложности нахождения алгоритмов максимальной эффективности. Все известные алгоритмы для задачи о коммивояжере относятся к классу E экспоненциального времени, но это не означает, что эффективного алгоритма для нее не существует в принципе. Это лишь показывает, что мы пока такого алгоритма не нашли. И здесь возможны два варианта: мы не нашли лучшего алгоритма потому, что нам не хватает ума, или мы не нашли лучшего алгоритма потому, что его попросту не существует.
Можно вспомнить все ту же вторую главу. Пока команда Агравала не придумала свой алгоритм класса P для проверки на простоту, наилучший известный алгоритм принадлежал классу не-P. Тем не менее он тоже был достаточно хорош, считал за время nlogn для n-значных чисел, а это, вообще говоря, лучше, чем показатели алгоритма Агравала — Каяла — Саксены, пока мы не достигаем чисел с 101000 знаками. До открытия этого алгоритма мнения о статусе испытания на простоту разделялись. Некоторые специалисты считали, что это задача класса P и подходящий алгоритм рано или поздно будет найден. Другие были уверены, что этого не произойдет. Новый алгоритм возник практически ниоткуда: его породила одна из бесчисленных идей, которые можно было попробовать, и данная конкретная идея сработала. Это отрезвляющий прецедент: мы не знаем истинного положения вещей, не можем предсказать его заранее, и догадки лучших экспертов могут быть как верными, так и ошибочными.
Великая задача, которая нас в данный момент интересует, заключается в поиске ответа на более фундаментальный вопрос. Существуют ли сложные задачи? Могут ли все задачи оказаться простыми, если, конечно, приложить достаточно ума и сообразительности? На самом деле здесь есть одна тонкость, потому что мы уже видели одну несомненно сложную задачу: распечатку списка всех n-значных двоичных чисел. Я уже упоминал о том, что это глупый пример: сложность заключается не в расчетах, а в простой монотонной работе по распечатке очень длинного ответа. Нам известно, что никакие уловки здесь не помогут, поскольку ответ будет таким длинным по определению. Если бы он был короче, он не был бы ответом.
Чтобы поставить вопрос разумным образом, необходимо исключить подобные тривиальные примеры. Для этого введем еще один класс алгоритмов, класс NP. Это не класс не-P — это класс алгоритмов, работа которых занимает недетерминированное полиномиальное время. В переводе с математического это означает, что, сколько бы времени ни требовалось алгоритму на поиск ответа, убедиться в верности этого ответа мы можем за полиномиальное время. Задача поиска ответа может быть сложной, но если ответ найден то существует простой способ проверки его корректности.
Слово «недетерминированный» здесь используется потому, что существует возможность решить NP-задачу при помощи просто вдохновенной догадки. Сделав это, можно проверить и убедиться, что ответ действительно верен (или нет). К примеру, если задача заключается в разложении на простые множители числа 11 111 111 111, то вы можете предположить, что одним из множителей является простое число 21 649. Пока это всего лишь догадка, однако ее легко проверить: достаточно разделить исходное число на 21 649 и посмотреть, что получится. Частное равняется 513 239 точно, без остатка. Таким образом, ваша догадка оказалась верной. А если бы я догадался, что делителем должно быть 21 647 — тоже простое число, то деление привело бы к ответу 513 286 с остатком 9069. Таким образом, догадка оказалась бы неверной.
В данном случае правильное предположение можно сделать только чудом или при помощи обмана (я, кстати, прежде чем высказывать «предположение», разложил 11 111 111 111 на простые множители). Но, по существу, мы хотим именно этого. Если бы наша догадка не была чудесной, то можно было бы превратить алгоритм класса NP в алгоритм класса P очень простым способом: нужно было бы делать предположения одно за другим до тех пор, пока одно из них не оказалось бы верным. Мой пример позволяет увидеть, что так не получится: понадобилось бы слишком много попыток. В самом деле, то, что мы пытаемся делать, это всего лишь «пробное деление» на все возможные простые числа до тех пор, пока одно из них не сработает. Из главы 2 мы знаем, что это далеко не лучший способ искать делители.
Класс NP исключает глупые примеры вроде уже упоминавшегося очень длинного списка. Если кто-то в порыве вдохновения выдаст список всех n-значных двоичных чисел, то экспоненциальное время уйдет не только на то, чтобы их распечатать, но и на то, чтобы их прочесть, и еще больше времени — на то, чтобы проверить список. Это потребовало бы громадных корректорских усилий. Класс P определенно входит составной частью в класс NP. Если ответ можно найти за полиномиальное время, да еще с гарантией его корректности, то это будет означать, что вы его уже проверили. Так что проверка автоматически может быть произведена за полиномиальное время. Если бы кто-то представил вам предполагаемый ответ, то вы могли бы просто прогнать весь алгоритм еще раз — это и стало бы проверкой.
Теперь мы можем сформулировать задачу тысячелетия. Превосходит ли класс NP по размеру класс P или они суть одно и то же? Или короче: равен ли класс P классу NP?
Если ответ «да», то это значит, что существует принципиальная возможность отыскать быстрые и эффективные алгоритмы для автоматического составления расписаний авиарейсов, оптимизации работы завода, выполнения миллиона других важных практических задач. Если ответ «нет», то у нас будет железная гарантия того, что все вроде бы сложные задачи на самом деле сложны, и мы сможем остановиться и не тратить больше времени на поиск быстрых алгоритмов для них. В том и другом случае мы выигрываем. А вот не знать, как в реальности обстоят дела, очень неприятно.
Математикам было бы гораздо легче жить, если бы ответ был «да», поэтому пессимист, живущий в каждом человеческом существе, не может не заподозрить, что на самом деле все не так просто и ответ, скорее всего, окажется «нет». В противном случае мы все получаем бесплатный бонус, который ничем не заработали и которого не заслуживаем. Я, правда, подозреваю, что большинство математиков предпочло бы, чтобы ответ оказался «нет», потому что в этом случае им была бы гарантирована работа до конца времен. Математики самоутверждаются, решая сложные задачи. В общем, по разным причинам большинство математиков и компьютерщиков ожидают, что ответ на вопрос «Совпадает ли P с NP?» будет «Нет». И мало кто ждет, что ответом на самом деле окажется «да».
Помимо этого, возможны еще два варианта. Не исключено, что можно доказать эквивалентность P и NP, не находя в реальности полиномиальных алгоритмов для каждой конкретной NP-задачи. Математике свойственно предлагать нам неконструктивные доказательства существования: они утверждают, что нечто существует, но не говорят, что оно собой представляет и как его найти. В качестве примеров можно назвать методы проверки на простоту, которые бодро сообщают нам, что данное число не является простым, но не называют ни одного конкретного делителя, или теоремы теории чисел, уверяющие нас, что решения некоего диофантова уравнения ограничены, т. е. не превосходят некоторого предела, но не называющие никакого конкретного ограничения. В конце концов, полиномиальный алгоритм может быть настолько сложным, что записать его, в принципе, невозможно. Тогда естественный пессимизм в отношении бесплатного сыра окажется оправдан даже при положительном ответе на вопрос.
Некоторые исследователи высказываются еще более резко: они считают, что вопрос может оказаться нерешаемым в рамках современной математики, ограниченной формальной логикой. Если так, то невозможно доказать ни да ни нет. Не потому, что мы слишком глупы, чтобы найти доказательство, а потому, что такового не существует. Эта идея появилась на свет в 1931 г., когда Курт Гедель выпустил кошку противоречивости охотиться в стаю философских голубей, населявших подвалы математики (он доказал, что некоторые заявления в арифметике неразрешимы). В 1936 г. Алан Тьюринг нашел неразрешимую задачу попроще — задачу об остановке машины Тьюринга. Всегда ли при заданном алгоритме существует доказательство либо того, что машина остановится, либо того, что она будет считать вечно? Как ни удивительно, ответ Тьюринга был «нет». Для некоторых алгоритмов не существует доказательства ни того ни другого. Не исключено, что задача P/NP окажется такой же. Это объяснило бы, почему никто не может ни доказать, ни опровергнуть соответствующее утверждение. Но никто не может также доказать или опровергнуть утверждение о том, что задача P/NP неразрешима. Может быть, ее неразрешимость сама по себе неразрешима…
Самый очевидный подход к задаче P/NP состоит в том, чтобы выбрать какую-нибудь задачу, о которой известно, что она относится к классу NP, предположить существование полиномиального алгоритма ее решения — и каким-то образом прийти к противоречию. Некоторое время математики пытались применить эту методику к различным задачам, но в 1971 г. Стивен Кук понял, что выбор задачи часто не играет никакой роли. С определенной точки зрения все подобные задачи — с точностью до некоторых технических особенностей — совершенно равноправны. Кук ввел понятие NP-полной задачи. Такая NP-задача обладает следующим свойством: если для ее решения существует алгоритм класса P, то любая NP-задача может быть решена при помощи алгоритма класса P.
Кук нашел несколько NP-полных задач, включая SAT — задачу о выполнимости булевых формул. В ней спрашивается, можно ли сделать заданное логическое выражение истинным при помощи подходящего выбора значений (истинности или ложности) его переменных. Кроме того, он получил более глубокий результат: задача SAT с дополнительными ограничениями (3-SAT) также является NP-полной. Здесь логическая формула должна быть записана в виде «A, или B, или C, или… или Z», где A, B, C…Z — логические формулы, содержащие по три переменные. Спешу добавить, что переменные не обязаны каждый раз быть одними и теми же. Большинство доказательств того, что та или иная задача является NP-полной, восходят к теореме Кука о 3-SAT.
Определение Кука подразумевает, что все NP-полные задачи существуют на равных основаниях. Доказать, что одна из них на самом деле относится к классу P, означает доказать, что к классу P относятся все такие задачи. Это открывает некоторые тактические возможности: может оказаться, что с некоторыми NP-полными задачами работать проще, чем с остальными. Но стратегически это означает, что с тем же успехом можно выбрать любую конкретную NP-полную задачу и работать именно с ней. Все NP-полные задачи ведут себя одинаково, и поэтому на любой из них можно моделировать все остальные. А любую NP-задачу можно конвертировать в частный случай NP-полной задачи при помощи процедуры «шифрования» — с использованием шифра, на применение которого требуется полиномиальное время.
Чтобы представить себе характер этой процедуры, рассмотрим типичную NP-полную задачу: поиск гамильтонова цикла в сети. Требуется найти замкнутый маршрут по ребрам сети, которые прошел бы через каждый узел (т. е. через каждую точку) ровно один раз. «Замкнутый» означает, что в конце концов маршрут возвращается в начальную точку. Размер входных данных здесь — это число ребер, меньшее или равное квадрату числа точек, поскольку каждое ребро соединяет две точки. (Считаем, что любую заданную пару соединяет не больше одного ребра.) Нам не известно ни одного алгоритма класса P, который решал бы эту задачу, но предположим — гипотетически, — что такой алгоритм существует. Теперь выберем какую-нибудь другую задачу и назовем ее задачей X. Пусть задача X может быть переформулирована в терминах поиска такого маршрута в некоей сети, связанной с задачей X. Если метод перевода данных задачи X в данные об этой сети и наоборот, может быть применен за полиномиальное время, то мы автоматически получаем алгоритм класса P для задачи X. Примерно так:
1. Переводим задачу X в задачу поиска гамильтонова цикла в связанной с задачей сети. Это можно сделать за полиномиальное время.
2. Находим такой цикл за полиномиальное время при помощи того самого гипотетического алгоритма для задачи с сетью.
3. Переводим полученный гамильтонов цикл обратно в решение задачи X, что опять же можно проделать за полиномиальное время.
Поскольку все три полиномиальных шага вместе можно проделать тоже за полиномиальное время, этот алгоритм относится к классу P.
Чтобы показать, как это работает, я рассмотрю менее амбициозную версию задачи о поиске гамильтонова цикла, где искомый маршрут не обязан быть замкнутым. В таком виде она называется задачей о поиске гамильтонова пути. Сеть может иметь гамильтонов путь и при этом не иметь цикла (см. пример на рис. 42 слева). Так что решение задачи о поиске гамильтонова цикла может не означать решения задачи о поиске гамильтонова пути. Однако задачу о поиске гамильтонова пути можно переформулировать в задачу о поиске гамильтонова цикла на близкой, но несколько иной сети. Для этого в сеть добавляется одна дополнительная точка, соединенная со всеми точками первоначальной сети, как на рис. 42 справа. Любой гамильтонов цикл в новой сети может быть превращен в гамильтонов путь: для этого достаточно исключить из него добавленный узел и два подходящих к нему ребра цикла. И наоборот, любой гамильтонов путь в первоначальной сети дает цикл в новой: достаточно просто соединить два конца пути с новой точкой. Это «превращение» задачи о поиске пути в задачу о поиске цикла вводит в сеть всего одну новую точку и по одному ребру на каждую точку первоначальной сети, так что эта процедура — и обратная ей тоже — выполняется за полиномиальное время.
Конечно, я здесь всего лишь зашифровал одну конкретную задачу, превратив ее в задачу о поиске гамильтонова цикла. Чтобы доказать, что такая задача является NP-полной, нам нужно проделать то же самое с любой NP-задачей. Это реально: первое доказательство нашел Ричард Карп в 1972 г. в знаменитой статье, где доказывалась NP-полнота 21 различной задачи.
Задача о коммивояжере является «почти» NP-полной, но здесь есть одна техническая сложность: мы не знаем, относится ли она к классу NP. Известно более 300 конкретных NP-полных задач в различных областях математики, включая логику, теорию графов, комбинаторику и оптимизацию. Доказать, что любая из них может (или не может) быть решена за полиномиальное время, означало бы доказать то же для всех них без исключения. Несмотря на богатство выбора, задача P/NP по-прежнему остается открытой. И я бы не удивился, если бы узнал, что она останется таковой и 100 лет спустя.
12. Потоковое мышление. Уравнение Навье — Стокса
Пять из семи задач тысячелетия, включая и три задачи, о которых мы уже говорили, относятся к чистой математике, хотя задача P/NP фундаментальна и для теории вычислительных систем. Оставшиеся две принадлежат к прикладной математике и современной математической физике. Задача из прикладной математики возникает из стандартного уравнения для потока жидкости — уравнения Навье — Стокса, названного в честь французского инженера и физика Клода-Луи Навье и ирландского математика и физика Джорджа Стокса. Уравнение Навье — Стокса — это уравнение в частных производных; следовательно, в нем учитывается скорость изменения характера потока как в пространстве, так и во времени. Большинство важнейших уравнений классической прикладной математики — это уравнения в частных производных (нам уже встречалось одно из таких уравнений — уравнение Лапласа); остальные — обыкновенные дифференциальные уравнения, учитывающие скорость изменения параметров только во времени.
В главе 8 мы видели, что движение тел в Солнечной системе определяется законом всемирного тяготения и законами динамики Ньютона. Эти законы связывают ускорение Солнца, Луны и планет с действующими на них гравитационными силами. Ускорение — это быстрота изменения скорости во времени, а скорость — характеристика изменения положения тела во времени. Это обычное дифференциальное уравнение. Как мы видели, решение таких уравнений может быть очень сложным делом. Как правило, решать дифференциальные уравнения в частных производных намного сложнее.
Если говорить о практических целях, то уравнения движения в Солнечной системе могут быть решены численно при помощи компьютеров. Это тоже непросто, но сегодня уже существуют хорошие методы. То же самое можно сказать и о решении в практических целях уравнений Навье — Стокса. Используемые при этом методики известны как вычислительная гидрогазодинамика и применяются для решения многих важных задач: конструирования самолетов, расчета аэродинамики автомобилей и даже в медицине (например, для расчета тока крови в организме человека).
Задача тысячелетия не просит математиков найти явные решения уравнения Навье — Стокса, поскольку это, по существу, невозможно. Не имеет она отношения и к численным методам решения этих уравнений, несмотря на всю их важность. Вместо этого в задаче требуется найти доказательство фундаментального теоретического свойства: существования решений. При заданном состоянии жидкости в определенный момент времени — при известных характеристиках ее движения — существует ли решение уравнения Навье — Стокса, верное для всего будущего времени начиная с рассматриваемого момента? Интуиция подсказывает, что ответ на этот вопрос должен быть «да», потому что данное уравнение — очень точная модель физики реальной жидкости. Однако с точки зрения математики вопрос существования решения не так очевиден, и это фундаментальное свойство для уравнения Навье — Стокса пока не доказано. А возможно, ответ все же «нет», и решения не существует.
Уравнение Навье — Стокса описывает, как меняется со временем в заданных условиях распределение скоростей в жидкости. О нем часто говорят во множественном числе как об уравнениях Навье — Стокса, но дела это не меняет. Множественное число отражает классический подход: в трехмерном пространстве скорость складывается из трех компонент; в классической теории на каждую компоненту приходится по одному уравнению, а всего их получается три. С современной точки зрения существует всего одно уравнение для вектора скорости (величины, которую характеризует не только размер, но и направление), но это уравнение приложимо к каждой из трех компонент скорости. На сайте Института Клэя используется классическая терминология, но здесь я буду следовать современной практике. Я говорю об этом заранее, чтобы избежать возможной путаницы.
Уравнение датируется 1822 г., когда Навье впервые записал уравнение в частных производных для потока вязкой — липкой — жидкости. Стокс внес свой вклад в 1842 и 1843 гг. Эйлер записал уравнение в частных производных для жидкости с нулевой вязкостью — совершенно не липкой — в 1757 г. Это уравнение тоже полезно, но большинство реальных жидкостей, включая воду и воздух, являются вязкими, поэтому Навье и Стокс модифицировали уравнение Эйлера таким образом, чтобы учесть это свойство. Они вывели примерно одинаковые уравнения независимо друг от друга, поэтому оно названо в честь их обоих. Навье сделал в процессе вывода несколько математических ошибок, но получил верный ответ, а у Стокса с математикой все было в порядке, и именно поэтому мы знаем, что ответ Навье верен, несмотря на ошибку. В самой общей форме уравнение применимо к сжимаемым жидкостям, таким как воздух. Однако существует и важный частный случай, при котором жидкость считается несжимаемой. Эта модель применима к таким жидкостям, как вода, которая под очень большим давлением все же сжимается, но лишь чуть-чуть.
Существует два способа составить математическое описание потока жидкости: можно либо описать маршрут движения каждой частицы жидкости со временем, либо описать скорость потока в каждой точке пространства и в каждый момент времени. Эти два описания связаны между собой: имея одно, можно (не без труда) вывести и второе. И Эйлер, и Навье, и Стокс использовали второй подход, потому что уравнение в этом случае получается гораздо более удобным и решаемым. Так что в их уравнениях фигурирует поле скоростей жидкости. В каждый конкретный момент времени поле скоростей точно определяет скорость и направление каждой частицы жидкости. По ходу времени это описание может меняться, именно поэтому в уравнении присутствуют скорости изменения параметров как в пространстве, так и во времени.
Уравнение Навье — Стокса имеет отличную физическую родословную. Оно основано на законах Ньютона, примененных к каждой крохотной частице (небольшой области) жидкости, и выражает в данном контексте закон сохранения импульса. Каждая частица движется, потому что на нее действуют силы, а закон движения Ньютона гласит, что ускорение частицы пропорционально действующей на нее силе. Основными силами являются трение, вызванное вязкостью, и давление. Присутствуют также силы, порожденные ускорением частицы. В соответствии с классической традицией уравнение описывает жидкость как бесконечно делимую массу. В частности, оно игнорирует дискретность атомной структуры жидкости в микромасштабе.
Уравнения сами по себе не имеют особой ценности: их надо еще научиться решать. Для уравнения Навье — Стокса решение означает расчет поля скоростей: скорости и направлении движения жидкости в каждой точке пространства в каждый момент времени. Уравнение налагает ограничения на эти величины, но не определяет их непосредственно. Вместо этого мы должны при помощи этого уравнения соотносить будущие скорости с текущими. Уравнения в частных производных, такие как уравнение Навье — Стокса, имеют много разных решений; точнее говоря, бесконечно много. И это неудивительно: жидкости способны течь очень по-разному: ток жидкости по капоту автомобиля отличается от тока жидкости по крылу самолета в полете. Существует два способа выбрать конкретный поток из бесконечного множества возможностей: используя либо начальные, либо граничные условия.
Начальные условия определяют поле скорости в какой-то конкретный момент времени; обычно его считают нулевым. Физически идея состоит в том, что если вам известно поле скорости в этот момент, то уравнение Навье — Стокса однозначно определяет это поле через очень короткий промежуток времени. Если для начала вы дадите жидкости толчок, она будет двигаться до тех пор, пока это не будет противоречить законам физики. Граничные условия более полезны в большинстве приложений, потому что начальные условия трудно обеспечить в реальной жидкости, да и вообще, они не слишком подходят для применения, скажем, в автомобильном дизайне. Там главное — форма машины. Вязкие жидкости прилипают к поверхностям. Математически это моделируется определением скорости на этих поверхностях, образующих границу занятой жидкостью области, а именно в ней уравнение действительно. К примеру, мы могли бы потребовать, чтобы скорость на границе была нулевой или наложить какое-то другое условие, которое наилучшим образом моделирует реальность.
Но даже в тех случаях, когда определены начальные или граничные условия, мы очень редко можем написать в явном виде формулу для поля скорости, потому что уравнение Навье — Стокса нелинейно. Сумма двух его решений, как правило, не является решением. Это, кстати, одна из причин, по которым задача трех тел из главы 8 настолько сложна, хотя это не единственная причина, ведь задача двух тел тоже нелинейна, но тем не менее решается в явном виде.
Для практических целей мы всегда можем решить уравнение Навье — Стокса на компьютере, представив поле скорости в виде набора чисел. Этот набор чисел можно очень наглядно представить в графическом виде и использовать для расчета величин, которые в первую очередь интересуют инженеров: к примеру, напряжений, возникающих в крыле самолета. Поскольку компьютеры не умеют работать с бесконечным количеством чисел и не могут проводить вычисления с бесконечной точностью, нам приходится заменять реальный поток его дискретной аппроксимацией, т. е. набором чисел, представляющих поток в конечном числе точек и моментов времени. При этом очень важно, чтобы аппроксимация была достаточно качественной.
Обычный подход состоит в том, чтобы разделить пространство на большое число маленьких областей, образовав таким образом расчетную сетку. Скорость при этом вычисляется только в узлах этой сетки. Сама сетка может состоять из обычных квадратов (или кубов, если речь идет о трех измерениях), как шахматная доска, но для расчета автомобилей или самолетов она должна быть более сложной и иметь вблизи границы ячейки помельче, позволяющие уловить более тонкие детали происходящего. Сетка может быть динамической и менять форму с ходом времени. Обычно считается, что время идет дискретно, небольшими шагами, иногда одинаковыми, а иногда меняющими длительность в соответствии с ходом расчетов.
Основой большинства численных методов служит то, как «скорость изменения» определяется в дифференциальном исчислении. Предположим, некий объект сдвигается из одной точки в другую за очень короткий промежуток времени. Тогда скорость изменения положения — собственно скорость — есть изменение положения, деленное на время, которое на это потребовалось. При этом возникает небольшая ошибка, которая постепенно исчезает, по мере того как укорачивается промежуток времени. Поэтому мы можем аппроксимировать скорость изменения, входящую в уравнение Навье — Стокса, этим отношением изменения пространственного положения к изменению времени. В результате уравнение говорит нам, как провести известное начальное состояние — заданный набор скоростей — на один временной шаг вперед, в будущее. Примерно так же можно аппроксимировать решения, когда ситуация определяется граничными условиями. Существует также много хитрых способов добиться того же результата с большей точностью.
Чем мельче ячейки расчетной сетки и короче промежутки времени, тем точнее становится аппроксимация. Однако и вычислительный процесс при этом занимает больше времени. Так что приходится искать компромисс между точностью и скоростью. В широком смысле можно сказать, что приближенный ответ, полученный при помощи компьютера, скорее всего, окажется приемлемым, если в потоке нет значимых черт меньших по размеру, чем размер ячейки расчетной сетки. Существует два типа потока — ламинарный и турбулентный. В ламинарном потоке движение идет плавно, а слои жидкости скользят один относительно другого свободно, без трения. Здесь сетки с некрупными ячейками должно быть достаточно. Турбулентный поток — бурный и пенистый, и токи жидкости в нем перемешиваются чрезвычайно сложным образом. В подобных обстоятельствах дискретная сетка, какой бы частой она ни была, может не решить проблему.
Одна из особенностей турбулентного потока — присутствие вихрей, похожих на крохотные водовороты. Стандартное изображение турбулентности представляет собой каскад все более мелких вихрей. Большая часть деталей в таком потоке меньше по размеру, чем ячейка любой реальной сетки. Чтобы обойти эту сложность, инженеры в практических вопросах, касающихся турбулентных потоков, часто прибегают к статистическим моделям. Еще одна проблема заключается в том, что физическая модель жидкости может оказаться непригодной к рассмотрению турбулентных потоков, потому что вихри могут уменьшаться до атомных размеров. Однако сравнение численных расчетов и экспериментальных данных показывает, что уравнение Навье — Стокса — это очень реалистичная и точная модель. Она настолько хороша, что сегодня во многих инженерных приложениях целиком полагаются на вычислительную гидрогазодинамику: по сравнению с дорогими натурными экспериментами в аэродинамических трубах с использованием масштабных моделей компьютерные расчеты очень дешевы. Однако в вопросах, от которых зависит безопасность людей (к примеру, при проектировании самолетов), подобные экспериментальные проверки проводятся до сих пор.
Уравнения Навье — Стокса настолько точны, что приложимы, судя по всему, даже там, где с точки зрения физики вполне могли бы отказывать: в турбулентном потоке. По крайней мере так дело обстоит в случае, если уравнение может быть решено с достаточной точностью. Главная проблема здесь имеет практический характер: когда поток становится турбулентным, численные методы решения уравнения начинают поглощать громадное количество компьютерного времени. Кроме того, мельчайшие структуры всегда ускользают от «внимания» компьютера.
Математики очень не любят, когда информация о задаче, которой они располагают, основывается на каком бы то ни было приближении. Задача тысячелетия, связанная с уравнением Навье — Стокса, призвана решить один из ключевых теоретических вопросов. Если бы удалось найти ответ на него, интуитивное представление о том, что численные методы здесь прекрасно работают, получило бы мощнейшее подкрепление. Существует тонкая разница между приближениями, которые использует компьютер (он вносит в уравнение крохотные изменения), и точностью ответа (здесь речь идет о крохотных изменениях в решении). Можно ли сказать, что точный ответ на приближенно поставленный вопрос — то же самое, что приближенный ответ на точно поставленный вопрос? Иногда ответ бывает «нет». Точные данные о потоке жидкости с очень низкой вязкостью, к примеру, часто не совпадают с приближенными данными о потоке жидкости с нулевой вязкостью.
Есть один шаг к осмыслению подобных проблем, который настолько очевиден и прост, что его легко можно проглядеть: речь идет о доказательстве того факта, что точное решение существует. Ведь согласитесь, должно существовать нечто, аппроксимацией чего являются компьютерные расчеты. Именно этим объясняется включение уравнения Навье — Стокса в число задач тысячелетия. Его официальное описание на сайте Института Клэя состоит из четырех отдельных задач. Решения любой из них будет достаточно для получения приза. Во всех четырех задачах жидкость считается несжимаемой. Вот эти задачи:
1. Существование и гладкость решений в трех измерениях. Здесь предполагается, что жидкость занимает бесконечное пространство целиком. При заданном первоначальном гладком поле скорости требуется доказать, что для любого положительного момента времени существует гладкое решение уравнения, совпадающее с заданным первоначальным полем.
2. Существование и гладкость решений на трехмерном плоском торе. Тот же вопрос, но теперь в предположении, что пространство представляет собой плоский тор — прямоугольник с отождествленными противоположными сторонами. В этой версии обходятся потенциальные проблемы, связанные с бесконечным пространством, о котором шла речь в первой версии; это пространство не соответствует реальности и может вызвать неправильное поведение системы по причинам, не имеющим непосредственного отношения к задаче.
3. Опровержение существования решений в трех измерениях. Опровергнуть пункт 1. Иными словами, найти начальное поле, для которого не существует гладкого решения в любой положительный момент времени, и доказать это утверждение.
4. Опровержение существования решений на трехмерном плоском торе. Доказать, что пункт 2 неверен.
Те же вопросы остаются открытыми и для уравнения Эйлера, которое, в сущности, эквивалентно уравнению Навье — Стокса, но не учитывает вязкости. За ответы на вопросы по уравнению Эйлера, однако, никто никаких призов не обещает.
Серьезная сложность здесь заключается в том, что рассматриваемый поток трехмерен. Существует аналогичное уравнение для жидкости, текущей по плоскости. Физически это может быть либо тонкий слой жидкости между двумя пластинами (считается, что они не вызывают трения), либо такой характер потока в трех измерениях, при котором жидкость движется совершенно идентичным образом вдоль системы параллельных плоскостей. В 1969 г. русский математик Ольга Ладыженская доказала, что для двумерного уравнения Навье — Стокса и двумерного уравнения Эйлера пункты 1 и 2 верны, а 3 и 4 — ложны.
Может показаться удивительным, но для уравнения Эйлера доказательство сложнее, чем для уравнения Навье — Стокса, хотя само уравнение проще, поскольку в нем не учитывается вязкость. Причина, надо сказать, весьма поучительная. Вязкость «снимает» вероятность того, что решение может привести к возникновению сингулярности, а та, в свою очередь, не позволит решению существовать в каждый момент времени. Если условие вязкости отсутствует, этого не происходит, что сказывается на математических характеристиках доказательства существования.
Ладыженская внесла еще одно важное дополнение в наши представления об уравнении Навье — Стокса, доказав не только, что решения существуют, но и что определенные вычислительные гидрогазодинамические модели аппроксимируют их с любой нужной нам точностью.
Задачи на приз тысячелетия относятся к несжимаемому потоку, поскольку хорошо известно, что сжимаемые потоки ведут себя отвратительно. В уравнениях движения самолета, к примеру, возникает множество проблем, если самолет движется в потоке воздуха быстрее звука. Это знаменитый «звуковой барьер», очень беспокоивший в свое время инженеров, которые работали над проектами сверхзвуковых истребителей. Эта проблема связана с хорошей сжимаемостью воздуха. Если тело движется сквозь несжимаемую жидкость, оно расталкивает частицы этой жидкости в стороны со своего пути, как если бы это были шарики. Если частицы накапливаются, они замедляют тело. Но в сжимаемой жидкости, где существует предел скорости движения волн (а именно скорость звука), этого не происходит. На сверхзвуковых скоростях, вместо того чтобы расходиться в стороны, воздух скапливается перед самолетом, и его плотность там растет беспредельно. Результат — ударная волна. Математически это нарушение непрерывности давления воздуха, которое резко меняет значение на фронте ударной волны. Физически это звуковой удар: громкий хлопок. Ударная волна, если ее не учитывают, может повредить самолет, так что конструкторы волновались не зря. Однако скорость звука — не непреодолимый барьер, а всего лишь препятствие. Ее существование говорит о том, что уравнение Навье — Стокса для сжимаемой жидкости не обязательно имеет гладкие решения на всем диапазоне времен даже в двух измерениях. Так что в этом случае ответ известен заранее, и он отрицателен.
Математика ударной волны — большой раздел среди уравнений частных производных, несмотря на разрывы в решениях. Хотя уравнение Навье — Стокса само по себе не является хорошей физической моделью для сжимаемых жидкостей, математическую модель можно модифицировать, добавив к уравнениям дополнительные условия, которые помогут учесть ударную волну и нарушение непрерывности в ней. Но в потоке несжимаемой жидкости ударные волны не возникают, так что можно по крайней мере предположить, что в этом случае решения должны существовать для каждого момента времени, каким бы сложным (но обязательно гладким) ни было начальное состояние потока.
Кое-какие положительные результаты для трехмерного уравнения Навье — Стокса уже имеются. Если в начальном состоянии поток характеризуется достаточно маленькими скоростями, т. е. течет вяло и очень медленно, то и первое, и второе утверждения верны. Эти утверждения верны даже при больших скоростях — на протяжении некоторого ненулевого промежутка времени. Неизвестно, существует ли решение, верное для любого момента в будущем, но есть некоторый промежуток времени, на котором решение существует точно. Может показаться, что эту логику рассуждений можно повторять без конца, продвигая решение вперед во времени на небольшие промежутки и используя всякий раз конечный результат как новое начальное состояние. Проблема с подобным подходом заключается в том, что временные интервалы при этом могут уменьшаться настолько стремительно, что бесконечное число шагов будет укладываться в конечное время. К примеру, если каждый последовательный шаг продвигает решение на половину времени, достигнутого на предыдущем шаге, то весь процесс закончится за время что равняется 2. Если решение прекращает существовать — в настоящее время это чисто гипотетическое предположение, но рассматривать его мы все же можем, то говорят, что решение, о котором идет речь, разрушается. Время, за которое это происходит, называется временем разрушения решения.
Так что в четырех задачах, по существу, спрашивается о том, могут ли решения разрушаться. Если не могут, верны утверждения 1 и 2; если могут — утверждения 3 и 4. Возможно, решения могут разрушаться в бесконечном пространстве, а на конечном плоском торе — не могут. Кстати говоря, если ответ на вопрос 1 положителен, то положителен ответ и на вопрос 2, потому что поток любой структуры на плоском торе можно интерпретировать как пространственно периодический поток в целом бесконечном пространстве. Речь идет о том, чтобы наполнить пространство копиями прямоугольника, о котором идет речь, и в каждом воспроизвести поток в точности той же структуры. Правила склеивания для тора гарантируют, что поток, пересекая эти плоские стыки, остается гладким. Аналогично если верно утверждение 4, то верно и утверждение 3 по той же причине. Мы просто делаем начальное пространство пространственно периодическим. Но, насколько мы сейчас в состоянии сказать, ответ на вопрос 2 может оказаться положительным даже при отрицательном ответе на вопрос 1.
Нам известен, однако, один поразительный факт, касающийся разрушения решений. Если существует решение с конечным временем разрушения, то максимальная скорость жидкости во всех точках пространства должна стать произвольно большой. Это могло бы произойти, к примеру, если бы сформировалась струя и скорость ее росла столь стремительно, что уже через конечный промежуток времени она улетела бы в бесконечность.
Это не чисто гипотетические возражения. Примеры подобного сингулярного поведения наблюдаются в некоторых других уравнениях классической математической физики. Замечательный пример можно найти в небесной механике. В 1988 г. Ся Чжихун доказал, что существует такая начальная конфигурация пяти материальных точек, или точечных масс, в трехмерном пространстве, где действует закон тяготения Ньютона, в которой четыре тела через конечный промежуток времени исчезают в бесконечности — тоже своего рода разрушение, а пятое переживает еще более значительные колебания. Ранее Джозеф Гервер указал, что пять тел на плоскости могут все раствориться в бесконечности за конечное время, но не смог завершить доказательство такого сценария. В 1989 г. он доказал, что разбегание такого рода определенно возможно на плоскости, если число тел достаточно велико.
Замечательно, что такое поведение возможно, ведь в подобных системах действует закон сохранения энергии. Конечно, если все тела движутся произвольно быстро, то полная кинетическая энергия системы должна расти? Ответ в том, что одновременно падает потенциальная энергия, а полная гравитационная потенциальная энергия материальной точки бесконечна. Должен сохраняться еще и момент импульса, но и это возможно, если некоторые из тел движутся все быстрее и быстрее по кругу все уменьшающегося диаметра.
Речь здесь идет о таком физическом явлении, как знаменитый эффект пращи, или гравитационный маневр, часто используемый при отправке исследовательских станций к далеким планетам Солнечной системы. Хороший пример — американский зонд «Галилео», в задачу которого входило долететь до Юпитера и исследовать эту гигантскую планету и ее многочисленные спутники. Зонд был запущен в 1989 г. и достиг цели в 1995 г. Путешествие длилось так долго, в частности, потому, что маршрут его был, мягко говоря, непрямым. Несмотря на то что орбита Юпитера находится дальше от Солнца, чем орбита Земли, «Галилео» в начале своего полета направился внутрь, к Венере. Он прошел вблизи Венеры, вернулся, чтобы пролететь мимо Земли, и отправился дальше в космос «взглянуть» на астероид Гаспра. Затем он вновь сблизился с Землей, еще раз обогнул нашу планету и наконец двинулся к Юпитеру. По пути он сблизился еще с одним астероидом, Идой, и обнаружил у него собственную крошечную луну — новый астероид, получивший название Дактиль.
Почему была выбрана такая извилистая траектория? От каждой встречи с планетой «Галилео» получал энергию и, следовательно, увеличивал скорость. Представьте себе, что космический зонд направляется к планете — не курсом столкновения, но так, чтобы пройти достаточно близко к поверхности и быстро развернуться за ней. После этого его должно вновь выбросить в дальний космос. Когда зонд проходит за планетой, они притягиваются друг к другу. Более того, они все время притягивались друг к другу, но на этой стадии полета сила притяжения становится максимальной и потому производит максимальное действие. Тяготение планеты как бы подталкивает зонд и придает ему дополнительную скорость. Суммарная энергия должна сохраняться, поэтому взамен зонд чуть замедляет движение планеты по орбите вокруг Солнца. Поскольку масса зонда очень мала, а масса планеты, напротив, очень велика, действием зонда на планету можно пренебречь. Действием планеты на зонд пренебречь нельзя: он может ускориться очень заметно.
«Галилео» прошел над поверхностью Венеры на высоте 16 000 км и получил прибавку скорости в 2,23 км/с. После этого он прошел в 960 км от Земли, а затем еще раз в 300 км, во второй раз добавив к своей скорости еще 3,7 км/с. Без этих маневров он не добрался бы до Юпитера, поскольку запускавшая его ракета не смогла бы направить его непосредственно туда. Первоначальный план, кстати говоря, предусматривал именно это: зонд предполагалось запустить на шаттле с кислородно-водородным разгонным блоком Centaur-G. Но катастрофа «Челленджера», когда космический челнок взорвался вскоре после старта, заставила отказаться от этого плана. Использование блока Centaur-G было запрещено. Пришлось воспользоваться для запуска «Галилео» менее мощным твердотопливным блоком IUS. Миссия была весьма успешна, среди ее научных результатов — наблюдение столкновения кометы Шумейкера — Леви с Юпитером, которое произошло в 1994 г., когда зонд был еще на пути к газовому гиганту.