Кому мешает ДНК-генеалогия? Ложь, инсинуации, и русофобия в современной российской науке Клёсов Анатолий
9 15 12 25 27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10
18 15 20 12 24 15 12 15 24 12 23 19 11 15 17 9 11 11
Это все, напоминаю, гаплотип одного и того же человека, автора данной книги, все они – один и тот же «ДНК-генеалогический паспорт», только с разным разрешением, которое, естественно, тем больше, чем более протяженный гаплотип. Но наука на этом не останавливается, и, например, у того же автора определен уже 431-маркерный гаплотип:
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11 10 12 15 15 10 10 8 8 9 13 7 8
10 10 13 14 14 15 31 32 11 10 9 9 8 24 8 8 8 16 22 22 24 21 23 14 16
25 28 15 15 6 11 14 15 8 14 11 12 10 11 10 10 11 11 18 10 12 10 7 10 5
8 9 5 5 11 15 8 29 6 7 10 13 11 6 7 7 7 16 10 11 16 22 23 11 12 12 10 7
12 12 13 7 3 20 18 11 11 8 9 13 13 10 11 22 12 16 13 14 11 11 12 10 12
9 13 9 12 11 12 16 7 14 12 10 9 10 4 7 7 13 13 12 11 9 11 10 11 14 8 4 8
6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9 14 14 15 9 7 10 12 14 13
14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 13 12 13 11 10 7 13 12 7 12 12
7 14 17 17 11 25 8 8 12 8 8 1113 11 12 10 8 13 8 13 14 10 11 9 20 17 15
36 9 13 14 39 33 36 9 10 10 12 18 19 13 9 14 44 10 8 14 9 8 20 11 11
11 11 10 9 9 9 8 8 8 8 9 11 9 23 11 9 16 31 8 20 8 13 12 8 16 10 9 33
27 23 22 10 8 12 10 8 14 8 8 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8
27 7 5 13 7 15 28 25 60 42 12 31 22 20 12 3 4
Таких гаплотипов в мире определено пока всего несколько десятков, так что практическая польза от них пока невелика, за исключением нескольких специальных случаев, которые будут пояснены ниже.
В академических публикациях по популяционной генетике, впрочем, пока продолжают использовать гаплотипы от 8- до 17-маркерных, и лишь в крайне редких случаях более протяженные, и это тот случай, когда «любители» далеко обогнали профессионалов. Хотя те «любители» на самом деле зачастую намного квалифицированнее профетоионалов, это просто профессионалы называют тех «любителями», чтобы не признавать свое колоссальное отставание и интеллектуальный застой в популяционной генетике. Этого вопроса мы коснемся ниже, его не обойти при изложении ДНК-генеалогии.
Вопрос 15. После изложения основ ДНК-генеалогии и ее отличий от популяционной генетики, подведите, пожалуйста, итоги по значимости ДНК-генеалогии, о том, как она появилась и какие в этой области Ваши самые значимые публикации.
Итак, речь здесь идет о новой науке, которая только создается, основы которой только закладываются в последние годы. Если точнее, то основы этой новой науки уже созданы, причем стремительно[16], и идет прогрессивное накопление экспериментального материала. Новый материал поступает потоком, ежедневно в базы данных уходят десятки и сотни новых «экспериментальных точек», которые по принципу обратной связи корректируют методологию новой науки, что приводит к уточнению методов расчета.
Имя этой науки – ДНК-генеалогия. Ее экспериментальные данные – это картина мутаций в нерекомбинантных участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но в этой книге речь пойдет в основном о Y-хромосоме, более информативной для исторических исследований), причем картина мутаций как в Y-хромосомах отдельных людей, так и их групп, популяций. Методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически производится расчет времен, когда в древности жили эти рода и племена[17]. Более того, расчеты показывают, как эти времена меняются от территории к территории, что может указывать на направления древних миграций[18].
Мутации, рассматриваемые в ДНК-генеалогии – это или одиночные (как правило) замены нуклеотидов в ДНК, как, например, аденин на цитозин, или цитозин на тимин, или вставки нуклеотидов, или делеции, или мутации более сложные, при которых ошибка копирующего фермента приводит к переносу в Y-хромосоме целого блока нуклеотидов, тандемного, как его порой называют. Это дает или удлинение серии таких блоков на один (редко – сразу на два-три блока), или их укорачивание. Первые мутации – SNP (Single Nucleotide Polymorphism, или в переводе «одиночные нуклеотидные вариации»), или «снипы», обычно очень стабильны, и их для ДНК-генеалогии отбирают только такие, которые случаются только один раз (два раза – максимум) за историю человечества. Поэтому они являются маркерами родов человечества. Примеры будут даны ниже.
Мутации второго типа – STR (Short Tandem Repeats, или «короткие тандемные повторы») – значительно более быстрые, и происходят в определенных участках, или локусах, или маркерах (это все синонимы) Y-хромосомы ДНК раз в несколько десятков или сотен поколений. Набор этих маркеров составляет гаплотип, примеры гаплотипов будут даны ниже. Гаплотип – это по сути цепочка чисел, показывающих число повторов в определенных маркерах.
Естественно, чем длиннее гаплотип, тем выше вероятность того, что в нем произойдет мутация. Мы уже поясняли выше, что мутация в гаплотипах – это результат ошибки в копировании блоков нуклеотидов, тех самых «коротких тандемных повторов», биологической системой копирования ДНК в клетке. Поскольку этих «коротких тандемных повторов» в Y-хросомоме многие тысячи (выше показано 431 таких повторов, и это только среди 10 миллионов нуклеотидов Y-хромосомы, этот размер определяется методологией исследования; всего же в Y-хромосоме примерно 58 миллионов нуклеотидов, или, точнее, нуклеотидных пар, но не будем здесь вдаваться в излишние подробности). Отсюда можно заключить, что таких «тандемных повторов» в Y-хромосоме может быть примерно 2500, и это, видимо, максимально возможный размер гаплотипа. Каждый «тандемный повтор», то есть маркер, мутирует, то есть копирующая система ошибается при копировании протяженных гаплотипов, с вероятностью примерно 0.00178 раз в поколение при протяженнности поколения 25 лет, или раз в 560 поколений, или раз в 14 тысяч лет. Здесь надо сделать два замечания. Во-первых, эта скорость мутации, раз в 14 тысяч лет – средняя величина, рассчитанная по большому числу маркеров. Чем короче гаплотип, тем реальная скорость мутации более отклоняется от средней величины. Во-вторых, величина поколения в 25 лет в ДНК-генеалогии называется условным поколением, она – сугубо математическая величина. Если кому-то больше нравится брать 30 лет за поколение, то вероятность мутации на 30 лет составит примерно 0.00214, или раз в 468 поколений (по 30 лет), или раз в 14 тысяч лет. Как видим, конечный результат получается точно такой же. Более подробно это будет показано ниже.
Поэтому долгие споры, которые популяционные генетики ведут уже многие десятилетия, а именно, сколько лет брать на поколение, не имеют большого смысла, да ни к чему так и не привели. Они просто не очень знакомы с понятием константы скорости мутации (k), а она в расчетах всегда помножена на протяженность поколения (t). Поэтому протяженность поколения нельзя брать произвольно, как захотим, она завязана на константу скорости мутации. Если взять 25 лет на поколение для одной константы скорости мутации, 30 лет – для другой константы, 20 лет на поколение для еще одной константы, но конечный результат получается один и тот же. Потому что это произведение (kt) калибруется по известным генеалогиям и историческим событиям.
Как было отмечено выше, мутация в каждом маркере в среднем происходит раз в 14 тысяч лет, но в гаплотипах, то есть определенных наборах маркеров, мутации происходят со следующими средними скоростями:
– в 6-маркерном гаплотипе она происходит (на весь гаплотип) в среднем раз в 135 условных поколений, или раз в 3380 лет (в этом коротком гаплотипе маркеры мутируют более медленно, чем в других гаплотипах),
– в 12-маркерном – раз в 50 поколений, или в 1250 лет,
– в 25-маркерном – раз в 22 поколения, или в 550 лет,
– в 37-маркерном – раз в 11 поколений, или в 275 лет,
– в 67-маркерном – раз в 8 поколений, или в 200 лет,
– в 111-маркерном – раз в 5 поколений, или в 125 лет,
– в 431-маркерном гаплотипе – примерно раз в поколение, или, точнее, раз в 33 года.
Ясно, что мутаций в протяженных гаплотипах будет больше, чем в коротких за тот же промежуток времени, и изучение истории популяций, принимая в расчет число мутаций, случившихся со времени жизни общего предка популяции, будет точнее.
Поясним это на простом примере. У автора этих строк есть коллега, родом из Белоруссии, и, как показали исследования, мы с ним принадлежим не только к одному роду, то есть не только к одной гаплогруппе (это будет пояснено ниже), но и к одному славянскому племени. Мы не знаем точно, как оно называлось в древности – поляне, или древляне, или вятичи, или кривичи (а кривичи были как минимум смоленские, изборские и северные), или дреговичи, полочане, ильменские словене, радимичи, северяне, волыняне или бужане, тиверцы, уличи, белые хорваты или какие другие. В ДНК-генеалогии наше племя (или племена) носит название «восточно-карпатская ветвь гаплогруппы R1a», и дальше идут символы, детализирующие восточно-карпатскую ветвь на много уровней, на которые расходилось это племя, продолжая ДНК-линию патриарха племени, то есть сохраняя в своей Y-хромосоме специфические, уникальные мутации патриарха. Естественно, чем древнее жил патриарх, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с его гаплотипом.
Так вот, в 6-маркерном формате наши с коллегой из восточнокарпатской ветви гаплотипы выглядят так:
16 12 24 11 11 13
16 12 25 11 11 13
Между ними – одна мутация, что соответствует 1/0.0074 = 135 156 условных поколений, или 3900 лет, то есть наш общий предок жил примерно 3900/2 = 1950 лет назад. Надо отметить, что 6-маркерные гаплотипы весьма неточны, для показа чего и служит этот иллюстративный пример. Здесь 0.0074 мутаций на гаплотип – контанта скорости мутации для 6-маркерных гаплотипов, стрелка – табличная поправка на возвратные мутации[19].
В 12-маркерном формате:
13 24 16 11 11 15 12 12 10 13 11 30
13 25 16 11 11 14 12 12 10 13 11 29
Здесь между двумя гаплотипами уже три мутации, что дает 3/0.02 = 150 176 условных поколений, или 4400 лет, то есть общий предок жил примерно 2200 лет назад. Здесь 0.02 мутаций на гаплотип – контанта скорости мутаций для 12-маркерных гаплотипов. Вариация датировок, примерно 13 %, находится в пределах обычной погрешности расчетов, хотя гаплотипы короткие, мутаций мало.
В 25-маркерном формате:
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16 16
13 25 16 11 11 14 12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16
Здесь между двумя гаплотипами 9 мутаций (мутации между последними четверками гаплотипов считаются по определенным правилам, для так называемых мультикопийных маркеров, там всего две мутации), что дает 9/0.046 = 196 242 условных поколений, или 6050 лет, то есть общий предок жил примерно 3025 лет назад. Здесь 0.046 мутаций на гаплотип – контанта скорости мутаций для 25-маркерных гаплотипов. Вариация датировок по первым трем форматам гаплотипов уже заметна, и достигает 55 % (1950, 2200, и 3025). Может показаться, что чем длиннее гаплотипы, чем древнее общий предок, но это не так. В 37-маркерном формате
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15
16 16 11 11 19 23 15 16 17 21 36 41 12 11 13 25 16 11 11 14 12 12 10
13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23 15 16 17
19 35 42 13 11
между двумя гаплотипами 14 мутаций, что дает 14/0.09 = 156 184 условных поколений, или 4600 лет, то есть общий предок жил примерно 2300 лет назад. Здесь 0.09 мутаций на гаплотип – контанта скорости мутаций для 37-маркерных гаплотипов. Вариация датировок по первым четырем форматам гаплотипов (1950, 2200, 3025, 2300 лет до общего предка) уже начала стабилизироваться.
В 67-маркерном формате
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 13 25 16 11 11 14
12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23
15 16 17 19 35 42 13 11 11 8 17 17 8 12 10 8 10 10 12 22 22 15 10 12
12 13 8 14 22 21 12 12 11 13 11 11 12 13
между двумя гаплотипами 19 мутаций, что дает 19/0.12 = 158 187 условных поколений, или 4675 лет, то есть бщий предок жил примерно 2340 лет назад. Здесь 0.12 мутаций на гаплотип – контанта скорости мутаций для 67-маркерных гаплотипов. Вариация датировок по первым пяти форматам гаплотипов (1950, 2200, 3025, 2300, 2340 лет до общего предка) еще более стабилизировалась.
В 111-маркерном формате
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11 13 25 16 11 11 14 12 12 10 13
11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23 15 16 17 19
35 42 13 11 11 8 17 17 8 12 10 8 10 10 12 22 22 15 10 12 12 13 8 14
22 21 12 12 11 13 11 11 12 13 31 14 9 15 12 25 27 19 12 12 12 12 10 9
12 11 10 11 11 30 12 14 25 13 9 10 19 15 20 11 23 16 12 15 25 12 23
19 11 15 17 9 11 11
между двумя гаплотипами 26 мутаций, что дает 26/0.198 = 131 150 условных поколений, или 3750 лет, то есть общий предок жил примерно 1875 лет назад, в начале нашей эры. Здесь 0.198 мутаций на гаплотип – контанта скорости мутаций для 111-маркерных гаплотипов.
Заметим, что чем длиннее гаплотип, тем более стабилизуется константа скорости мутации в расчете на маркер. Для 67-маркерных гаплотипов она равна 0.12/67 = 0.00179 мутаций на маркер, для 111-маркерных гаплотипов она равна 0.198/111 = 0.00178 мутаций на маркер, и если для 409 маркерных гаплотипов она тоже равна 0.00178 мутаций на маркер, то скорость мутаций равна 0.00178x409 = 0.728 мутаций на весь гаплотип. Проверим это. В 409-маркерных гаплотипах между гаплотипами двух упомянутых коллег 95 мутаций
10 12 15 15 10 10 8 8 9 13 7 8 10 10 13 14 14 15 31 32 11 10 9 9 8 24
17 17 8 8 8 16 22 22 24 21 23 14 16 25 28 15 15 6 11 10 14 15 8 14 11
12 10 11 10 10 11 11 18 10 12 10 7 10 5 8 9 5 5 11 15 8 29 6 7 10 13 11
6 7 7 16 10 11 16 22 23 11 12 12 10 7 12 12 13 7 3 20 18 11 11 8 9 13 13
10 11 22 12 16 13 14 11 11 12 10 12 9 13 9 12 11 12 16 7 14 12 10 9 10
4 7 7 13 13 12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12 9 10 9
9 11 11 9 9 14 14 15 9 7 10 12 14 13 14 14 12 6 32 10 11 16 8 7 17 17 11
11 6 13 12 13 11 10 7 13 12 7 16 11 15 12 13 30 24 11 11 13 12 12 9 11
12 14 11 10 12 12 15 12 12 20 34 8 12 11 15 16 9 10 11 11 12 15 15 16
16 7 14 17 17 11 25 8 8 8 12 8 8 23 11 15 13 11 12 12 10 9 15 15 8 13 8
13 15 12 14 10 11 17 10 9 12 20 17 15 36 21 9 10 13 10 14 39 33 36 9
11 12 12 13 11 10 10 12 12 18 19 13 9 14 44 10 12 8 14 24 9 12 15 8 15
20 11 11 21 11 11 10 10 17 9 9 9 9 8 8 8 8 9 12 8 11 15 10 9 23 11 16 9
16 31 8 20 8 13 12 8 16 10 9 33 27 23 22 10 9 8 23 11 12 11 10 11 10 8
11 14 8 8 20 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8 27 7 5 13 7 15 28
25 31 60 18 42 25 24 12 31 22 20 12 12 3 4 14 11 10 12 15 15 10 10
8 8 9 13 7 8 10 10 13 14 14 14 31 32 11 10 9 9 8 24 17 17 8 8 8 8 23
23 24 21 22 15 15 25 28 15 16 6 11 10 13 14 8 14 11 12 10 11 10 11
11 11 18 10 12 11 7 10 5 8 9 5 5 11 16 8 29 6 7 10 13 11 6 7 7 16 10 10
16 22 23 11 11 13 10 7 12 12 13 7 3 19 20 10 11 8 9 13 12 10 11 22 11
15 14 14 11 11 12 10 12 9 12 9 12 12 11 16 7 14 13 10 9 9 4 7 7 13 14
12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9
9 14 14 14 9 7 10 12 14 13 14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 12
12 14 11 10 7 13 12 7 16 11 14 12 13 29 25 11 11 13 12 12 9 11 12 14 11
10 13 12 14 12 12 20 32 8 12 11 15 15 9 10 11 11 11 12 15 16 15 7 14
17 16 11 25 8 8 8 12 8 8 22 11 14 13 11 12 12 10 9 15 15 8 13 8 13 16
12 15 10 11 17 10 9 12 19 14 15 38 21 9 10 16 10 13 39 34 35 9 11
11 12 13 12 10 10 12 12 17 20 13 9 14 43 12 12 8 14 25 9 12 15 8 15
21 11 11 19 11 11 10 10 17 9 8 9 9 8 8 8 8 9 12 8 11 15 10 9 22 11 16
9 15 32 7 19 8 13 12 8 18 10 9 33 28 23 22 10 9 8 23 11 12 11 10 11
10 8 11 14 8 8 19 32 48 7 7 5 9 6 11 11 11 13 9 39 32 7 8 27 7 5 12 7
15 29 22 31 45 19 42 25 23 12 32 22 20 12 11 3 4 14 11
то есть дистанция между ними равна 95/0.728 = 130 149 условных поколений, или 3725 лет, и общий предок жил примерно 1860 лет назад. Это практически полностью совпадает с 1875 лет до общего предка, что рассчитано по 111-маркерным гаплотипам. Но и другие оценки на самом деле находятся в пределах погрешностей расчетов. Давайте рассмотрим это более детально. Если формально рассчитать погрешности, то данные для времени жизни нашего с коллегой общего предка (из восточно-карпатской ветви гаплогруппы R1a) выглядят следующим образом:
6-маркерные гаплотипы, 1950±1950 лет назад
12-маркерные 2200±1290 лет
25-маркерные 3025±1050 лет
37-маркерные 2300±660 лет
67-маркерные 2300±575 лет
111-маркерные 1875±510 лет
409 маркерные 1860±270 лет назад
Все эти данные не противоречат тому, что наш с ним общий предок жил в начале нашей эры, но с укорачиванием гаплотипа погрешность определения растет.
Надо сказать, что здесь даются упрощенные примеры, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам и сотням гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых цифрах, и т. д. В таких случаях погрешности расчетов приближаются к плюс-минус 10 % от определяемой величины. Здесь только иллюстрируется принцип расчета.
Ясно, что у протяженных гаплотипов 111-маркерных гаплотипов разрешение лучше (400-маркерные гаплотипы пока крайняя редкость). Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Длинные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно.[20]
Несколько опережая изложение в данной Части, сообщим, что примеры характерных 6-маркерных гаплотипов ветвей гаплогруппы R1a (как правило, славянских ветвей, выходцев с Русской равнины) следующие:
16 12 25 11 11 13 Центрально-евразийская ветвь
16 12 25 11 11 13 Ветвь Русской равнины
16 12 25 11 11 13 Северо-евразийская ветвь
16 12 25 11 11 13 Западная евразийская ветвь
16 12 25 11 11 13 Балтийская ветвь
16 12 25 11 11 13 Восточно-карпатская ветвь
16 12 25 11 11 13 Младшая арийская ветвь (индоарии)
16 12 25 11 11 13 Арабская ветвь (потомки митаннийских ариев)
16 1 25 11 11 13 Иранская ветвь
16 12 25 10 11 13 Центрально-европейская ветвь
16 12 25 10 11 13 Балто-карпатская ветвь
16 12 24 11 11 13 Юго-восточная (арийская) ветвь
15 12 25 10 11 13 Западно-карпатская ветвь
15 12 25 11 11 13 Северо-европейская ветвь
17 12 25 11 11 13 Северо-карпатская ветвь
17 12 25 10 11 13 Восточно-славянская ветвь
17 12 24 11 11 13 Младшая центрально-евразийская ветвь
Мы видим, что ветви настолько близкие по происхождению, что первые 9 гаплотипов из 17 в 6-маркерном формате не разделяются. Только в некоторых случаях можно условно определить, к какому наследственному ДНК-роду, то есть гаплогруппе, относятся ветви гаплогруппы R1a. Но разница между ветвями тем больше, чем протяженнее гаплотипы. Обычно в ДНК-генеалогии стараются работать с 67- и 111-маркерными гаплотипами.
Гаплогруппа – это род, который почти во всех указанных примерах в гаплогруппе R1a у славян имеет общего предка примерно 4900 лет назад, у отдельных ветвей – от 5200 лет назад (у предковой арийской ветви) до 2000 лет назад и меньше, то есть начинается только в новой эре. Ниже о родах-гаплогруппах будет пояснено значительно более подробно.
Как мы покажем ниже, гаплотипы, а именно числа в них, называемые аллели, напрямую связаны с хронологией древних миграций людей, переходами людей на новые места, событиями прошлого – войнами, климатическими катаклизмами, эпидемиями, в общем, со всем тем, что так или иначе влияло на численность популяций человека в определенные времена и на определенных территориях. Например, расчеты могут показать когда древние арии появились на Русской равнине, когда они появились в Индии, Иране, Афганистане, на Ближнем Востоке, в Европе – потому что эти события приводили к появлению на этих территориях и в те времена общих предков популяций, которые разрастались вплоть до нашего времени, образуя «кусты» гаплотипов со всеми мутациями в них, то есть изменениями чисел в маркерах.
Столь относительно небольшое время до общего предка двух наших коллег из восточно-карпатской ветви[21], около двух тысяч лет назад (см. выше), нашло объяснение при более глубоком исследовании – оказалось, что они оба по предкам принадлежат не только к «ветви R1a Русской равнины» и несут необратимые метки в Y-хромосоме, характерные для этой ветви (это – метка под названием Z280, время образования примерно 4900 лет назад), но и более специфические «нижеследующие» метки, которые в классификации имеют названия CTS1211 (время образования примерно 4300 лет назад), CTS3402 (время образования примерно 3800 лет назад), Y33 (время образования примерно 3600 лет назад), CTS8816 (время образования примерно 3500 лет назад), далее Y2902 (время образования примерно 2100 лет назад), которая и маркирует восточно-карпатский род. Вот от предка этого рода (или, может, на ступеньку ниже, пока не идентифицированного) и расходятся гаплотипы наших двух коллег, насчитывая между ними 26 мутаций в 111-маркерных гаплотипах, и 95 мутаций в 409-маркерных гаплотипах.
Итак, кроме гаплотипов (и обратимых мутаций в них) наши ДНК несут практически необратимые метки, называемые «снипы» (см. выше, SNP), которые фактически помечают рода и племена, которые, как правило, состоят из потомков одного древнего общего предка, патриарха рода. Если племя «составное», то ветви племени, происходящие из разных родов, легко выявляются по гаплотипам. Вполне возможно, что древним племенем, из которого вышел общий предок двух наших коллег, гаплотипы которых мы рассмотрели выше, и которое получило условное название «восточно-карпатская ветвь», окажется одно из хорошо нам известных древнеславянских племен, но пока соответствующей «калибровки» не проведено. Мы пока не знаем, какие у тех древнеславянских племен были гаплотипы и субклады, но скоро непременно узнаем, при анализе ДНК их ископаемых костей.
Расчеты, приведенные выше, оказались возможными, потому что уже показано и доказано, что мутации в маркерах происходят в основном (или исключительно) неупорядоченно, и к ним оказалось возможным применять правила и подходы химической кинетики, или биологической кинетики, кому какой термин больше нравится – суть одна. Маркеры мутируют по законам кинетики первого порядка, других закономерностей пока не обнаружено. Это означает, что каждому маркеру свойственна определенная константа скорости мутации, и каждому гаплотипу (состоящему, как мы уже знаем, из набора маркеров) – тоже свойственна определенная средняя константа скорости мутации, равная сумме констант скоростей мутаций отдельных маркеров. Поэтому чем древнее общий предок популяции, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с ним, тем больше поколений (и лет) отделяет современных потомков от их общего предка, и это число поколений (и лет) рассчитывается методами ДНК-генеалогии.
Поскольку ДНК-генеалогия – наука новая, коротко опишем ее историю, и проиллюстрируем ее надежность и обоснованность. Иначе мы рискуем, что читатель отнесется к ней с недоверчивостью и скептицизмом – мало ли что кто может напридумывать…
ДНК-генеалогия заявила о себе как о новой научной дисциплине всего восемь лет назад, в 2008 году. Начало было положено обширным анализом в рамках новой науки в то время протяженных (25-маркерных) гаплотипов гаплогруппы R1a Y-хромосомы европейского мужского населения, с расчетом времен жизни общих предков по странам и регионам (результаты были опубликованы в третьем выпуске журнала «Вестник Российской Академии
ДНК-генеалогии» в августе 2008 года). Было показано, что мужское население (гаплогруппы R1a) современной Германии имеет общего предка примерно 4600 лет назад, и базовый (предковый) гаплотип его был следующий:
13 25 16 10 11 14 12 12 10 13 11 30 15 9 10 11 11 24 14 20 32 12 15
15 16
25 ноября того же года, то есть через три месяца, вышла статья Haak et al.[22], в которой были описаны ископаемые гаплотипы гаплогруппы R1a, найденные в местечке Эулау, Германия, с датировкой 4600 лет назад. Ископаемые гаплотипы имели вид
13/14 25 16 11 11 14 X X 10 12/13 X 30 14/15 X X X X X 14 19 X
X X X X
(двойные числа в ископаемых гаплотипах – это те, которые точно определить не смогли, здесь возможны варианты). Знаки X указывают на пропущенные аллели в ископаемых гаплотипах. Только две аллели (числа в гаплотипах выше) различались на один шаг, 10 и 11 в четвертом положении (DYS391), и 19 и 20 ближе к концу гаплотипа (DYS 448). Это вполне естественно, никто не мог утверждать, что найденные в захоронении останки принадлежали именно первопредку «германских» R1a, тем более что там была целая семья. Две мутации разницы по расчетам в рамках ДНК-генеалогии дают всего несколько сотен лет расстояния между ними, что укладывается в диапазон погрешности расчетов[23].
Со времени этого первого положительного испытания и демонстрации практического совпадения расчетов и археологических датировок, то есть с лета 2008 года, и начался отсчет новой науки ДНК-генеалогии.
Продолжая пример, покажем, как проводился расчет и на основании чего. В те времена, 2008-й год, в академической литературе использовались в основном гаплотипы от 6- до 10-маркерных, были известны 12-маркерный (в номенклатуре компании FTDNA, что расшифровывается как Family Tree DNA) и 17-маркерный гаплотип, который был введен в практику в 2006 году, но для хронологических расчетов они практически не использовались. Короткие же гаплотипы обрабатывались популяционными генетиками с применением «популяционной» скорости мутации, которая была ужасающе неверна, и завышала датировки обыкновенно на 250–350 %[24].
В подходе ДНК-генеалогии 2008 года строилось дерево гаплотипов для проверки на общую симметричность, то есть на отсутствие выраженных ветвей. Принципы построения подобных деревьев будут объяснены ниже. Сейчас можно пояснить, что выраженные ветви на дереве гаплотипов означают, что у них был свой отдельный общий предок, и его нужно датировать отдельно, разделяя ветви. Иначе получится «два землекопа и две трети». Иными словами, если в относительно недавнее время некто из данного рода (отраженного на дереве) дал особенно обильное потомство – например, передвинулся в дальние благодатные края, без войн и эпидемий, то дерево окажется гипертрофированным, та «благодатная» ветвь со своим общим предком (тот «некто», который передвинулся в дальние края) будет резко выделяться на дереве, и такое дерево нельзя усреднять по мутациям «поперек ветвей». Грамотный анализ дерева покажет, что, например, патриарх всего дерева жил 2500 лет назад, а этот «некто», основатель отдельной ветви, жил всего 600 лет назад. Так и надо представлять данные.
Рис. 1. Дерево из 67 гаплотипов современных немцев гаплогруппы R1a в 25-маркерном формате (Клёсов, 2008)[25].
Если же усреднять поперек всего дерева, то получится, что якобы общий предок всего дерева жил, например, 1200 лет назад (или любое число между 2500 и 600 лет назад). Как видим, этот «общий предок» оказывается фантомным, и такие некорректно полученные результаты искажают выводы работы. К сожалению, так обычно работают популяционные генетики. Именно так, обрабатывая большую серию гаплотипов евреев, они получили якобы возраст якобы общего предка современных евреев (гаплогруппы J1) как 3200 лет назад, и объявили, что это время исхода евреев из Египта (точнее, когда жил Аарон, первосвященник). На самом деле в их исходных данных было две серии гаплотипов, с общими предками 4000 и 1000 лет назад, но авторы работы на ветви гаплотипов не смотрели [26].
Возвращаемся к дереву немецких гаплотипов образца 2008 года (рис. 1). Ниже будет показано, как получаются такие деревья и как их понимать. Здесь отметим, что дерево на рис. 1 показывает общую симметричность (множество мелких ветвей в нем можно анализировать по отдельности, но опыт показывает, что итоговый результат будет практически такой же), и его можно количественно обрабатывать как единую систему, то есть что все 67 гаплотипов происходят от одного общего предка. На все 67 гаплотипов в 12-маркерном формате имелось 208 мутаций от приведенного выше базового гаплотипа, и в 25-маркерном формате – 488 мутаций. В первом случае получаем 208/67/0.02 = 155^183 условных поколений (по 25 лет) от общего предка (напомним, что стрелка указывает на поправку на возвратные мутации), то есть 4575±560 лет до общего предка. Во втором случае, для 25-маркерных гаплотипов, получаем 488/67/0.046 = 158 ^187 условных поколений, то есть 4675±510 лет до общего предка. Как видим, совпадение почти абсолютное для расчетов по 12- или 25-маркерным гаплотипам. Надо сказать, что уже в первом выпуске Вестника, в июне 2008 года, проводились многочисленные расчеты для 37- и 67-маркерных гаплотипов, что тогда было неслыханно. Результаты всех этих расчетов верны до настоящего времени.
Надо сказать, что неопытный читатель тут же запротестует, что, мол, как можно по всей Германии, или любому другому региону судить по каким-то 67 гаплотипам, а там живут миллионы человек. Эта тема была подробно, с экспериментальными данными проанализирована в ДНК-генеалогии, и объяснена в ответе на Вопрос 37, где был задан риторический встречный вопрос – чтобы понять, что море соленое, нужно ли пробовать воду из всех бухточек? А как же химики делают анализ растворов, беря пробу всего лишь в долю миллилитра из ведра, цистерны, озера? Когда делают анализ крови, что, всю кровь из вас выкачивают? Нет. Значит, вопрос о размере пробы поставлен некорректно. Вопрос на самом деле сводится к тому, равномерно ли перемешана система, чтобы по малой пробе, или выборке, судить о всей системе.
Рис. 2. Дерево из 286 гаплотипов современных немцев гаплогруппы R1a в 67-маркерном формате (база данных IRAKAZ-2015). Три гаплотипа внизу (номера 1, 2, 3) относятся к древнейшему субкладу гаплогруппы, R1a-M420, и в расчеты (см. текст) не включались. Все остальные гаплотипы относились к субкладу М417 (см. диаграмму) и нижестоящим субкладам (на диаграмме не показаны, их несколько десятков). Расчеты проводили на калькуляторе Килина-Клёсова, поскольку ручной расчет системы с более чем 22 тысячи аллелей слишком трудозатратен.
Продолжая это рассмотрение, рассмотрим выборку по Германии уже 2015 года. Теперь в ней 286 гаплотипов в 67- и 65 гаплотипов в 111-маркерном формате (база данных IRAKAZ-2015). Выше – дерево 67-маркерных гаплотипов.
В подписи к рис. 2 для иллюстрации приведена «лесенка» нескольких субкладов гаплогруппы R1a, родительской которых является гаплогруппа R (ее снип – М207, то есть это индекс характерной и уникальной мутации в Y-хромосоме ДНК, которую (мутацию) несут все потомки первопредка гаплогруппы R. Через тысячелетия (в данном случае примерно через 10 тысяч лет) один из потомков первопредка гаплогруппы R получил мутацию М173 (очередной снип), и эта гаплогруппа, которую это потомок основал, став ее патриархом, в классификации называется R1. Она возникла (путем образования мутации М173) примерно 30 тысяч лет назад. Далее, примерно 20 тысяч лет назад, возникла гаплогруппа R1a (путем образования мутации/снипа М420), это произошло, видимо, в Южной Сибири, на Алтае. Три носителя данного снипа были найдены в Европе, в Германии, и они попали на дерево гаплотипов на рис. 6, под номерами 1, 2 и 3. Их последующие потомки – носители субкладов R1a1, R1a1a1, R1a1a, и так далее, на десятки уровней вниз.
Возвращаемся к дереву гаплотипов на рис. 2. Общий предок всех 67-маркерных гаплотипов дерева жил 4848±415 лет назад, всех 67- и 111-маркерных гаплотипов – 4294±298 лет назад, при округлении получаем 4800±400 и 4300±300 лет назад. Среднюю величину можно не брать, и так видно, что она практически равна полученным ранее, в 2008 году, и с совершенно другой выборкой в Германии 4575±560 лет и 4675±510 лет до общего предка, расчитанным по 12- и 25-маркерным гаплотипам.
Таким образом, обе выборки – 2008 и 2014 гг в Германии являются вполне репрезентативными для целей настоящего исследования.
Помимо этого, в ДНК-генеалогии введен принципиально новый метод для расчетов хронологии, основываясь на картине мутаций ДНК- так называемый логарифмический метод. Покажем его эфективность на примере, приведенном выше, для серии из 67 гаплотипов гаплогруппы R1a из Германии (см. рис. 2). В 12-маркерном формате из этой серии всего три гаплотипа идентичны друг другу, значит, это и есть базовые, то есть предковые гаплотипы (хотя для столь малого числа базовых гаплотипов не исключена ошибка в их отнесении к предковым, потому они и называются базовыми, а не буквально предковыми). Получаем: [ln(67/3)]/0.02 = 155 183 условных поколений, то есть примерно 4575 лет до общего предка всей серии. Расчет по мутациям, которых в этой серии было 208 (см. выше), дает 208/67/0.02 = 155183 условных поколений (по 25 лет) от общего предка, то есть 4575±560 лет до общего предка. Совпадение получилось практически абсолютным, но это в данном расчете случайно, потому что чисто статистически в данной серии могли оказаться как 2, так и 4 базовых гаплотипа, и погрешность при таких малых количествах базовых гаплотипов велика. Тем не менее, логарифмический (без подсчета мутаций) и линейный (с подсчетом мутаций) методы расчетов показывают, что серия гаплотипов вполне подходит для расчетов, и что общий их предок действительно жил примерно 4600 лет назад.
Но для 25-маркерных гаплотипов при таком малом числе гаплотипов и таком довольно удаленном общем предке расчет по логарифмическому методу уже невозможен. Даже два базовых 25-маркерных гаплотипа сохраняются всего лишь на протяжении [ln(67/2)]/0.046 = 76 83 условных поколений, то есть примерно 2075 лет. После этого и двух базовых гаплотипов не остается. Но даже отсюда можно – просто на взгляд, без расчетов – получить граничную информацию о времени жизни общего предка серии гаплотипов, в данном случае – больше 2100 лет назад. Здесь 0.02 и 0.046 – константы скорости мутаций для 12- и 25-маркерных гаплотипов.
Чем больше по численности серия гаплотипов, происходящих от одного предка, тем точнее расчет времени жизни этого предка. И тем больше экономия времени при расчетах, поскольку логарифмический метод не требует подсчета числа мутаций в гаплотипах. Например, из 2000 12-маркерных гаплотипов субклада R1b-L21 114 гаплотипов являются базовыми, то есть идентичными друг другу. Это дает [ln(2000/114)]/0.02 = 143 167 условных поколений, или 4175±570 лет до общего предка. Расчет по мутациям (для 67-маркерных гаплотипов) дает 4325±350 лет до общего предка. Разница между логарифмическим и линейным (то есть по мутациям) методами расчета дает всего лишь 3.6 % разницы, хотя погрешность расчетов ее увеличивает. Если округлить полученные величины с учетом погрешностей до 4200 и 4300 лет до общего предка, разница между ними становится равной всего лишь 2.4 %.
Другой подобный пример – из 2000 12-маркерных гаплотипов субклада RW-Z280 базовыми являются 88 гаплотипов. Мы уже видим, что R1a-Z280 заметно старше, чем R1b-L21 (см. предыдущий абзац). Действительно, это дает [ln(2000/88)]/0.02 = 156 184 условных поколений, или 4600±б70 лет до общего предка. Расчет по мутациям (для 67-маркерных гаплотипов) дает 4825±320 лет до общего предка (см. таблицу выше). Разница между логарифмическим и линейным (то есть по мутациям) методами расчета дает всего 4.9 % разницы. Если округлить полученные величины с учетом погрешностей до 4600 и 4800 лет до общего предка, разница между ними становится равной 4.3 %. Для 25-маркерных гаплотипов базовых в серии из 2000 R1a-Z280 остаются только два базовых, что дает [ln(2000/2)]/0.046 = 150 176 условных поколений, или примерно 4400 лет до общего предка. Погрешность там велика, поскольку там, где есть только два базовых гаплотипа, легко могли остаться один или три. Но видно, что закономерности в целом соблюдаются.
Как мы видим, мутации в гаплотипах потомков расходятся от предкового гаплотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где n – число мутаций в серии из N гаплотипов, k – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации[27]. На сотнях и тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов.
Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы расмотрим ниже.
Как мы видим, мутации в ДНК-генеалогии – это не только единичные необратимые мутации-снипы, описанные выше, которые определяют гаплогруппы и субклады, но и обратимые мутации, меняющие числа повторов, или аллели, в гаплотипах. В русскоязычной литературе их называют просто «мутации», с пониманием, что это не те мутации (в генах), которые обычно возникают под действием радиации. Переход числа повторов в маркере Y-хромосомы от 25 к 24 или 26 (или наоборот) имеет совершенно другую природу, чем «поломка» гена. Такой переход является следствием спонтанной ошибки ДНК-копирующей «биологической машины», это процесс первого порядка с точки зрения физико-химической кинетик, он не зависит от внешних воздействий. О процессах первого порядка будет рассказано ниже.
Помимо того, что в 2008 году ДНК-генеалогия прошла проверку на реальных (ископаемых) гаплотипах, показав ту же хронологию, в том же 2008 году, в июне, вышел первый выпуск Вестника, который позже стал международным. В первом выпуске были две больших статьи – «Основные правила ДНК-генеалогии» (54 страницы) и «Происхождение евреев с точки зрения ДНК-генеалогии» (179 страниц). С тех пор вышло 73 выпуска Вестника, общим объемом более 15 тысяч страниц, все выпуски в открытом доступе (http://dna-academy.ru/proceedings/, www.anatole-klyosov.com). Со второго выпуска (июль 2008) в разделе «Обращения читателей и персональные случаи ДНК-генеалогии» публикуются ответы на письма читателей из разных стран мира. До сегодняшнего выпуска опубликованы персональные истории в виде ответов на 249 писем читателей. Авторы Вестника – в основном российские специалисты и любители ДНК-генеалогии, но также специалисты из США, Италии, Франции, Словении, Сербии, Италии, Германии, Бельгии, Шотландии и других стран. Помимо этого, в материалах Академии, которая официально утверждена в федеральных органах РФ в июле 2015 года, публикуются персональные интерпретации гаплотипов и снипов для людей, подавших на рассмотрение данные тестирования своих ДНК.
С того же 2008 года опубликованы 25 научных статей по ДНК-генеалогии в академических журналах (21 на английском языке, одна – в старейшем российском академическом журнале «Биохимия»), и три – в журнале «Исторический Формат») вышли 8 книг по ДНК-генеалогии (7 на русском языке и одна на сербском, в Белграде), и 112 научно-популярных статей по ДНК-генеалогии, из них 80 статей на Переформате – сайте, который выпускается профессиональными историками (http://pereformat.ru/klyosov).
Научные статьи в области ДНК-генеалогии публиковались в журналах Human Genetics (2009), J. Gen. Genealogy (2009), Advances in Anthropology (2011–2014), Биохимия (2011), Eur. J. Human Genetics (2014), Frontiers in Genetics (2014), Исторический Формат (2015). Весной 2013 г. автор настоящей книги получил приглашение быть главным редактором журнала Advances in Anthropology («Успехи антропологии»), и сделал его профильным журналом по ДНК-генеалогии (наряду, конечно, с публикациями авторов по разным направлениям антропологии). Первой статьей в «Успехах антропологии» была статья по константам скоростей мутаций в гаплотипах Y-хромосомы и их калибровке, то есть количественной связи с хронологией[28]. Концептуально сделать это было несложно, поскольку кинетика химических и биологических мутаций – прямая специальность автора данной книги, он в свое время заканчивал кафедру академика Н.Н. Семенова, единственного лауреата Нобелевской премии среди советских химиков, и написал немало учебников для Высшей школы (в основном издательства Московского университета и издательства «Наука»), часть – со специалистом в области химической кинетики, деканом Химического факультета МГУ чл. – корр. АН СССР И.В. Березиным. За разработку кинетики химических и биологических реакций тот же автор стал лауреатом Государственной премии СССР по науке и технике (1984), а до того – лауреатом премии Ленинского комсомола (1978). Так что концептуально разработать количественную основу ДНК-генеалогии сделать было несложно, но надо было ее верифицировать на тысячах примеров, чтобы она была надежной. Это было сделано с использованием 3160 гаплотипов (2489 из них – в 67-маркерном формате, из 55 ДНК-генеалогических линий из 8 основных гаплогрупп). Эта работа и была опубликована в Advances in Anthropology в 2011 году[29], во втором выпуске журнала после его основания в том же году.
В последующем в том же журнале были опубликованы статьи с детальным описанием гаплогруппы R1a в мире, гаплогруппы R1a в Европе (с описанием 38 ветвей гаплогруппы R1a), гаплогруппы R1b, ДНК-генеалогии и лингвистики, ДНК-генеалогии и древней керамики от трипольской культуры до культур Юго-Восточной Азии и обеих Америк, а также четыре статьи об Африке и происхождении человека с точки зрения ДНК-генеалогии (две в 2012 г, и две – в 2014 г, одна из них редакторская). Одна статья из этих четырех[30] установила своеобразный рекорд популярности у читателей журнала – по состоянию на 25 октября 2015 года она была просмотрена более 90 тысяч раз, и «скачана» более 20 тысяч раз (http://www.scirp.org/journal/HottestPaper.aspx?Journalro=737).
Описанное выше – это крупный успех нового направления, отражение его признания. Стало ясно, что ДНК-генеалогия фактически является молекулярной историей (см. выше ответы на Вопросы 3 и 4).
Глава 2
Основные понятия и главные положения ДНК-генеалогии
Вопрос 16: Как в Y-хромосоме образуются мутации?
Время от времени при копировании Y-хромосомы в копии проскакивают ошибки. Фермент под названием ДНК-полимераза (на самом деле вместе с целым набором молекулярных инструментов копировальной машины) или просто ошибается и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая «тандемные повторы» нуклеотидов, или «ремонтирует» повреждённые участки и в ходе «ремонта» удаляет повреждение (эта операция называется «делеция»), или «вшивает» новый нуклеотид (называется «вставка», или «инсерт»). То, что удалось отремонтировать, в мутации не попадает, как будто мутации и не было. Что не удалось – передается сыну при рождении. Если родилась дочь, то Y-хромосома не передается. Если есть только дочери, или детей нет – Y-хромосома терминируется, вместе с мужской наследственной линией.
Мутации, которые интересуют ДНК-генеалогию, бывают двух типов – или изменение числа повторов, тандемов (STR), что описано выше, или «точечные», одно- или несколько-нуклеотидные (SNP), снипы.
Оказалось, что многие повторы нуклеотидов находятся у разных людей в одних и тех же участках Y-хромосомы. Эти участки уже специалистами пронумерованы, классифицированы, сведены в списки. Они получили название «маркеры». Набор маркеров, точнее, повторов в них, называется «гаплотип». Уже известных маркеров – больше тысячи. Они, как правило, одни и те же у всех людей на Земле и отличаются друг от друга только числом повторов, что вызвано теми самыми ошибками ферментов (и других элементов биологического копирования) при копировании из поколения в поколение.
Примеры повторов приведены в ответе на вопрос 14. Ясно, что «мутации», которые приводят к изменению числа тандемных повторов в Y-хромосоме, не есть те «мутации», о которых все имеют представление как о «поломках в генах», например, под воздействием радиации. Мутации, которые рассматривают в гаплотипах, происходят не в генах и не являются «поломками». Это, как объяснено выше – ошибки при копировании ДНК. Они имеют весьма сложную архитектуру, и радиацией не вызываются. Это – не поломка, а координированная перестройка.
Вопрос 17: Что такое «общий предок» выборки носителей гаплотипов, и как мутации могут помочь определить, когда он жил?
Любая группа мужчин, относящихся к одной и той же гаплогруппе и к одному и то же субкладу, а также к любой выборке гаплотипов, образующей ветвь в пределах одного субклада, являются в каждом случае родственниками, и происходят от одного общего предка. Можно привести и обратное определение – если мутация, которая осуществилась в Y-хромосоме, унаследовалась в ДНК потомков, то все эти потомки происходят от одного общего предка, у которого и произошла данная мутация.
В принципе, в любой гаплогруппе и любом субкладе имеется множество групп людей, которые происходят от их общего предка. Например, у двух родных братьев есть общий предок – их отец. Если к ним добавить дядю, то общий предок всех троих – отец дяди и дедушка братьев.
Чем глубже во времени общий предок группы людей, или популяции, в терминах ДНК-генеалогии, тем больше у него потомков. Все потомки наследуют гаплотип их общего предка, но чем дальше во времени отстоит общий предок, тем больше мутаций накапливается в гаплотипах потомков. Приведем простой пример. Допустим, общий предок жил 2500 лет назад, то есть 100 условных поколений назад (в ДНК-генеалогии за условное поколение принимается 25 лет, и константы скоростей мутации вычисляются в расчете на условное поколение протяженностью 25 лет). Если выявить сто потомков этого общего предка, в их 12-маркерных гаплотипах обнаружится примерно 200 мутаций, причем у 14 человек гаплотипы будут одинаковыми, и все 200 мутаций будут неупорядоченно распределены, в разной степени, между оставшимися 86 потомками.
Вот эти одинаковые 14 гаплотипов и представляют собой предковый гаплотип. За прошедшие 100 поколений – чисто статистически – в гаплотипах 86 потомков пройдут мутации, а в гаплотипах 14 потомков мутаций еще не будет. Вот таким образом определяют предковый, или базовый гаплотип.
Проверим представленные выше числа. 200 мутаций в 100 гаплотипах в 12-маркерном формате (константа скорости мутаций в 12-маркерных гаплотипах равна 0.02 мутаций на гаплотип за условное поколение) соответствуют величине 200/100/0.02 = 100 условных поколений, то есть примерно 2500 лет (здесь для простоты не вводится поправка на возвратные мутации, смысл которой будет пояснен в следующей главе). Это – линейный метод расчета времени до общего предка популяции. В то же время согласно логарифмическому методу если из 100 гаплотипов в 12-маркерном формате остались неизменными 14, то это соответствует времени, прошедшему от общего предка популяции, равному [ln(100/14)]/0.02 = 98 условных поколений, то есть примерно тому же времени, рассчитанному с помощью линейного метода.
Из этого примера должно быть понятно, что чем более недавний общий предок, тем большее число идентичных друг другу гаплотипов (или их фрагментов) наблюдается в выборке, и тем надежнее выявляется предковый гаплотип. Если общий предок жил очень давно, то одинаковых гаплотипов в выборке может остаться всего два-три – например, три гаплотипа из сотни 12-маркерных гаплотипов останутся при [ln(100/з)]/0.02 = 175 условных поколений до общего предка, то есть общий предок жил 4375 лет назад (на самом деле больше при учете возвратных мутаций). Когда в серии гаплотипов наблюдаются всего два-три одинаковых гаплотипа, они могут не обязательно быть предковыми, а оказаться одинаковыми случайно, в результате игры неупорядоченных мутаций. Поэтому понятие «предковый» гаплотип лучше не употреблять, за исключением совсем уже явных случаев, и в ДНК-генеалогии вместо «предковый» гаплотип обычно употребляют «базовый».
Итак, общий предок популяции – это предполагаемый носитель «базового», или «предкового» гаплотипа. Время жизни общего предка популяции вычисляется по совокупности гаплотипов его потомков, принимая во внимание число мутаций, накопившееся в популяции, нормированное на гаплотип или на маркер, и константу скорости мутации, или частоту мутации в расчёте на поколение. Расчёты времён жизни общих предков популяций позволяют делать предположения о времени и направлениях миграций популяций в древности, о передвижениях популяций. Поскольку, передвигаясь, популяции оставляли следы в виде материальных признаков, это позволяет проводить интерпретацию археологических данных в отношении носителей этих признаков, их принадлежности к определённым родам и племенам, связанных родственными взаимоотношениями. Аналогично, популяции, передвигаясь, приводили к перемещению языков, диалектов, и определение общих предков и времён их жизни даёт возможность прослеживать динамику языков в отношении соответствующих родов и племён, связанных родственными взаимоотношениями.
Вопрос 18: Можно ли привести примеры предковых гаплотипов, датируемых десятками и сотнями тысяч лет назад? Можно ли выявить гаплотип общего предка всех мужчин на Земле?
«Общий предок всех людей» – понятие скорее концептуальное, чем буквальное, абсолютное. Чем больше накапливается данных, тем понятнее становится, что «общий предок всех людей» теряется среди переплетений ДНК-генеалогических линий, уходящих на сотни тысяч лет вглубь. Поэтому введенное некоторое время назад понятие «хромосомный Адам» не является научным и никогда не было доказано. Интуитивно, такой общий предок возможен, но он, скорее всего, будет «плавающей мишенью».
Понятие «одного предка» можно рассматривать на разных уровнях сложности. Например, древнейшая африканская линия (гаплогруппа А00) имеет общего предка с гаплогруппой R1a примерно 210 тысяч лет назад, то есть оттуда, из такой глубины тысячелетий расходятся гаплотипы современных носителей гаплогруппы A00 и этнических русских гаплогруппы R1a:
13 11 12 10 11 16 10 8 14 14 8 8 8 9 12 11 12 8 12 12 11 11 (А00)
12 12 11 11 11 11 11 8 17 17 8 10 8 12 10 12 12 8 12 11 11 12 (R1a)
Здесь приведены 22 очень «медленных» маркера Y-хромосомы, каждый из которых мутирует раз во многие тысячелетия. Можно подсчитать, что эти гаплотипы разошлись на 26 мутаций, и расчеты, основанные на скорости мутации каждого маркера, показывают, что эти 26 мутаций соответствуют времени жизни их общего предка примерно 210 тысяч лет назад. Но даже беглый взгляд на эти гаплотипы показывает, что ДНК древнейших африканцев и этнических русских, носителей гаплогруппы R1a, не так уж намного различаются, или, скорее, являются принципиально сходными.
Хорошо, а если вместо типичного гаплотипа R1a подставить гаплотип R1b, преобладающей гаплогруппы Западной Европы? Мутации здесь настолько медленные, что в таком формате представления гаплотипа он будет практически одинаков по всей Западной Европе:
11 12 13 11 11 12 11 9 15 16 8 10 8 12 10 12 12 8 12 11 11 12 (R1b)