Читать книгу ДНК-генеалогия от А до Т - А. А. Клёсов - Страница 3
Введение
Древнее ДНК- (Y-хромосомное) генеалогическое дерево человечества
ОглавлениеДНК-генеалогия выстраивает четкую генеалогическую линию предков и потомков, как людей, принадлежащих к определенному роду. Поскольку гаплогруппа – это совокупность родственных субкладов, происходящих по цепочке от еще более древних общих предков, а субклад – это совокупность носителей одних и тех же снипов, то ясно, что все их носители, то есть в данном случае мужчины, произошли от одного общего предка, патриарха, в ДНК которого этот снип впервые образовался. Фактически это есть общепринятое определение рода, что есть совокупность всех поколений людей, происходящих от одного предка.
Можно сказать и по-другому: гаплогруппа – совокупность гаплотипов, объединённая «групповой» необратимой мутацией, присущей определённому человеческому роду, то есть потомкам одного «патриарха», как правило, тысячелетия назад. Понятие «гаплогруппа» эквивалентно понятию «род» в ДНК-генеалогии. Эти мутации («снипы») выбирают по определённым критериям. Гаплогруппой также называют сам род в таких выражениях, как «гаплогруппа мигрировала шесть тысяч лет назад на восток», понимая, естественно, что мигрировали носители данной гаплогруппы. В настоящее время классификация включает 20 основных гаплогрупп (плюс А0 и А00), от А до Т в алфавитном порядке, и тысячи «нисходящих» гаплогрупп и субкладов.
Гаплогруппы не просто соответствуют своим родам, но образуют определённую последовательность, лестницу гаплогрупп[3], показывающих их иерархию – последовательный, ступенчатый переход от точки расхождения африканских и неафриканских популяций (примерно 160 тыс. лет назад) до самой недавней гаплогруппы R, образовавшейся примерно 30 тыс. лет назад. Эта лестница называется филогенетическим деревом гаплогрупп и их снипов. Все гаплогруппы и субклады на дереве должны включать снипы «вышестоящих» гаплогрупп и субкладов. То есть принцип «лесенки» должен выполняться. Преемственность узловых родов человечества должна соблюдаться.
На рисунке приведено дерево всех гаплогрупп человечества. Первый индекс – это индекс гаплогруппы или субклада, эти понятия применяются довольно произвольно, в зависимости от смысла, который в это вкладывается. Например, потомки Ивана Клесова, который родился в 1575 году, они же мои предки – это наш род. В то же время, наш род – это гаплогруппа R1a, которая образовалась (путем соответствующей мутации в Y-хромосоме) примерно 20 тысяч лет назад. Наш род – это также субклад R1a-Y2902, он же восточно-карпатская ветвь гаплогруппы R1a, этот субклад образовал-с я примерно 4300 лет назад. Как видим, понятия рода и субклада не являются жесткими по смыслу, более того, гаплогруппа R1a является субкладом гаплогруппы R1, a R1 является субкладом гаплогруппы R. По аналогии – все матрешки, вложенные одна в другую, являются матрешками, хотя и различаются размерами.
Всего в мире насчитывают 20 основных гаплогрупп, которые обозначают буквами латинского алфавита, от А до Т, хотя систему порой нарушают. В последнее время в классификацию добавили гаплогруппы A0 и A00, хотя их носителей обнаружили в количестве считанных единиц, все они живут в Африке. Но они настолько отстоят по снип-мутациям от всех остальных людей на Земле (тестированных на мутации в ДНК), что их пришлось выделить в отдельный род-гаплогруппу. Помимо этого, были идентифицированы промежуточные, сводные гаплогруппы, такие, как CT, DE, GHIJK и другие, так что минимальный состав генеалогического дерева мужской половины человечества включает уже 39 основных гаплогрупп, то есть главных уровней Y-хромосомной генеалогической структуры. С подгруппами это составляет уже много сотен.
Если же считать все уровни генеалогического дерева (уровень в этом случае – это субклад), то гаплогруппа R1a, основная гаплогруппа (род) этнических русских, уже насчитывает 74 субкладов, гаплогруппа R1b – 871 субкладов, и это при том, что на диаграмме ниже они обе входят в сводную гаплогруппу R, которой примерно 30 тысяч лет со времени образования. Образовалась гаплогруппа R при появлении необратимой мутации в виде спонтанного превращения одного нуклеотида в другой в ДНК (Y-хромосоме) патриарха, или его выжившего потомка, в свою очередь потомки которого дожили до настоящего времени в количестве более миллиарда человек. Если точнее, то у него, патриарха гаплогруппы R, по сравнению с ДНК его отца (относящегося к гаплогруппе Р) произошло спонтанное превращение аденина в гуанин, и это произошло в участке Y-хромосомы под номером 15 миллионов 581 тысяч 983. Всего же в Y-хромосоме мужчин насчитывается, как сообщалось выше, примерно 58 миллионов нуклеотидов.
Y-хромосомное дерево человечества, показывающее основные гаплогруппы
Всё это делает филогенетическое дерево гаплогрупп достаточно прочной и обоснованной структурой. У него есть, впрочем, слабое место – его филогения не показывает, на каком континенте зародилось человечество, откуда пошли гаплогруппы, начиная с первых, на общем стволе, идущими от нашего общего предка с современным шимпанзе. Говоря языком филогении, дерево гаплогрупп не «укоренено». Укоренение дерева – результат интерпретаций, наблюдений и доступных экспериментальных данных.
Результаты недавних исследований о происхождении человечества методами ДНК-генеалогии представлены на следующем рисунке, на котором также показаны времена появления основных Y-хромосомных ветвей человечества.
Естественно, эволюционное дерево уходит от альфа-гаплогруппы вниз, где расхождение гаплогруппы A0-Т на A0 и A1 и соответствует, видимо, расхождению двух ветвей, африканской (не по происхождению, которое неизвестно, а по факту прибытия в Африку) A0 и неафриканской A1. Датировка этого расхождения по гаплотипам дает примерно 160 тысяч лет назад.
Диаграмма эволюции гаплогрупп современного человечества. На горизонтальной оси – основные гаплогруппы Y-хромосомы человечества, на вертикальной – абсолютная шкала времени. Общий предок альфа-гаплогруппы жил примерно 160 тысяч лет назад, общий предок бета-гаплогруппы (или гаплогрупп от В до Т) – 64 ± 6 тысяч лет назад[4].
Примерно 64 тысячи лет назад предки современных неафриканцев прошли «бутылочное горлышко популяции», и именно к этому времени сходятся все изученные до настоящего времени ДНК-линии гаплогрупп от В до Т. Видимо, наиболее обоснованной гипотезой об основной причине обрыва генетических линий неафриканцев 64 тыс лет назад является катаклизм планетарного масштаба, вызванной падением метеора в Тихий океан в указанное время[5]. Он привел к тому, что древние африканские гаплогруппы тоже вымерли и сейчас не обнаруживаются. Поэтому ровно никаких генетических оснований для утверждения, что современное человечество вышло из Африки нет, это просто фантазийная (а скорее, совершенно натянутая) схема. Фактически, она полностью строится на положении, что «африканцы более разнобразны» по Y-хромосомам, чем неафриканцы, но диаграмма выше показывает причины этого более высокого разнообразия. Вторая причина более высокого разнообразия в Африке – что в течение десятков тысяч лет в Африку мигрировали носители практически всех гаплогрупп человечества (например, в Камеруне и Чаде сейчас живут многие носители гаплогруппы R1b, пришедшие туда тысячелетия назад), которые, естественно, увеличивали «разнообразие», смешиваясь с африканцами. В южной Африке, среди местного населения, говорящего на консайнских языках и банту, были найдены самые разные гаплогруппы – A1b1, B2a, B2b, G, I, O, R1, Т[6]. Подобные же диаграммы построены и для митохондриальных ДНК, присущих в первую очередь женщинам. Вывод один – предки современных не-африканцев из Африки не выходили, напротив, они прибывали в Африку и увеличивали африканское генетическое разнообразие.
Мутации в гаплотипах потомков расходятся от предкового гаплотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где и – число мутаций в серии из N гаплотипов, к – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации.
На многих тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов. Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы расмотрим ниже.
Мутации в ДНК-генеалогии – это не только единичные необратимые снип-мутации, описанные выше, которые определяют гаплогруппы и субклады, но и обратимые мутации, меняющие числа повторов, или аллели, в гаплотипах. В русскоязычной литературе их называют просто «мутации», с пониманием, что это не те мутации (в генах), которые обычно возникают под действием радиации. Переход числа повторов в маркере Y-хромосомы от 25 к 24 или 26 (или наоборот) имеет совершенно другую природу, чем «поломка» гена. Такой переход является следствием спонтанной, случайной ошибки ДНК-копирующей «биологической машины», это процесс первого порядка с точки зрения физико-химической или биологической кинетики, он не зависит от внешних воздействий.
Что важно отметить – в большинстве случаев результаты расчетов почти не зависят от размера выборки (при числе гаплотипов больше двух-трех десятков), то есть они достаточно устойчивы к статистическим вариациям. Размер выборки увеличивает точность, и то только до определенных пределов. Это относится к довольно большим популяциям, которые перемешались за тысячелетия, но именно с такими обычно и работают.
Снип-мутации в Y-хромосоме
Снип-мутации – это практически необратимые мутации в ДНК (от английского сокращения SNP, что означает «однонуклеотидные вариации»). Однажды образовавшись, они «застревают» в ДНК навсегда, за крайне редким исключением, когда в том же нуклеотиде, который ранее мутировал, прошла еще одна мутация – либо в другой нуклеотид, либо возвращение в исходный. В книге «Ваша ДНК-генеалогия» был приведен пример, что один определенный нуклеотид Y-хромосомы у всех современных гоминидов (кроме макаки, которая относится к семейству мартышковых, хотя отряд тот же – приматы), выбранный для той иллюстрации, является тимином, и только у орангутана там цитозин. Иначе говоря, у большинства этих особей тимин сидит в том месте Y-хромосомы не менее 15–20 миллионов лет, и за это время из пяти «образцов» изменился лишь однажды. Скептик скажет, что он мог измениться в орангутанге за это время и сотню раз, и цитозин – просто последний в той серии изменений, но так не бывает. Уже накоплен большой массив экспериментальных данных, что мутации в ДНК происходят неупорядоченно, статистически, равновероятно по всем последовательностям, за исключением крайне редких случаев, когда отпадают или перестраиваются большие фрагменты ДНК, но здесь явно не тот случай.
Большая серия экспериментальных данных, полученная и перекрестно проверенная разными коллективами исследователей, привела к средней величине константы скорости мутации в Y-хромосоме 0.82·10-9 на нуклеотид в год (более правильно – на пару нуклеотидных оснований в год). При такой скорости мутации за 5 миллионов лет, то есть до времени жизни общего предка шимпанзе и человека, в Y-хромосоме с ее 58 миллионов пар оснований набежит 0.82·10-9 × 10·106 × 58·106 = 476 тысяч мутаций, что составит всего 0.8 % от 58 миллионов нуклеотидов. Здесь в расчетах положено 10 миллионов лет, потому что 5 миллионов лет прошло от общего предка до современного человека, и столько же – до современного шимпанзе, то есть современники удалены друг от друга суммарно на 10 миллионов лет.
Используя эту константу скорости мутаций можно рассчитывать, сколько времени потребуется для прохождения определенного количества мутаций во фрагменте Y-хромосомы определенного размера. Например, мутация во фрагменте Y-хромосомы размером 8.47 миллионов нуклеотидов происходит в среднем раз в 144 года. Поскольку среднее число снип-мутаций в таком фрагменте Y-хромосомы от образования гаплогруппы R1a до настоящего времени равно 151, то R1a образовалась 151 × 144 = 21744 лет назад, или округленно 22 тысячи лет назад.
Эти расчеты здесь приведены, чтобы наглядно показать, насколько редки снип-мутации в Y-хромосоме, и как ведутся подобные расчеты. А такие расчеты – мощный современный инструмент ДНК-генеалогии, они позволяют выяснить, когда жили общие предки для популяций, очень удаленных во времени. Мы будет проводить подобные расчеты в настоящей книге довольно часто, и получать уникальную информацию об истории человечества.
Стир-мутации в гаплотппах Y-хромосомы
Помимо практически необратимых снип-мутаций, которые затрагивают, как правило, один нуклеотид (намного реже сразу два-три нуклеотида, блоком), в ДНК происходят более сложные и намного более частые мутации, которые мы будем называть стир-мутации (от английского сокращения STR, что означает «короткие тандемные повторы»), по аналогии со снип-мутациями. «Тандемные повторы» нуклеотидов называют так потому, что еще давно было обнаружено, что в Y-хромосоме некоторые нуклеотидные блоки, состоящие обычно из трех или четырех нуклеотидов, многократно повторяются («тандемом»), обычно от 7 до 45 раз подряд. Эти блоки повторов, достигающие в длину многих десятков, а порой и сотен нуклеотидов, очень стабильны, и в точности копируются при передаче Y-хромосомы от отца сыну, хотя в них происходят редкие мутации, в среднем раз в 12 тысяч лет. Но это в среднем, а в отдельных случаях мутации, те самые стир-мутации, случаются или относительно часто, например, раз в 3400 лет (в сегменте Y-хромосомы под названием DYS710), или очень редко, например, раз в 3 миллиона лет (DYS472).
3
http://www.isogg.org/tree/ISOGG_YDNATreeTrunk.html / Интернет-сайт «International Society of Genetic Genealogy».
4
Klyosov, А.А., Rozhanskii, I.L. (2012) Re-examining the “Out of Africa” theory and the origin of Europeoids (Caucasoids) in light of DNA genealogy. Advances in Anthropology, 2, No. 2, 80–86.
5
http://pereformat.ru/2015/10/africa-dna-vol2/
6
Barbieri, C., H ± 1bner, A., Macholdt, Е., Ni, S., Lippold, S., Schröder, R., Mpoloka, S.W., Purps, J., Roewer, L., Stoneking, M., Pakendorf, B. (2015) Refining the Y chromosome phylogeny with southern African sequences. bioRxiv, doi: http;dx.doi.org/10.1101/034983.