Время от времени мне присылают линки на дискуссии по теме ДНК-генеалогии, и просят дать свои комментарии. Я, должен сказать, это обычно не делаю, причем по ряду причин. Одна – просто жизнь коротка отвечать на ошибочные (как правило) рассуждения на многих сайтах. Второе – эти рассуждения часто отражают мировоззрение «дискутанта», а дискутировать с мировоззрениями дело совершенно безнадежное. Они смотрят на облако, видят там Лик Божий и всем об этом сообщают. Ну что, начинать это оспаривать? Приводить аргументы? Пытаться взывать к здравому смыслу?
Часто бывает так, что «дискутант» бросил монету пять раз, и получил соотношение орла и решки как 4:1, или наоборот. На этом основании объявляется, что «утверждение, что там должно быть 1:1, неверное». Приходится объяснять, что это «в среднем», что должно быть много бросков, чтобы делать какой-то вывод. Ну, и стоит на это тратить время? Тем более что на это от критика идет парирование, что теория должна выполняться и в каждом единичном случае, иначе это не теория, а жульничество. И вобще, что «механизм выпадания орла или решки неизвестен». Ну, и стоит на такую дискуссию тратить время? А ведь именно так зачастую «подвергаются сомнению» основы ДНК-генеалогии. Поэтому я обычно отвечаю корреспондентам, что не мне лично нужно эти линки присылать, я на такие «дискуссии» просто не трачу время, а пусть «дискутанты» обращаются на Переформат, формулируют конкретный вопрос, зато мой ответ там прочитают многие. На такое времени не жалко, пусть будет как бы лекция на заданную тему. Но вот незадача – никто не присылает. Видимо, считают, что на своем междусобойчике это «прокатит», а на Переформате при уровне там дискуссии могут и по стенке раскатать, извините за каламбур.
Вот и сейчас – получил линк на дискуссию между двумя специалистами (именно двумя, никто больше не присоединился), и в безграмотности их никак нельзя обвинить. Более того, один отвечает другому в целом правильно, но тот, другой, вбрасывает все новые и новые «аргументы». Если честно, гроша ломаного они не стоят, они на уровне что «механизм выпадания орла или решки неизвестен», и что «теория должна выполняться и в каждом единичном случае». Но когда таких «аргументов» много, они других дискутантов (одного в данном случае) утомляют, и уже не хочется каждый аргумент парировать. Потому шлют мне, вроде как третейскому судье. Ну ладно, давайте разберем.
Чего добивается скептик в той дискуссии? Ведь в дискуссии одна сторона, обычно более активная, скептическая, негативная, чего-то добивается? Так чего, в самом деле? Да, в общем, ничего конкретного, просто усомниться. Ставятся под сомнение ряд терминов, ставится под сомнение калибровка констант скоростей мутаций, педалируется то, что «механизм появления мутаций неизвестен», что «скорости мутации в разных гаплогруппах разные», и так далее. Предлагаются ли другие варианты расчетов? Нет, не предлагаются. Доказывается ли, что константы скоростей мутаций в разных гаплогруппах разные, и приводятся ли эти величины? Нет, не доказывается. Ну, а что тогда? Да нет, ничего. Видимо, просто спускается некий пар в виде «сомнений».
Посмотрим более внимательно, может, все-таки что-то там есть? Дело в том, что я сам был бы рад, если бы что-то в ДНК-генеалогии было обоснованно откорректировано. Но вот никак мне этой радости не дают.
Начнем с термина «неоднородная выборка гаплотипов». Я много раз объяснял, что неоднородная выборка – это та, которая при расчетах дает «время жизни» некоего «общего предка», который есть фантом. Он же недоразумение. Аналог – это смесь двух или нескольких радиоактивных изотопов, каждый со своим временем полураспада. Вот для этой смеси определяют некое обобщенное одно «время полураспада». Аналогия понятна? То есть да, найти можно. Было 200 мг этой смеси, осталось 100 мг, и на это ушло три года. Есть ли в этом некий житейский смысл, «по понятиям»? Да, было 200 мг, осталось 100. Можно взвесить. Но есть ли в этом хоть какой-то научный смысл? Никакого. Особенно если это были, скажем, два изотопа, у одного время полураспада три месяца, и за три года он практически весь выработался, а у второго – время полураспада сто лет, он весь и остался. Поэтому обобщенное «время полураспада три года» совершенно бесполезно. Это – типичная ситуация при рассмотрении гаплотипов, у них тоже есть свое «время полураспада», за которое мутирует половина предковых гаплотипов в выборке. Формула такова: [ln(N/n)]/k, где N – общее количество гаплотипов в выборке (все они были когда-то, до мутаций, предковыми гаплотипами), n – количество оставшихся предковых гаплотипов в выборке (то есть идентичных гаплотипов в данной выборке), k – константа скорости мутации для гаплотипов данного формата: 0.020 мутации за 25 лет (условное поколение) для 12-маркерных гаплотипов, 0.0365 – для (одного из вариантов) 17-маркерных, 0.0038 – для (одного из вариантов) 19-маркерных, 0.046 – для 25-маркерных, 0.090 – для 37-маркерных, 0.120 – для 67-маркерных, 0.198 для 111-маркерных.
Например, из 3466 гаплотипов в 12-маркерном формате субклада R1b-L21 базовыми (то есть идентичными друг другу) оказались 249 гаплотипов. Это дает [ln(3466/249)]/0.02 = 132 → 152 условных поколений, или 3800±450 лет до общего предка. Здесь стрелка – табличная или расчетная поправка на возвратные мутации. Заметим, что в этом, логарифмическом методе, мутации не считают. Расчет по мутациям для этой же серии гаплотипов дал 3841±384 лет по 67-маркерным гаплотипам и 3810±381 лет по 111-маркерным гаплотипам. Здесь умышленно не сделано округление. Разницы между логарифмическим и линейным (то есть по мутациям) методами расчета практически нет, на уровне сотых долей процента, хотя погрешность расчетов ее увеличивает.
Если посмотрим на 25-маркерные гаплотипы, то там 12 одинаковых. Это дает [ln(3466/12)]/0.046 = 123 → 140 условных поколений, или примерно 3500 лет до общего предка. Погрешность в этом случае больше, так как одинаковых гаплотипов всего 12. Если бы в серии случайно оказалось не 12 одинаковых гаплотипов, а, скажем, 11 (что вполне может быть, мутации случайны), то получили бы [ln(3466/11)]/0.046 = 125 → 143 условных поколений, или примерно 3575 лет до общего предка. Как видно, все эти датировки близки друг к другу и находятся в пределах 10% погрешности между крайними случаями датировок, что для таких расчетов вполне приемлемо. Вот что такое «однородная серия гаплотипов».
Но ДНК-генеалогия вводит еще критерий – это отсутствие выделяющихся ветвей на дереве гаплотипов. Потому что отчетливо выделяющаяся ветвь имеет своего общего (для ветви) предка, как и радиоактивный изотоп со своим временем полураспада, которое заметно отличается от других в смеси, «ломает» расчеты «общего» времени полураспада.
А скептик в той дискуссии взывает – «термин “неоднородная выборка” требует конкретизации». Да давно уже конкретизировано. В книге «Кому мешает ДНК-генеалогия», которая вот-вот выйдет, разобрано много примеров однородных и неоднородных выборок гаплотипов, как это обсуждается с 2008 года. Скептик сетует – «для 67- и 111-маркерных гаплотипов» логарифмический метод теряет смысл, потому что их, одинаковых гаплотипов, уже не остается. Ну так для таких случаев и есть дерево гаплотипов. Метод с использованием микроскопа тоже теряет смысл, если через него на Луну смотреть. У каждого метода свои границы применения.
Скептик сетует, что для калибровки использовались только 13 генеалогических серий, и во всех короткие гаплотипы. На самом деле скептик лукавит – эти серии состоят из 37-, 67- и 111-маркерных гаплотипов (их подготовил И.Л. Рожанский). Более того, в Вестнике Академии ДНК-генеалогии, т. 8, №3, стр. 321-375 проведена новая калибровка, с использованием 11850 гаплотипов в 111-маркерном формате, и она не только полностью подтвердила прежнюю калибровку, но и позволила провести калибровку по каждому из 111 индивидуальных маркеров.
На самом деле для калибровки на данном этапе знаний уже вовсе не нужно знать документальную генеалогию. Например, датировка времени образования гаплогруппы А00 (по снипам, между 210 и 240 тысяч лет назад) совпала с датировкой по мутациям в гаплотипах (220 тысяч лет назад), и это не единичный случай, а таких совпадений десятки, по всему временному диапазону, где определяли по снипам и по мутациям в гаплотипах. Да, метод расчета по снипам не идеальный, бывают сбои, а у какого метода в реальности не бывают? Надо не единичные случаи выхватывать, и не видеть леса из-за деревьев, а смотреть по всему полю, не увидеть картины совпадений может только тот, кто видеть не хочет, или не может. Но сейчас уже пошли ископаемые ДНК, и везде, где предсказывали расчеты ДНК-генеалогии, ископаемые ДНК дают те же датировки. Например, все ископаемые R1b в Европе, а их не менее десятка, дают датировки между 4800 и 4200 лет назад. Расчеты времен жизни общих предков по множеству серий гаплотипов группы R1b в Европе дают величины в том же временном интервале, от 4800 лет назад и позднее. Есть один выпадающий, в Испании, но на то он и выпадающий, при расчетах по гаплотипам современников такие не попадались.
Скептик цитирует «скорость мутации по Чандлеру» (2006 год) для маркера DYS391, которая равна 0.00265, и утверждает – «это проверялось на многих парах отец-сын». Ничего подобного. Чандлер вовсе не использовал пары «отец-сын», он анализировал частоты мутаций по реальным гаплотипам в базах данных, и при этом не мог делать привязку ко времени, у него это «на поколение», то есть на абсолютное поколение. В ответ на мой прямой вопрос в нашей с ним дискуссии, как считать, он ответил, что никак, кроме как «на поколение». Иначе говоря, это означает, что для расчетов в исторических науках этот подход неприменим, там считают в годах, а не в поколениях.
По парам «отец-сын» известные данные Ballantyne и др. (2010) показывают, что для 1759 пар мутация в маркере DYS391 произошла 5 раз, так что если считать в лоб, то величина константы равна 5/1759 = 0.00284±0.00127, то есть в реальности, при разумном округлении, 0.0028±0.0013, и опять «на поколение». Более того, сами авторы (Ballantyne и др.) честно оценили величину константы скорости мутации для DYS391 как нечто в диапазоне между 0.00126 и 0.00665 мутаций на поколение, то есть в диапазоне в 530%. Ясно, что ни для каких расчетов это не применимо. Наконец, какое оно, это поколение – 20 лет, или 25, или 30, или 35 лет – никто не знает, и знать не может. Поэтому расчеты на основании «пар отец-сын» практически невозможны без произвольного постулирования «продолжительности поколения», не говоря уже, про при таких «точностях» они вообще невозможны.
В ДНК-генеалогии калиброванная величина константы скорости мутации для DYS391 равна 0.0022 мутаций на 25 лет («условное поколение»). Тогда соответствующая константа Чандлера (0.00265) формально соответствует поколению в 30 лет, а константа Баллантайн (0.0284) – поколению в 32 года. Выбирайте, что хотите. Но это по одной точке в каждом примере, по остальным будет полный разнобой в продолжительности поколения от 15 до 50 лет. Выбирайте, что хотите.
Но дело здесь не в константе скорости мутации в каком-то одном маркере из 111. Дело в «позиции» скептика. Он выхватывает одну цифру, не понимая, как она была получена, не проводя сопоставления с десятками и сотнями других цифр, не затрудняя себя каким-либо анализом, не желая понимать, что в ДНК-генеалогии этот анализ уже проведен на несравненно бóльшую глубину и широту, и по этой своей выдернутой цифре подвергает сомнению всю отработанную систему.
Скептик в другом месте пишет, что вроде как все правильно, «но вероятности ошибки в единичных случаях существует». Как говорится, добро пожаловать в науку. Разумеется, существует, поэтому и нельзя рассматривать расчеты, которые базируются «на единичных случаях», тем более, когда имеем дело со статистическими системами.
Еще скептик – «Может быть это будет звучать парадоксально, но (это) не позволяет определить время жизни, например, предка, у которого было на две мутации в гаплотипе меньше». Ну чего уж тут парадоксального? Попробуйте определить на основании статистики автомобильных аварий время и место, где будет следующая авария. Или где и когда была авария двадцать семь аварий назад. Во-первых, такие вопросы людьми разумными не ставятся, они просто ненаучны и контрпродуктивны. Статистику определяют совершенно с другими целями и намерениями. То же и про предка с двумя мутациями меньше. Кому и когда это было нужно?
Скептик – «Если появляется гаплотип хоть с одной мутацией, это по определению не однородная выборка». Скептик просто не понимает смысла понятия «однородная выборка».
Скептик – «Если у двух людей есть одинаковый маркер, это не означает, что они родственники». Я не знаю, продолжать ли дальше. Это уже нечто запредельное. Как и про желаемые «железобетонные доказательства». При таком мировоззрении никогда не хватит то железа, то бетона.
«Так в чем же сила ДНК-генеалогии?» – спрашивает скептик. Я, пожалуй, могу ответить, и показать на простом примере. Сам скептик имеет весьма экзотическую гаплогруппу, а именно гаплогруппу Т, которой в странах Восточной Европы почти нет, а те, что есть – образуют несколько недавних линий, образующих плоские ветви на дереве гаплотипов. Это – носители данной экзотической гаплогруппы в России, Украине, Белоруссии, Польше, Литве, Латвии, Чехии, Германии, Венгрии, и все исключительно евреи, что ясно из имен и фамилий их ближайших предков (которых и заносят в базы данных). Имена такие, навскидку – Лейб, Сруль, Эфраим, Гершель, Саул, Борух, Мордехай, Шломо, Израэль, Реувен, Шимон, Янкель, Хаим, Авраам, Элиезер, Шмуль, Гершон, Моисей, Иеремия, Юфим, Бер, Саломон, Хирш, Иезекиль, Лазарь, Менахем, Ицхак, Аарон. Гаплотипы из этих стран были объединены, оставлены только те, которые имеются в 37-маркерном формате, и их них было построено дерево гаплотипов, показанное на рис. ниже.
Дерево из 83 гаплотипов гаплогруппы Т стран Восточной Европы в 37-маркерном формате. На дереве видны семь относительно недавних ветвей, и одна древняя ветвь (слева). Последняя имеет общего предка, который жил 5300±600 лет назад, и почти все ее гаплотипы, за исключением нескольких безымянных, принадлежат типично еврейским именам и фамилиям. Здесь представлены страны – Россия, Литва, Германия, Хорватия, Молдавия (единичный гаплотип), Венгрия, Украина, Белоруссия, Чехия. Относительно недавние ветви имеют общих предков, которые жили 790±250, 910±200, 1020±245, 1120±260, 1130±190, 1175±250 и 1370±220 лет назад. У ветвей приведены их снипы. Гаплотипы взяты из проекта гаплогруппы Т FTDNA.
Отсюда несколько раскрывается картина появления носителей гаплогруппы Т (и ее субкладов) в Восточной Европе. Тысячелетия назад субклады Т-L131 и/или Т-L208 (образовались примерно 15900 и 14800 лет назад, соответственно, по расчетам коллектива YFull) попали с Ближнего Востока к евреям или их предкам, те принесли их или нижестоящие субклады P77 и СTS6507 во времена Рассеяния в Европу, и в интервале 800-1400 лет назад (то есть уже в нашей эре) они разошлись по Восточной Европе. Поскольку евреи обычно держались замкнуто в своих сообществах, гаплогруппа не разошлась по нееврейским жителям, и так и осталась в окружении евреев. В последнее время ситуация с замкнутостью евреев в Европе изменилась, но передаваемые гаплотипы так и остались в соответствущих ветвях. Например, гаплотип под номером 624 в древней ветви принадлежит человеку, который назвался эрзя в базе данных, а 648 – секлером из Буковины (секлеры – военное сословие в средневековой Венгрии), но их гаплотипы сидят в ветвях между евреями Украины, Белоруссии, России. Вот так раскрываются наследственные тайны, которые, как казалось в ранние времена, безвозвратно уйдут в могилу.
Там же, в верхней ветви справа, сидит гаплотип нашего скептика, и сидит там как влитый, очень комфортабельно. Скептика интересовал вопрос – «Так в чем же сила ДНК-генеалогии?». Я догадываюсь о причинах его сомнений и некотором разочаровании. Дело в том, что он на протяжении немалого количества лет искал ответ на вопрос, откуда у него гаплогруппа Т, и найти не смог. Он перебрал массу вариантов гаплотипов Ближнего Востока, Месопотамии, Кавказа, у всех в основном древние источники, но ничего не подходило. Евреев он, видимо, и не расматривал, такого по его соображениям просто не могло быть. И вот он, разочаровавшись, решил обвинить в своей незадаче ДНК-генеалогию, оттуда и скептицизм, и сомнения в расчетах, в константах скоростей мутаций, и прочем, изложенном выше.
Линк на его сомнения, изложенные на одном из сайтов, мне переслали участники дискуссии с просьбой ответить. Я ответил, но не на сайте, а переслал этот очерк в предварительном виде ему, скептику, с предложением ответить на конкретные возражения. Вместо ответов я получил град проклятий. По каким-то причинам его еврейское происхождение (по мужской линии) скептику резко не подошло. Он вспомнил и про кран, и про воду, которой в кране не оказалось, и в этом тоже виноват, видимо, оказался я. Похоже, что в открывшейся ситуации константы скоростей мутаций и логарифмический метод интересовать его внезапно прекратили, там уже дело было не в них.
Я никаким боком не еврей, поэтому не очень понимаю, в чем причина столь резкой реакции. Каким он был, тем, собственно, и остался. Но это уже не первый случай в моей практике, когда человек, получивший результаты тестирования, оказывается ими очень недоволен. Не столь давно на Переформате был описан случай, когда человек резко негативно воспринял сведения, что по предкам он цыган. Он написал мне возмущенное письмо, но винил не меня, а себя, что зачем он теперь это узнал, и, так сказать, меньше знаешь, лучше спишь. Это дает мне возможность опять обратиться к читателям с напоминанием, что тест на ДНК не только дает возможность узнать прошлое своих предков, но также может разворошить стереотипы и предубеждения, направленные на себя. Что ни в коем случае не стоит тестировать на гаплогруппу-гаплотип себя и своих сыновей, особенно когда жена рядом. Или отца и себя, когда рядом мама. Зачем? Просто считайте по умолчанию, что гаплотип-гаплогруппа те же, да и дешевле, не нужно тратиться на дополнительный тест. Но если не терпится сравнить результаты, то вспомните слова полковника, которого играет Джек Николсон из известного фильма «A Few Good Men» (1992), который на требование знать истину, ответил – You can’t handle the truth, то есть «Вы не сможете справиться с истиной».
Анатолий А. Клёсов,
доктор химических наук, профессор
Перейти к авторской колонке