Ниже – история, которую можно назвать забавной, или драматической, или пустой потерей времени, что, по-моему, наиболее адекватная оценка. Зачем я ее представляю – станет ясно по мере изложения. Интересующиеся ДНК-генеалогией найдут там, полагаю, немало полезного. Например, моделирование ДНК-генеалогий, их расчеты, приложение калькулятора Килина-Клёсова к некоторым моделям расчетов, влияние бутылочного горлышка в отношении потомков их общего предка, и как это влияет на расчеты. Другие, кто еще не погрузился в ДНК-генеалогию, возможно, найдут интересным, как некто «проверял калькулятор КК», «тестировал его» с помощью залихватских моделей, и что из этого получилось. А третьи познакомятся со стилем общения с хронофагом, который в основном пожирает время собеседника, ничего не принося взамен. Впрочем, подобных хронофагов встречал, наверное, каждый, просто тематика была другой. Может, и такая же.
 

 
Наверное, нет нужды многим объяснять, что у меня идет ежедневная активная переписка с интересующимися ДНК-генеалогией, историей, а также со многими людьми, которых интересуют самые разные вопросы, и которые верят, что я могу на них (вопросы) ответить. В день получаю десятки писем, и на все отвечаю, кроме явных junk mail. В этом вижу свою почетную обязанность преподавателя. Как-никак, а я профессор со стажем уже сорок лет, с 30-летнего возраста. Время летит быстро, сюрприз, не так ли?
 
Среди писем выделяются послания от математиков, или от тех, кто математиками представляются (их дипломы не проверяю, верю на слово, да и вижу по их стилю). Как правило, математики интересуются, чем могут помочь, какой математический аппарат нас интересует для обработки данных ДНК-генеалогии. Я обычно отвечаю, что особо сложного аппарата нет, и существующий нас устраивает. Некоторые математики выражают сомнение, что по всей планете константы скорости мутации Y-хромосомы одинаковы для носителей любых гаплогрупп, но я им показываю серии данных, и они соглашаются, что да, никаких конкретных оснований в этом сомневаться нет. В общем, идет нормальный диалог. Я обычно им сообщаю, что если они найдут что-либо, что окажется полезным для обработки данных, и чего у нас до сих пор не было, и о чем мы, может быть, и понятия не имеем, то приходите и приносите, будем очень рады…
 

Пока пришел и принес только один, но это дорогого стоило. Владимир Килин из МИФИ разработал, при моем небольшом участии, калькулятор для расчета времен до общего предка серии гаплотипов, от 1-маркерного (технически) до 111-маркерного, до 10 тысяч гаплотипов (протяженности до 111-маркерных) в серии, причем калькулятор тут же показывает базовый гаплотип для всей серии, и суммарное количество мутаций от базового гаплотипа опять же для всей серии. И не только суммарное количество мутаций, но и количество мутаций для каждого маркера в отдельности. А также дисперсию числа аллелей для каждого маркера, и ограничители, которые позволяют компьютеру поднять тревогу при избыточной дисперсии любого маркера, и снять такие маркеры из расчетов, поскольку в них явно есть либо систематическая ошибка, либо ошибки при вводе данных, либо еще какие недоразумения, включая «человеческий фактор». В калькуляторе есть еще много особенностей, подсказок и предохранителей, которые можно по желанию загрублять или, напротив, делать для них тонкую настройку, в общем, всего здесь не перечислить. Мне оставалось только ввести в калькулятор константы скорости мутаций для каждого из 111 маркеров, и оптимизировать их для нескольких десятков примеров, что я и сделал. Итоговая статья была опубликована сначала в Вестнике Академии ДНК-генеалогии (в трех частях, за март, май и сентябрь 2014 года), а затем в журнале Advances in Anthropology (в августе 2016 года). Это – нормальный промежуток времени для отработки калькулятора, проверки его работы для многих серий коротких и протяженных гаплотипов, осмысления и корректировки величин индивидуальных констант скоростей мутаций для серий гаплотипов разных гаплогрупп, и для времен от сотен, тысяч, десятков тысяч лет назад, и до миллионов лет назад.
 
Приведу один пример большой серии, из 3466 гаплотипов в 111-маркерном формате. Это – гаплотипы субклада R1b-L21. Конечно, в столь большой серии многие гаплотипы должны попадать в нижестоящие по отношению к L21 субклады, которых по классификации ISOGG-2017 имеется 521, и у каждой подгруппы есть свой общий предок. Иначе говоря, мы имеем суперпозицию потомков от огромного количества общих предков, и время жизни «результативного» общего предка окажется несколько заниженным по сравнению с временем жизни общего предка самого «родительского» снипа L21. Это знает любой, кто серьезно занимается ДНК-генеалогией. Поэтому важно понимать, какая задача ставится при расчетах, и для чего такая задача ставится. Более того, заниженное время жизни общего предка оказывается и в том случае, когда носители самых древних снипов в данном субкладе вымирают, и когда от них не остается мужского потомства. Самый драматический случай в такой ситуации называется «бутылочное горлышко популяции», когда древние общие предки ниже какого-то времени «обнулились», потомства от них не осталось, и «патриархом» для всех ныне живущих мужчин данного субклада оказывается относительно недавний общий предок.
 
Классическим примером для такой ситуации мог бы быть «последний из могикан», описанный Ф. Купером в 1826 году. Напомню основную линию повести, которая была написана через 70 лет после франко-английской войны, и согласно которой (линии повести) погибает сын индейского вождя племени могикан, и сам вождь, по имени Чингачгук, остается последним мужчиной племени. На самом деле Купер, конечно, всё придумал, и племя могикан, разошедшее на несколько племен, в наши дни проживает в Канаде и в США, штат Висконсин. Но вернемся к повести Купера. Если бы Чингачгук выжил, женился и обзавелся потомством, и оно бы продолжалось по мужской линии, расходясь на ветви, он был бы общим предком всех последующих потомков этих ветвей. Индейских предков, ведущих свои линии с 10-20 тысяч лет назад в Америке, а до того – в Сибири, не было бы заметно при построении деревьев гаплотипов. Общий предок всех последующих потомков датировался бы примерно 1760-м годом. Это и есть «прохождение могиканами бутылочного горлышка популяции».
 
Возвращаемся к расчету времени жизни общего предка серии из 3466 гаплотипов в 111-маркерном формате гаплогруппы R1b-L21. Все эти гаплотипы показывают 92120 мутаций от базового гаплотипа. Вручную это, конечно, считать никто бы не стал, а в калькуляторе Килина-Клёсова (ККК) это количество мутаций высвечивается в одно касание на дисплее. Если считать по так называемому линейному методу, то имеем 92120/3466/0.198 = 134 → 152 условных поколений (по 25 лет каждое), то есть 3800±380 лет до общего предка. Здесь стрелка – поправка на возвратные мутации, 0.198 – константа скорости мутации для 111-маркерных гаплотипов. Как делать поправку, и какие величины констант скоростей мутаций для гаплотипов разной протяженности – описано в книге «Кому мешает ДНК-генеалогия» (Книжный мир, М., 2016). Теперь обращаемся к ККК – расчет происходит там за секунду, если не быстрее, и на дисплее высвечиваются значения времен до общего предка всех 3466 гаплотипов:
 
111-маркерный формат 3810±381 лет назад
67-маркерный формат 3841±384
37-маркерный формат 3576±358
25-маркерный формат 3571±358
17-маркерный формат 3679±369
12-маркерный формат 3499±352
6-маркерный формат 4162±421
 
Если 111-маркерные гаплотипы обрабатывать квадратичным методом, по другой формуле, то получается 4197±274 лет назад.
 
Если применить логарифмический метод, то в 12-маркерном формате 249 гаплотипов из 3466 оказываются идентичными друг другу, это и есть базовые гаплотипы. Получаем:
 
[ln (3466/249)]/0.02 = 132 → 152 условных поколений (поправка на возвратные мутации для 12-маркерных и 111-маркерных гаплотипов несколько различается), то есть 3800±450 лет назад. Эта величина практически равна той, которая была рассчитана вручную и с помощью ККК.
 
В общем, любой, кто проводил расчеты с помощью ККК, знает, что калькулятор считает, конечно, правильно. Точнее, что в него вводят, то он и считает. Те вариации во временах жизни общих предков, которые (вариации) есть, вызваны самими сериями гаплотипов, их разной протяженностью, ошибками ввода данных и так далее. И вот теперь подходим к основной сюжетной линии данного повествования. Есть любители напускать тень на плетень, они же любители заводить рака за камень, которых хлебом ни корми, а дай волю медленно и тягуче выяснять какой-то несущественный вопрос, который другими давно решен. Они шлют письма за письмами, задают никчемные вопросы, затем задают вопросы к тем своим никчемным вопросам, и, получая объяснения, никогда к ним не возвращаются, как будто их и не было. Никакого «ах, да, теперь понял». Ну что вы, они никогда не согласятся с тем, что они что-то поняли. Как можно? Это не они поняли, это собеседник наконец-то понял, да и то не до конца. Это собеседник должен им быть благодарен, и ответить на другие вопросы, прислать им ссылки, и так далее. Конца этому нет.
 
Работают хронофаги, пожиратели чужого времени, своего времени им не жалко. Они пишут длинные письма, цитируют кого-то там, к делу совершенно не относящегося, и переписка превращается в сказку про белого бычка. Их задача (или натура, ментальность) показать, что это не они задают вопросы, они по сути находят ответы, или они ответы знают, а собеседник не понимает простых вещей. Я начинаю понимать, что должен был оборвать эту переписку еще давно, но это вроде бы невежливость, и потом – хронофаг ведь пока так и не понял, что он материал не усвоил, что у него ошибки, и мой долг на эти ошибки указать. В итоге пишу хронофагу, что переписку прекращаю за отсутствием смысла, прошу больше не беспокоиться. Но хронофаг продолжает присылать письма, типа а почему такая раздражительность, неужели это ответ на его, хронофага, искренность и желание помочь в рассеивании моих заблуждений, почему я не высылаю ему запрашиваемые им программы, статьи и книги, откуда такая секретность, он такую не заслужил, и так далее, и тому подобное. Потом от него идут копии писем, которые он рассылает по миру коллегам, и в которых он, хронофаг, жалуется на то, что я не высылаю ему, хронофагу, нужные компьютерные программы, что необоснованно секретничаю, и так далее, и тому подобное. Я уже давно не отвечаю, а письма и копии писем от него продолжают идти. Встречали таких? Я – немало раз, потому готов для некоторых обобщений. Они уже даны выше. А теперь сам занятный и показательный случай.
 

Письмо 1

Получаю исключительно вежливое письмо, в котором сообщается, что податель сего «случайно набрел» на мою статью, которая показалась подателю «чрезвычайно интересной». Дается линк на какую-то эзотерическую статью про Индию, конечно же, не мою. Но в той эзотерической статье имеется линк и на мою статью 2009 года, в журнале J. Genet. Genealogy. Так что, возможно, именно та статья показалась автору письма интересной. Хорошо. Автор письма представился имеющим математическое образование. Тоже хорошо. Автор подробно, с отвлечениями, рассказывает, что поначалу у него было «огромное количество вопросов», но он постепенно со всеми разобрался, кроме двух или трех. И дальше идет знаковая фраза – «разрешите поделиться моими сомнениями».
 
Такая фраза для меня обычно сигналит о последующей пустой потере времени. Потому что когда человек, малознакомый с базовыми понятиями ДНК-генеалогии (как он и написал) выражает «сомнения», значит, разобрался он в базовых понятиях плохо. И вот теперь он рассчитывает на то, что я ему буду эти базовые понятия подробно растолковывать. Желания такого у меня, честно говоря, нет, как нет на это и лишнего времени, ну ладно, посмотрим, что там у него за сомнения. Может, и у меня появятся, буду в итоге ему признателен.
 
Первое оказалось не сомнение, а пространное описание того, что вместо логарифмической формулы, в которую входит константа скорости мутации маркера или суммы маркеров, можно использовать асимптотическую форму уравнения, которая, как сообщает автор письма, «полностью совпадает с Вашей логарифмической формулой». Хорошо, проехали, ничего нового автор письма не сообщил и не предложил. Ну, роднее ему, милее асимптотическое уравнение, вот и всё. Таких много, будут днями и ночами доказывать, что «в лоб» правильнее, чем «по лбу». Автор письма также сообщил, что асимптотическая формула «помогает по-новому увидеть проблему калибровки констант мутаций», но как это помогает – не сообщил. Ясно, что никак не помогает. Калибровать нужно по реальным данным, а там замена «в лоб» на «по лбу» никак не помогает.
 
И далее автор перешел ко второму «сомнению». Оно у него сводится к тому, что линейный метод расчета времени жизни общего предка (при котором сумма мутаций от базового, то есть предкового гаплотипа в выборке серии гаплотипов делится на число гаплотипов в выборке и на величину константы скорости мутаций для гаплотипов данного формата) неприменим тогда, когда общий предок был один. И когда от него, соответственно, расходились потомки-мальчики, каждый со своим гаплотипом, в котором время от времени, неупорядоченно, при прохождении поколений, спонтанно появлялись мутации. В итоге, когда мы берем выборку, например, 37-маркерных гаплотипов потомков, например, наших современников, в количестве, например, двухсот человек, и в них находим, скажем, 1000 мутаций, то их общий предок жил 1000/200/0.09 = 56 условных поколений назад, то есть 1400 лет назад. Здесь для простоты я опускаю поправку на возвратные мутации и расчет погрешностей получаемой датировки времени жизни общего предка. Это и есть линейный метод расчета.
 
Если все гаплотипы в выборке действительно происходят от этого общего предка, который жил примерно 1400 лет назад, то среди 200 гаплотипов в 37-маркерном формате не наберется и двух идентичных гаплотипов. Поэтому 37-маркерные гаплотипы обычно плохо подходят для логарифмического метода расчета времени жизни общего предка, потому что плохо сохраняются во времени, особенно при прошествии многих веков, а то и тысячелетий. А вот 12-маркерные гаплотипы для этого подходят неплохо. Для нашего случая среди 200 гаплотипов в урезанном, 12-маркерном формате, 65 гаплотипов будут идентичны друг другу. В таком случае получаем [ln(200/65)]/0.02 = 56 условных поколений назад, то есть 1400 лет. Точное совпадение логарифмического и линейного методов расчета. Это означает, что, действительно, все 200 гаплотипов в выборке происходят от одного общего предка, выборка ровная, симметричная, правильная.
 
Повторим «сомнение» человека, представившегося как имеющего математическое образование. Его сомнение состояло в том, что линейным методом в таких случаях, когда общий предок один, пользоваться нельзя. Надо, считает автор письма, чтобы непременно была группа предков с одинаковым гаплотипом. Так сказать, «обобщенный общий предок». Тогда линейный метод, как полагает автор, применять можно. Хотя тут же он пишет, что когда линейный метод применяется в сочетании с логарифмическим методом (как показано выше), то тогда все в порядке, «это не вызывает у меня особого беспокойства».
 
Прочитав такое, я пожал плечами. Наверное, или математик что-то не понял у меня, или я что-то не понял у математика, да и вообще в ДНК-генеалогии невозможно разделить случаи, когда был именно один общий предок, или их было несколько – родные братья, отец и сын, или другие близкие родственники. В приведенном выше случае должно быть не 1400 лет назад, а 1400±150 лет назад, это и есть расчетная погрешность. Иначе говоря, все общие предки попадают в расчетный интервал, равный трем векам. Поди разберись, был там один общий предок для 200 наших современников в выборке, или их целая гроздь в интервале 300 лет. А вот автор письма считает, что если один предок – то рассчитывать нельзя, а если их была целая компания, то рассчитывать можно. С такими математиками не соскучиться.
 
Следуя своему правилу, я ему ответил. Написал, что уж сколько математиков подступались к ДНК-генеалогии – и не перечислю. Вывода обычно было два – или «там всё правильно», или «и не представлял, что на практике всё так сложно». Так что не тратьте время, предложил я своему респонденту. Там в самом деле всё правильно. Чтобы в этом убедиться, надо проанализировать хотя бы несколько десятков реальных серий гаплотипов. Я анализировал тысячи. Это – моя профессия. Более того, в последнее время появились тысячи датировок по снипам, данные по многим сотням ископаемых ДНК, и всё в целом сходится, а если не сходится – на то есть довольно простые причины.
 
Закончил я письмо так: Поэтому, не обижайтесь, но когда я вижу очередное письмо очередного математика или физика, которые в чем-то «сомневаются», не держа в руках ни одного гаплотипа, не проведя – самим – ни одного расчета, я снисходительно усмехаюсь. Таких, как я отметил выше, было множество, и хоть бы какой след остался. Кроме Адамова и Килина. Всё. Нельзя же так, верхоглядством, несерьезно. Опять, не обижайтесь. Но наука «сомнениями» не продвигается. Она продвигается реальным вкладом каждого из «сомневающихся», она продвигается позитивом, а не негативом, не «сомнениями» или «не понял». Не понял – нужно понять, проверить, самому рассчитать, если не так – самому выдвинуть другой вариант расчетов, его апробировать, на многих реальных системах. Как в свое время сделал я. Тем более что у Вас есть свой реальный случай.
 
Письмо 2

На следующий день приходит ответ. Много лишних слов, цветистые выражения, благодарности за полученный ответ. И тут же – предложение «подготовить критический анализ Вашего подхода к ДНК-генеалогии, основанный на расчетах и конкретной проверке способности калькулятора Килина-Клёсова правильно определять время до ближайшего общего предка, если Вы готовы хотя бы рассмотреть возможность публикации результатов такого анализа». И тут же – «Если Вы уверены в теоретической и практической непогрешимости разработанного Вами и Вашими соратниками подхода, во всех его деталях, Вам нечего терять, не так ли?».
 
Я отвечаю: Разумеется, если Вы представите «критический анализ Вашего подхода к ДНК-генеалогии, основанный… на расчетах и конкретной проверке способности калькулятора Килина-Клёсова правильно определять время до ближайшего общего предка», то я с удовольствием опубликую Вашу статью. Но, разумеется, оставляю себе право на сопроводительные комментарии. При этом просьба – не забудьте дать определение понятию «правильно определять», у разных людей может быть разное представление об этом понятии. Любой гаплотип – это результат статистических вариаций аллелей, именно потому датировки по 12-, 25-,37-,67- и 111-маркерным панелям всегда несколько различаются. Это как – «правильное определение» или нет?
 
«Если Вы уверены в теоретической и практической непогрешимости разработанного Вами и Вашими соратниками подхода, во всех его деталях»…
 
Обычно, читая такое, я себе говорю – ну вот, опять начинается. Согласитесь, что эта фраза выше – типичное словоблудие. Нет в науке «непогрешимости» и тем более «во всех его деталях». Иначе наука не развивалась бы. Детали же различаются при переходе от уровня к более глубокому уровню, и так везде в науке. Тем более при рассмотрении статистических подходов. Калькулятор можно подкручивать для разных дисперсий, если Вы заметили, и это тоже «в деталях». Поэтому обратите внимание еще на одну «деталь» – меняется ли результат расчета принципиально, или на уровне процентов, меняется ли ответ по сути.
 
Письмо 3

Начинается с благодарностей за ответ, за «советы, как избежать возможных ловушек на этом пути». Собщается, что это «даже больше, чем я ожидал». Идут слова о достоинстве и порядочности, которые обнаружены моим респондентом в этой переписке. Видимо, в благодарность собщается, что он, автор письма, «не профессиональный математик». Ну ладно, нет проблем. Мне же не дипломы нужны, а толковый вклад респондента в вопросы ДНК-генеалогии. Хотя пошло уже третье письмо, а вклад не просматривается, даже в перспективе. Напротив, респондент выражает надежду, что он «успешно освоит Вашу науку». Вообще-то мне не это было нужно от математика, пусть и не профессионального. Становится все более ясно, что со мной связался типичный хронофаг. Тем более что в завершение этого письма он порекомендовал мне (и «Вашим соратникам») «фундаментальную для всей науки книгу» «Теория вероятности: логика науки» объемом в 758 страниц. Как говорил мой старенький американский приятель – «я уже зеленые бананы перестал покупать»… И еще респондент пообещал ознакомиться с калькулятором. Славно, хорошо, что не все, кто мне пишут, мне столь подробно описывают свои планы.
 
Письмо 4

Прошло более двух недель. Получаю файл с описанием, что этот файл содержит сто 111-маркерных гаплотипов, сгенерированных (методом Монте-Карло) специально для тестирования калькулятора Килина-Клёсова с использованием констант скоростей мутаций индивидуальных маркеров, взятых из того же калькулятора. Респондент просит всё это проверить, построить дерево гаплотипов, посчитать всё вручную и с использованием ККК. Сообщает, что «очень интересно, как это дерево будет выглядеть», поскольку строить деревья он не умеет.
 
Отмечаю для себя, что хронофаг из личинки уже окуклился. Мне-то тестировать калькулятор вовсе не надо, я его тестирую каждый день, и знаю, что он прекрасно работает. Конечно, можно гонять его в разных режимах, при разных ограничениях на дисперсии, с разным количеством нуль-маркеров, при разном содержании палиндромных маркеров, меняя константы скорости мутаций и минимизируя отклонения от получаемых датировок общих предков для разных гаплогрупп и субкладов, и так далее, там работы на поколения расчетчиков. Но мой респондент вовсе не так хочет проверять калькулятор КК. Он берет уже заложенные туда константы скоростей мутаций, «на готовенького», ничего не меняет и не варьирует, и просто решает обратную задачу – исходя из произвольно взятой датировки общего предка и тех же констант скоростей мутаций генерирует набор гаплотипов, и хочет по ним определелить, когда жил тот самый общий предок. Это, оказывается, и есть «проверка», или «тестирование калькулятора».
 
Поскольку понятно, что если генерирование гаплотипов было правильным, то и датировка общего предка получится та же, которую закладывали. А если датировка получится другой, то опять же понятно, что генерировали что-то не то. Или не те условия закладывали. Иначе говоря, мой хронофаг собирается проверить не калькулятор, а свою программу генерирования гаплотипов и условия, которые при этом закладывались. Заложит «кривые» условия – получит «кривую» датировку. И это он собирается выдать за «тестирование калькулятора».
 
Так оно и оказалось. Что меня насторожило, это то, что мой респондент не сообщил, какую же датировку общего предка закладывал. Что это за «тестирование» такое получается?
 
Ну да ладно, это мы позже выясним. Дерево этих ста гаплотипов получилось так себе, гаплотип под номером 1 явно выпадает из общей серии, на дереве четыре базовых гаплотипа (в верхней части, под номерами 55, 57, 58, 60). Если бы дерево было правильным, симметричным, происходящим от одного общего предка, то его датировка была бы [ln(100/4)]/0.198 = 16 условных поколений назад, или 16х25 = 400±204 лет назад.
 

 
Столь большой разброс в датировке определяется тем, что в серии всего четыре базовых гаплотипа. Но сам факт того, что со времени жизни общего предка сохранилось целых четыре немутированных 111-маркерных гаплотипов, показывает, что общий предок действительно жил совсем недавно, по меркам ДНК-генеалогии.
 
Калькулятор КК показывает, что во всех ста 111-маркерных гаплотипах имется 473 мутаций от базового гаплотипа, то есть в соответствии с линейным методом и при счете вручную общий предок жил 473/100/0.198 = 24 условных поколения, или 600±66 лет назад. Сам калькулятор КК дает датировку времени жизни общего предка при расчете по 111-маркерным гаплотипам (линейным методом) 610±67 лет назад, что практически то же самое, что и при ручном счете. Но при расчете 111-маркерных гаплотипов квадратичным методом ККК дает 323±48 лет назад, что значительно занижено. Что-то не так с генерированнной серией гаплотипов у моего респондента. То ли метод Монте-Карло дал сбой, то ли что-то не так в исходных условиях. Тем более что по всем другим панелям идет какая-то чехарда – 67-маркерные гаплотипы дали для времени жизни предка 663±76 лет назад, 37-маркерные – 530±66 лет назад, 25-маркерные 319±53 года назад… Генерированная серия гаплотипов у моего респондента явно какая-то кривая. Это он так калькулятор тестирует? Более того, при снятии самого первого гаплотипа, под номером 1, который явно выпадает из всей серии (что видно на дереве гаплотипов), время до общего предка для оставшихся 99 гаплотипов (в 111-маркерном формате) ныряет от 610 до 578 лет назад, пусть и в пределах погрешности, а если снять любой из оставшихся 99 гаплотипов, то общий предок по времени остается практически такой же. Нет, что-то явно не так с гаплотипом под номером 1, он в заметной степени и делает выборку кривой. Так не должно быть с искусственно генерированными гаплотипами, если, конечно, генерировать правильно.
 
Пишу ответное письмо, уже начиная проклинать, что связался с явным хронофагом. Ничего нового для себя не почерпнул, время затратил, мне подсовывают явно кривую серию, и конца этому, наверное, уже не будет. И если сейчас переписку оборвать, то времени затраченного уже не вернуть, но может, стоит помочь человеку? Он ведь наверное и не знает, что у него ошибка…
 
Итак, ответ моему респонденту: То, что Вы берете индивидуальные константы скоростей мутаций, еще недостаточно для генерирования гаплотипов. Вы не упомянули, что вводили заранее заданное (и произвольно выбранное) время до общего предка этой серии гаплотипов, причем это время было относительно небольшим, всего несколько веков назад.
 
Это время явно недостаточно для многих, если не для большинства маркеров из всех панелей используемых констант. Иначе говоря, примерно для половины всех маркеров число рассчитанных мутаций должно быть равно нулю. Еще иначе говоря, Вы оперировали не 111 маркерами, а примерно 50-ю. В 6-маркерных гаплотипах три маркера были вообще выведены из расчетов, в остальных число мутаций было минимальным. Так проверки, конечно, не делаются.
 
Вы что, действительно ожидали, что при такой постановке «эксперимента» все датировки общего предка по всем панелям будут одинаковыми и равными той величине, которую Вы сами исходно заложили? Но так не бывает.
 
Давайте я отвечу на Ваш вопрос. Вы пользуетесь калькулятором правильно. Тот «сбой», что Вы наблюдаете, это не сбой калькулятора, это сбой в постулатах, заложенных Вами в расчеты, сбой в выборке исходных условий.
 
И вообще, Вы ломитесь в открытые ворота. Я же послал Вам статью в соавторстве с Килиным в журнале Advances in Anthropology, там приведены расчеты для многих реальных систем, некоторые с тысячью и больше гаплотипов (до 3466 гаплотипов в серии), в статье приведены скриншоты по всем панелям, и Вы легко можете проверить, как панели согласуются друг с другом, причем для реальных систем с их недостатками. Зачем Вам создавать кривую систему, далекую от реальности, с вылетающими маркерами, причем до половины их вылетают, и что-то пытаться на этом основании заключать (хотя в данном случае Вы окончательных заключений пока не делали).
 
Искренний совет – не тратьте впустую время, «проверяя» калькулятор. Наука так не делается. Вы хотите найти недостатки, которые в расчетах реальных статистических систем, конечно, есть. Но нахождением недостатков наука тоже не продвигается. Вот если Вы откорректируете индивидуальные константы скоростей мутаций, и покажете на многих примерах, что новый набор констант работает лучше, и покажете конкретно, что такое «лучше», то это другое дело. Но этот путь я уже прошел, причем на десятках реальных серий из сотен и тысяч гаплотипов. Вот когда Вы этот путь тоже пройдете, и на это понадобятся, наверное, месяцы, а то и годы работы, то я Вас первым поздравлю. Но почти гарантирую, что существенно Вы константы не подправите, потому что работает принцип «клюв вытащил – хвост увяз». Впрочем, работайте, нет проблем, я буду с интересом наблюдать.
 
Письмо 5

Получаю письмо, которое начинается с того, что «я здесь вижу очень много недоразумений». И дальше идут витиеватые, избыточные фразы, типа что-то там «и ежу понятно», «если, конечно, Вы не считаете меня ежом», и так далее. В итоге мой хронофаг сообщает, что он, конечно, вводил при моделировании заранее заданное и произвольно выбранное время до общего предка серии гаплотипов, но так его в этом письме и не привел. После ряда опять избыточных пассов о «машинном интеллекте в области ДНК-генеалогии» хронофаг сообщил, что расчеты калькулятора (а значит, и мои расчеты вручную, как линейные, так и логарифмические), что общий предок жил относительно недавно, всего несколько веков назад, «абсолютно неверны». Это, оказывается, «ККК так думает». И для респондента «было большой неожиданностью», что я калькулятору поверил. То, что такие же результаты я получил и безо всякого калькулятора, вручную, в том числе и основываясь на четырех базовых 111-маркерных гаплотипах, мой хронофаг не упомянул.
 
После этого было еще несколько страниц убористого текста, суть которого сводилась к тому, что все мои рассуждения теряют всякий смысл, поскольку мой вывод об относительно недавней датировке (несколько веков назад) общего предка представленной серии является неправильным, а если даже это время действительно «всего несколько веков», то «все равно эти рассуждения не имеют ни малейшего отношения к тому, что я проверяю».
 
И что же тогда «проверяет» мой хронофаг? Цитирую – «Я проверяю совсем другое. Я создаю конкретный случай, который реально мог иметь место в жизни, если предположить, что Ваши константы адекватно описывают реальность. Но я это делаю вовсе не для того, чтобы потом – методом от противного, так сказать – показать, что принятие этих констант приводит к ошибке, абсурду или еще какой-то нестыковке. Мне удивительно, что Вы так подумали. То, что Вы подумали именно так, кажется мне совершенно очевидным (впрочем, моя уверенность совсем не исключает, что я ошибаюсь – бывало такое раз)».
 
Потом хронофаг сообщает, что мое замечание «показалось мне совершенно неуместным. Действительно, если бы даже я заложил в Монте-Карло десятки тысяч лет, все равно самые медленные 6 или 9 маркеров, скорее всего не испытали бы ни единой мутации. Что с того?»
 
Давно, впрочем, ясно, что хронофаг не имеет понятия о предмете, который «проверяет». И дальше хронофаг сообщает о своей цели – «просто продемонстрировать, наглядно, что калькулятор дает явно неправильный результат на примере, о котором я знаю все (я ведь этот пример и породил), т.е. я знаю правильный ответ, который и сверяю с тем, что дает калькулятор».
 
Далее я опускаю несколько страниц рассуждений хронофага, как обычно, витиеватых, о «возражениях», которые я ему «приписываю», но «не по злому умыслу, а по недоразумению», о своих «догадках», о том, что «Вы, с Вашим огромным опытом, сразу поймете, в чем там нестыковка». В итоге хронофаг заключает, что «калькулятор дает не просто неправильный, а неприлично неправильный результат». И что я не потрудился провести «ручной анализ и дать свое заключение». И что я «вообще не заметил эту просьбу, или просто решил ее проигнорировать». И что у меня, видимо, «нет ни сил, ни времени реагировать на все эти просьбы к удовлетворению жаждущих». И что он «совершенно не обиделся бы, если бы Вы прямо так и сказали мне в лицо. Если моя просьба была бестактной, прошу меня извинить». И так далее, и тому подобное.
 
Все это перемежалось фантастически наивными представлениями, типа того, что «я просто не был уверен, что если набор гаплотипов подавать на вход калькулятора в той или иной последовательности, он все равно даст один и тот же результат. Я попробовал пару различных вариантов, и получил один и тот же результат».
 
Представляете? Хронофаг решил даже проверить, что от перестановки гаплотипов в серии результат расчетов не меняется. Он что, действительно полагал, что может меняться? За кого он принимает разработчиков и пользователей калькулятора? И вот теперь он докладывает, что действительно, не меняется. Открыл нам глаза.
 
Далее хронофаг пустился в рассуждения, что никаких «сбоев» у него не было, что и здесь «объясняете неправильно», что «никакие постулаты в расчеты я не закладывал, кроме тех, которые Вы принимаете за доказанные, а именно – индивидуальные константы скоростей мутаций. Плюс, разумеется, конкретное генеалогическое дерево, которое является входной информацией в процесс моделирования Монте-Карло».
 
Вот мы, похоже, и добрались до сути. Постулировалось (или принималось за основу расчетов) некое «генеалогическое дерево». Что занятно, описание этого дерева мне сообщено не было, как не было сообщено и то, когда жил его общий предок. Не сообщил это мне хронофаг и на этот раз, в этом письме.
 
Но зато он оспорил мою фразу «И вообще, Вы ломитесь в открытые ворота», сообщив, что надо было написать «Я думаю, что Вы ломитесь в открытые ворота», «с этим хоть можно было согласиться», и дал линк на некую статью на английском языке, которую, разумеется, я и открывать не стал. И так – на каждую мою фразу. Когда я пишу, например, «Искренний совет – не тратьте впустую время, «проверяя» калькулятор», он долго объясняет, что не стоит так сильно переживать за его время, описывает свою биографию, цитирует художественную литературу, сообщает, что «Вы абсолютно превратно поняли мои устремления. Я не хочу найти недостатки в Вашем калькуляторе».
 
Штука в том, что я как раз на это рассчитывал. Я хотел бы найти систематические недостатки в калькуляторе, если они там есть. Это скомпенсировало бы мои затраты времени на переписку. Но хронофаги такого удовольствия нам не доставляют. Ничего продуктивного от них не дождаться. Они просто едят наше время, как и следует из их названия. Но перемежают это положениями типа такого – «я говорю это Вам совершенно искренне, с полным пониманием масштаба того, что Вы сделали. Вы действительно сделали очень важный прорыв в науке, и, возможно, не менее важный и нужный прорыв для России – нужный именно сейчас, когда с Россией ведется война на уничтожение».
 
В общем, и в этом письме мой хронофаг так и не дал сведений о том, из какого «генеалогического дерева» он исходил, и какой он заложил для расчетов возраст общего предка. Напоминаю, что и калькулятор, и дерево гаплотипов, и расчеты линейный, квадратичный и логарифмический дали возраст общего предка дерева в диапазоне 300-600 лет назад.
 
Поэтому я ответил: Можно было это обсуждение сделать намного более коротким, если бы Вы с самого начала – предыдущего или этого сообщения – привели конкретную датировку общего предка тех ста гаплотипов, которые Вы генерировали, и какое «генеалогическое дерево» закладывали в расчеты. Вместо этого Вы предпочитаете уклончивые пируэты, так и не сообщая эту датировку. Один из таких уклончивых пируэтов следующий – «Вы сделали неправильный вывод, что «это время было относительно небольшим, всего несколько веков». Почему бы сразу не сообщить это время? Зачем эта игра в прятки? Я исходил из того, что наше общение будет прямолинейным, без таких экивоков.
 
Так вот, вывод мой был правильный. Именно несколько веков. Если Вы заложили тысячелетия, то Ваша программа генерации гаплотипов просто неверна, и всё обсуждение теряет смысл. И неверна вот почему. Возьмите хотя бы первый маркер, DYS393, с величиной константы скорости мутации 0.00059 на условное поколение, то есть на 25 лет. Одна мутация в этом маркере в серии из 100 гаплотипов происходит в среднем раз в 1/100/0.00059, то есть примерно раз в 15 условных поколений, или примерно раз в 375 лет. В Ваших ста гаплотипах все сто DYS393 имеют одно и то же значение, «13». Это означает, что общий предок в данном случае жил всего несколько веков назад. Это ККК и показал, при естественном разбросе при столь малом времени до общего предка.
 
Этот вопрос я подробно разбирал в книге «Кому мешает ДНК-генеалогия» (М., Книжный Мир, 2016). Цитата:
 
«Взглянем на серию из 3466 гаплотипов гаплогруппы R1b-L21. Число аллелей в маркере DYS393:
 
11 – 2 (то есть аллель 11 встречается в 3466 гаплотипах всего два раза)
12 – 81
13 – 3237
14 – 145
15 – 1
 
Считая, что все мутации одношаговые, получаем 232 мутации на 3466 аллелей – от базового значения аллели, равного 13».
 
Это – для 3466 гаплотипов. Для серии из 100 гаплотипов, как в Вашем случае, в маркере DYS393 будет наблюдаться примерно 7 мутаций за период времени 3800 лет. У Вас не было ни одной. Значит, общий предок для Вашей серии жил примерно (или менее) 540 лет назад. Это и есть несколько веков.
 
Без решения этой проблемы с Вашими расчетами, скорее всего «кривыми», продолжать обсуждение смысла нет, все эти рассуждения, что «проверить логику» – просто лирика. Какая «логика», если что-то у Вас неверно с самого начала.
 
Еще несколько комментариев. Вы пишете – «Я создаю конкретный случай, который реально мог иметь место в жизни, если предположить, что Ваши константы адекватно описывают реальность». Он иметь место в жизни не мог, см. выше. Что-то не так с Вашими исходными положениями, см. выше. Или этот «конкретный случай» какой-то замысловатый, например, с прохождением бутылочного горлышка потомков «заложенного» общего предка.
 
Вы пишете – «Вообще это замечание показалось мне совершенно неуместным. Действительно, если бы даже я заложил в Монте-Карло десятки тысяч лет, все равно самые медленные 6 или 9 маркеров, скорее всего не испытали бы ни единой мутации».
 
Опять неверно. Такого просто быть не может, чтобы в ста гаплотипах при таких временах в десятки тысяч лет не было мутаций. Вы видите проблему? Вы, не обладая ощущением реальных систем, пытаетесь «генерировать», получаете абсурд, и называете это проверкой логики.
 
Вынужден повторить то, что сказал ранее. Бесполезно искать ошибки в калькуляторе, бесполезно называть его «черным ящиком», так наука не продвигается. Вам надо бы показать, КАК нужно считать, и убедить, что Ваш подход считает лучше, показав это на многих примерах. Без этого будет просто говорильня. Странно, что Вы этого не видите.
 
Вы пишете – «Другой способ – это просто продемонстрировать, наглядно, что калькулятор дает явно неправильный результат на примере, о котором я знаю все (я ведь этот пример и породил), т.е. я знаю правильный ответ, который и сверяю с тем, что дает калькулятор».
 
Заблуждаетесь, см. выше. Вы можете породить пример, приводящий к бутылочному горлышку популяции, знать об этом всё, но получить время жизни общего предка не тысячелетия назад, а относительно недавно. Вот это бы и был «кривой» пример и кривой расчет. Это – не проверка «логики» калькулятора.
 
Вы пишете – «Вы, насколько мне известно, не заявляли, что калькулятор не предназначен для расчета TMRCA для временных промежутков всего в несколько сот лет».
 
Разумеется, не заявлял. Более того, есть много примеров с недавней генеалогией, в несколько сот лет, и ККК считает правильно. Но у Вас другой случай – Вы получаете времена в несколько сот лет, а намекаете (но, к моему удивлению, не говорите), что там значительно древнее. В этом проблема, неужели все еще непонятно?
 
Вы пишете – «Более того, я даже попросил Вас провести ручной анализ и дать свое заключение, почему, по вашему мнению, калькулятор дает не просто неправильный, а неприлично неправильный результат. Но, похоже, Вы вообще не заметили эту просьбу, или просто решили ее проигнорировать».
 
Еще раз повторяю, что ручной расчет и ККК (линейный метод) дают практически одинаковые результаты, и другого быть не может. Ищите свою ошибку сами.
 
«Я не хочу найти недостатки в Вашем калькуляторе».
 
А я, напротив, на это надеялся, потому и трачу время. Но пока я вижу, что у Вас какая-то системная ошибка. Более того, что Вы недоговариваете, что еще хуже. Продолжим тогда, когда Вы найдете у себя ошибку или ошибки, и мы с Вами поймем, в чем у Вас проблема с расчетами. Для этого Вам нужно с самого начала сообщить, что Вы принимали за TMRCA при расчетах. И больше не темнить. Это выглядит неважно.
 
Письмо 6

В следующем письме хронофаг пишет, что «разговор переходит в хорошее русло, и я чрезвычайно этому рад. Несмотря на то, что я вел себя не самым лучшим образом, Вы проявили добрую волю – это дорогого стоит». После нескольких витиеватых, явно избыточных фраз, включая «спешу раскрыть правду, одну только правду и ничего кроме правды», хронофаг раскрывает карты. Он использовал мой собственный опубликованный 111-маркерный гаплотип как базовый (предковый) гаплотип, поместив его на глубину 2500 лет назад, но вместо того, чтобы сделать для начала простое ДНК-генеалогическое дерево, для анализа которого генерировать 100 современных (то есть 2500 лет спустя) гаплотипов, хронофаг пустился опять в витиеватость, так ему присущую. Прежде чем сообщить о его витиеватости, которая и привела его к ошибке «в логике», расскажу, что дало бы простое, симметричное, без затей ДНК-генеалогическое дерево. У 100 современных потомков общего предка, который жил 2500 лет назад, в 111-маркерных гаплотипах было бы суммарно 1802 мутации (естественно, при определенной погрешности, примерно ±90 мутаций). Тогда мы имели бы «линейную» формулу 1802/100/0.198 = 91 → 100 условных поколений (25 лет в каждом), то есть 2500±125 лет до общего предка, как и было задумано. Можно, конечно, обсуждать величину погрешности, задавая разные условия и требования, но здесь это не так важно.
 
Но что же получилось у нашего хронофага? Он при своей хронофаговости начал с заковыристого ДНК-генеалогического дерева. По его модели, у патриарха, то есть общего предка, было пять сыновей, и 1875 лет всё было нормально (то есть до времени 625 лет назад), и вдруг те самые 625 лет назад все потомки померли, кроме двух. По своей хронофаговости автор модели им даже имена придумал, но не буду отвлекаться, в отличие от него. Короче, у одного выжившего потомка за последние 625 лет образовалось более двухсот его потомков. Из них для расчетов взяли 99 человек. От второго потомка, выжившего 625 лет назад, сегодня в живых остался один. Его и взяли сотым для расчетов.
 
Теперь мой комментарий – любой, кто хоть немного понимает в ДНК-генеалогии, видит, что перед нами типичный случай «бутылочного горлышка популяции», с общим предком примерно 625 лет назад. Это для 99 человек в выборке. Сотый будет из системы вылетать, он, в отличие от других 99, продолжает генеалогию предка, жившего 2500 лет назад, но в довольно «кривом» варианте. В общем, то, что мы и видели на дереве гаплотипов выше. Этот одиночка и есть, видимо, гаплотип под номером 1 в серии. Тот, который больше ни с кем на диаграмме фактически не связан.
 
Теперь вернемся к моему первому анализу этой «кривой» серии из 100 гаплотипов, который я описал в письме 4. Анализ был проведен правильно, и показал, что выборка «кривая». Вместо 1802 мутаций, которые были бы при нормальной генеалогии, без прохождения бутылочного горлышка, у хронофага оказалось 473, то есть почти в четыре раза меньше. И понятно, почему – отсчет мутаций начался заново 625 лет назад, а что было до того – «обрублено» бутылочным горлышком. Вот калькулятор КК и показал, что общий предок жил 600±66 лет назад (линейный метод расчета вручную, и 610±67 лет назад при использовании калькулятора, по 111-маркерным гаплотипам), в аккурат с 625 лет назад (в пределах показанной погрешности), заложенных нашим хронофагом. И он, представите себе, пишет, что «калькулятор дает не просто неправильный, а неприлично неправильный результат». Вот и давай такому что-то проверять. Такого понапишут…
 
Вывод из этого «эксперимента на кончике пера» довольно очевиден, и ничего нового для ДНК-генеалогии не дает. Когда система (то есть группа потомков с их гаплотипами) проходит бутылочное горлышко популяции, вся древняя ДНК-генеалогия ниже бутылочного горлышка «обнуливается». При выжившем потомке ДНК-генеалогия начинается сначала. Это – тот самый «эффект последнего из могикан». Жаловаться на то, что калькулятор в этом случае «дает неприлично неправильный результат» – это только показывать отсутствие квалификации в предмете обсуждения. Калькулятор считает совершенно правильно, он видит 473 мутации в ста современных гаплотипах – из этого и исходит.
 
После этого мне, признаться, уже отвечать хронофагу не хотелось. Отвечать было «влом», говоря на новоязе. Не знаю, на что я рассчитывал, продолжая переписку. С одной стороны, 40-летнее профессорство вынуждало провести и относительно завершить процесс обучения того, кто откровенно ошибался. С другой – если ошибка хронофагом будет признана, то кто знает, может, какой-то толк из него выйдет в отношении ДНК-генеалогии? Тогда возможна польза. Но мне очень не нравился стиль его переписки. Начал он вежливо, даже слишком вежливо, с экивоками и подобострастными пассами, но постепенно тон становился всё более развязным, порой просто наглым. И еще – эта болтовня, постоянные отвлечения от академического предмета обсуждения. Я еще понимаю, если бы он работал на публику, педалировал нарциссические нотки, но ведь это у нас предполагалась академическая дискуссия, во всяком случае я так ее видел. Последующая переписка показала, что это его обычная манера, с другими тоже. Подобострастность, переходящая в ерничество, фамильярность, избыточность описаний, полное отсутствие «описаний по факту».
 
Пересилив себя, я продолжил, переходя на более жесткий стиль. Принимать его ерничество было уже выше сил. Отвечаю: Мне этот пинг-понг неинтересен. Я уже объяснил Вам, что Ваша модель неверна. Какие бы там узоры Вы не наводили, типа какие родственики куда перебрались. Я уже объяснил, что Ваша генерированная серия гаплотипов не может иметь общего предка более нескольких веков назад, что калькулятор и показывает. Разбирайтесь сами, что у Вас там неверно.
 
Повторяю опять – даже один только первый маркер (DYS393) не может переходить по цепи потомков 2500 лет, и не претерпеть ни одной мутации (как в Вашей серии). Вот пример серии из 413 гаплотипов гаплогруппы R1a-L1029, с общим предком 2752±278 лет назад (без округлений), то есть TMRCA близкий к предполагаемому Вами. У него DYS393 при предковых 13 имеет 27 мутаций (одна «11», тринадцать «12», и тринадцать «14» – как видите, серия вполне симметрична). Линейный расчет дал 2750 лет до предка (с соответствующей погрешностью), ККК дал 2752 лет до предка, с подобной погрешностью. Логарифмический метод даст близкую величину, как многократно проверено.
 
Еще серия – N1a1, 275 гаплотипов, все три метода расчета – ККК, линейный и логарифмический дали практически одинаковые величины (ККК дал 2917±316 лет до предка, без округлений). DYS393 дал больше 20 мутаций. У Вас же, при меньшем (в 2.75 раза) числе гаплотипов мутаций вообще нет.
 
Условия редактируйте как хотите, я не в бирюльки играю. Суть одна – у Вас есть принципиальная ошибка в расчетах. Ищите ее.
 
Письмо 7

Опять получаю избыточный текст. В ответ на мое четкое – «Повторяю опять – даже один только первый маркер (DYS393) не может переходить по цепи потомков 2500 лет, и не претерпеть ни одной мутации (как в Вашей серии) в серии из ста гаплотипов», идет типичное словоблудие – «Я отвечаю на это возражение теперь, т.е. после того как я подробно изложил, как мой набор из сто гаплотипов был генерирован. До этого момента, практически невозможно было объяснить ясно и доходчиво, почему так получается. Теперь, я надеюсь, это будет легче сделать. Я хочу это сделать следующим образом. Я ставлю один простой вопрос, на который Вы очень легко ответите. После того как Вы ответите на этот вопрос, у Вас наступит момент «эврика», и Вы сами поймете, что вероятность того, что в моем примере маркер DYS393 не имел большого шанса испытать даже одну мутацию».
 
Представляете? Я, по его представлениям, должен испытать момент «эврика». И это после того, что мой хронофаг ясно показал, что не имеет представления о ДНК-генеалогии. И знаете, от чего я должен быть испытать этот момент? От крайне экзотической «генеалогии», согласно которой – хронофаг повторяется, явно не поняв ошибки, которую он ранее сделал – некто жил 2500 лет назад, и от него через 2475 лет (то есть 25 лет назад) осталось только два сына, и от них за последние 25 лет (то есть за последнее поколение) остаются только два выживших сына, от которых за одно поколение (то есть за 25 лет) рождается по 50 сыновей (!), так что у нас имеется 100 современных гаплотипов. Хронофаг наивно полагает, что общий предок для этих 100 человек жил, «естественно», 2500 лет назад. Более того, он, хронофаг, считает, что этот пример «самый убедительный». И он задает вопрос – «сколько мутаций DYS393 вероятнее всего мы увидим по всему набору этих ста гаплотипов»?
 
Ответ мой будет прост – поскольку мы опять имеем бутылочное горлышко популяции, всего за 25 лет до нашего времени, в «горлышке» которого сидят всего два выживших потомка, то какие у них окажутся DYS393, такие в их потомках и окажутся. Будет у них обоих DYS393 = 13, и у всех ста потомков c хорошей вероятностью будут DYS393 = 13; будет у кого-то из них DYS393 = 12 или 14, и у соответствующей ветви потомков будут такие же. Тоже мне, «эврика».
 
Отвечаю: Мне уже не смешно. Вы вроде как должны быть серьезным человеком, хотя бы относительно. Вы отдаете себе отчет, когда пишете специалисту вот такое: «После того как Вы ответите на этот вопрос, у Вас наступит момент «эврика», и Вы сами поймете, что вероятность того, что в моем примере маркер DYS393 не имел большого шанса испытать даже одну мутацию»? И это пишет, называя вещи своими словами, откровенный дилетант.
 
Я не знаю, что произошло с системой образования в России, или с моралью дилетантов, но когда дилетант без зазрения совести пишет такое профессионалу, который обрабатывает серии гаплотипов тысячами, и ему пишет, что у него «наступит момент «эврика», Вы, пардон, в своем уме? Короче, давайте заканчивать. Я думал, Вы серьезнее.
 
То, что Вы «сгенерировали», в ДНК-генеалогии, и вообще в генетике называется «бутылочное горлышко популяции». Оставляя в стороне причудливость Ваших положений, что после 2500 лет остаются два потомка, и у каждого вдруг родилось по 50 сыновей, что говорит только о Вашей экстравагантности, а в науке это определяется как ерничество, после которого желание общаться пропадает (и действительно, что бы Вам ни начать с простой симметричной системы с патриархом 2500 лет назад, и нормальным набеганием потомков в течение всех этих 2500 лет, поскольку тогда не было бы этих бирюлек, и моих нотаций Вам), Вы создали уродливую, несимметричную систему, в которой первый гаплотип полностью вылетает из всей системы, а остальные прошли «бутылочное горлышко», и их «общий предок» жил совсем недавно. Это – так называемый эффект «последнего из могикан», когда именно «последний из могикан» является общим предком всех последующих поколений.
 
Потому-то в Вашей системе общий предок и жил на самом деле совсем недавно, но он к тому же еще и искажен. В итоге появилось уродливое образование с фантомным «общим предком» несколько веков назад. Я с самого начала знал, что Ваши исходные положения абсурдны и ведут к «фантомным» расчетам. Так и оказалось. К тому же Ваша серия гаплотипов тоже искажена. Первый гаплотип, как я сказал, выбивается из всей серии. Это видно из дерева гаплотипов (прикреплено). Если его снять, то число мутаций по всей серии резко падает, от 473 до 444. А если снять любой другой гаплотип, прошедший бутылочное горлышко, то число мутаций в серии почти не изменяется, падает, например, от 473 до 470. Это уже показывает, что серия уродлива, несимметрична, искажена.
 
Теперь посудите сами, зачем мне это нужно, а именно общаться с амбициозным дилетантом, терять свое время для чтения лекций по элементарным положениям ДНК-генеалогии, а дилетант продолжает ерепениться и не хочет анализировать свои принципиальные промахи. Ответ простой – мне это не нужно. Вместо того, чтобы вежливо постучаться и попросить Вас обучить основам предмета, Вы с самого начала повели себя как малограмотный наглец, если называть вещи своими именами… Зла обычно я не держу. Но если наглецы не дают задний ход, не осознают, что они делают крупную ошибку, как научную, так и дипломатическую, я их просто вычеркиваю. Делайте выводы. Короче, если не осознаете, какую ошибку сделали, как научную, так и дипломатическую, то просьба мне больше не писать. Я, как понимаете, переживу.
 
Письмо 8

Получаю письмо с благодарностями за дерево гаплотипов, и с просьбами сообщить, где такую программу «можно приобрести, купить или скачать?», как ей научиться пользоваться, сколько дней или недель для этого нужно? В общем, хронофаг на пастбище, на вольных хлебах. Своих ошибок он так и не признал, продолжает считать, что калькулятор КК «дает неприлично неправильный результат», и теперь хронофаг серьезно полагает, что я продолжу его учить, снабжать программой, объяснять, как с ней работать. И здесь же цитировал «Мастера и Маргариту», в текст письма воткнул полную версию того же фильма, как будто я его об этом просил. И сюда же воткнул линк на книгу «Науку спасут дилетанты», как будто я его и об этом просил. Естественно, его запрос я проигнорировал. Как потом оказалось, это вызвало поток обид, возмущений, жалоб специалистам в попгенетике, которым он писал (исправно присылая мне копии своих писем) о том, что я секретничаю, утаиваю умение строить деревья гаплотипов, запрашивал их мнение о ДНК-генеалогии, и прочее. Все это, что разумеется для хронофага, с приведением моей фамилии в этих рассылках писем. Конечно, я прекратил с ним общение еще до того, что хронофаг исправно отмечал в рассылке писем, что я ему не отвечаю. Он это толковал как мое нежелание раскрывать секреты по части построения деревьев гаплотипов. Он писал и моему зарубежному коллеге-соавтору, и турецким попгенетикам, и изобретателю пакета программ PHYLIP, которые я использую все эти годы. Додумался до того, чтобы спрашивать изобретателя, можно ли применять этот пакет программ для построения деревьев гаплотипов. Хронофаг же. И все это с шутками-прибаутками, ерничанием, обычной для хронофага избыточностью в тексте. Вообще корреспонденция с хронофагом – удовольствие ниже среднего. Сильно ниже. К чему мне, например, знать, что он мусульманин? Однако же он мне и это сообщил.
 
Письмо 9

Отвечать я было перестал, но мой хронофаг прислал следующий набор из 100 гаплотипов в 111-маркерном формате, для «простой симметричной системы с патриархом 2500 лет назад», сообщив, что этим он удовлетворяет моё любопытство (!), и с сопровождением «прилагаю результаты для интересующего Вас симметричного случая».
 
Забавно, не так ли? Можно подумать, что я не знаю, как такая система выглядит и в виде дерева, и в расчетах. Это ему было надо с такой серии гаплотипов начинать. Но хронофаг на то и хронофаг, что разворачивает дело так, что якобы я этим интересовался, и вот он прислал. Сделал одолжение. С пожеланием-просьбой – «Пожалуйста, проанализируйте эту серию гаплотипов ручным способом с генерацией дерева гаплотипов», и далее – «Мне обязательно надо получить эту программу – PHYLIP… и научиться ей пользоваться».
 
Мой ответ: Повторяю – сначала найдите ошибку в Ваших расчетах по предыдущей серии, потом, возможно, продолжим. Вы же мои пояснения и не упомянули, просто проигнорировали, и перескочили к другому примеру, тоже дефектному. Так дело не пойдет. Вы опять не сообщили, из какой генеалогии Вы исходили, но определенно опять не «простой симметричной». Датировки опять резко заниженные (по сравнению с 2500 лет), и скачут от панели гаплотипов к панели. Смотрите сами:
 
111-маркерный гаплотип 858±92 лет назад
67-маркерный 1075±118
37-маркерный 1088±123
25-маркерный 1394±166
17-маркерный 1952±229
111-маркерный, квадратичный 399±62
22-маркерный, квадратичный 193±143
 
И само дерево опять дефектное, никак не соответствует «симметричной серии гаплотипов», первый гаплотип опять в отрыве от всех:
 

 
Письмо 10

На следующий день приходит очередное письмо. Опять ни слова о «кривых» ранних сериях гаплотипов, как и о том, что мой хронофаг понял (если понял), в чем была его ошибка. Но прилагается очередная серия из ста 111-маркерных гаплотипов, «генерированных в предположении, что общий предок не был одним физическим лицом, а скорее представлял группу лиц с одним и тем же гаплотипом».
 
Как видим, хронофаг упорно не хочет создать серию гаплотипов от одного общего предка, или его программа так не работает, сейчас у него «группа лиц с одним и тем же гаплотипом». На мой взгляд, не должно быть никакой разницы, один там был предок, или группа предков с одним и тем же гаплотипом. Возможно, для математика это представляет разницу, но практически разницы нет. Тем более что мы определяем время жизни общего предка с погрешностью в несколько веков, и был там отец с сыном, или группа родных братьев с племянниками – знать нам не дано. Пока, во всяком случае.
 
К этому хронофаг пишет, что «калькулятор КК дает для этой серии очень хорошие результаты», и сообщает, что времена жизни общего предка, рассчитаные по всем панелям (для гаплотипов разной протяженности) «действительно… прекрасно согласуются между собой (2500 лет назад) – причем, пределы ошибок довольно низкие по всем панелям. Мало того, ККК абсолютно точно определил гаплотип обобщенного патриарха (базовый гаплотип, найденный калькулятором, в точности совпал с предковым гаплотипом, из которого серия была получена моей программой)».
 
И далее – «Здесь все происходит именно так, как Вы ожидали. Тот же маркер DYS393, например, испытал 3 мутации при «положенных» 5.9 в среднем, что статистически вполне нормально».
 
Похоже, что мы приходим к пониманию моим хронофагом сути расчетов, хотя так и непонятно, зачем он вместо нормальных систем придумывает экзотические, как здесь, с группой предков. Казалось бы, логичнее начинать с простейших случаев, тем более когда он уже споткнулся на «кривой» генеалогии, которую сам создал. Ну да ладно, может, он все-таки старается.
 
Построил дерево гаплотипов, получилось следующее:
 

 
В общем, неплохо, хотя для 111-маркерного слишком много длинных спиц, наряду с короткими подветвями. Что-то не так, наверное, с его программой генерирования гаплотипов, хотя точно не знаю.
 
Смотрим в калькулятор КК. Да, совершенно другое дело, совпадение датировок для жизни общего предка действительно хорошее, как для линейного, так и для квадратичного методов расчета:
 
111-маркерный гаплотип 2428±250 лет назад
67-маркерный 2368±248
37-маркерный 2352±250
25-маркерный 2318±260
17-маркерный 2561±292
12-маркерный 2505±311
6-маркерный 2549±396
111-маркерный, квадратичный 2541±117
22-маркерный, квадратичный 2644±448
 
Но, собственно, я это и так давно знал. Что нового-то? Да и вообще, где обещанное заключение по «тестированию ККК», как это было заявлено ранее? Мне, правда, это заключение вовсе не нужно, я его и так знаю и знал давно, это нужно скорее хронофагу. Подумать только, десять писем пошло на то, чтобы подтвердить очевидный результат…
 
Пишу ответ: Не знаю, зачем Вам понадобилось опять усложнять задачу с самого начала, а не задать просто одного общего предка, как в процитированной выдержке? Опять выкрутасы?
 
В любом случае, дерево получилось относительно приличное (хотя в нем просматриваются ветви, может быть, из-за «выкрутасов») и калькулятор сработал, как и ожидалось. Медленные 22-маркерные гаплотипы дали нормальный ответ при квадратичном расчете, и завышенный при линейном расчете, хотя и в пределах погрешности расчетов. Завышенный – наверное, потому, что 22-маркерная медленная панель при линейном расчете не рассчитана на времена порядка 2500 лет назад (это скорее для многих тысяч и десятков тысяч лет назад), но при квадратичном расчете вполне приемлема.
 
Полагаю, на этом мы можем остановиться, потому что ответ Вы получили. Я уже говорил, что много математиков пытались найти ошибки и изъяны в расчетах ДНК-генеалогии, но все приходили к выводу, что все в порядке. Вы – не исключение, но с Вами я затратил больше времени, чем на других, и что печально – ничего нового при общении с Вами я не усвоил. Мне это неинтересно. С Килиным мы получили ККК – видите разницу в продуктивности общения? А что получили с Вами? Меня не устраивает роль ментора при амбициозном «проверяльщике», который к тому же занимается выкрутасами. Это не есть для меня продуктивное инвестирование времени. Все остальное – сами, пожалуйста.
 
Всего наилучшего. Когда собьете неоправданные амбиции, освоите основы ДНК-генеалогии, и предложите САМИ что-то интересное, то добро пожаловать. Только при том условии, что не будете растекаться мыслью, цитировать классиков литературы, и оставите игривый тон в стороне.
 
Письмо 11

Получаю объемное письмо, несколько страниц убористого текста. Пошли эмоции, фамильярно-хамские. Хронофаг удивляется, недоумевает, что он пытается меня развлекать, знакомить с хорошей литературой, а я не отвечаю соответственно и недоволен. Что самое занятное – утверждает, что все его предыдущие примеры были правильные, просто что с одним общим предком «Ваш калькулятор не работает в рассмотренных мной случаях». Похоже, он так ничего и не понял. Опять говорит о том, что при генеалогии с одном общим предком «разве можно пользоваться линейным методом?». И тут же пишет, что «когда Вы применяете линейный метод в сочетании с логарифмическим методом в качестве критерия для проверки «чистоты» выборки, это не вызывает у меня особого беспокойства».
 
Как свое достижение, хронофаг пишет – «Я показал Вам случаи, где калькулятор не работает, и показал случаи, где он работает». Представляете? То есть он полагает, что при наличии в генеалогии бутылочных горлышек, калькулятор «не работает». Он, хронофаг, так и не понял, что при бутылочных горлышках в системе вся древняя генеалогия (до горлышка) обрубается, и калькулятор не может знать, что там было до «обнуления» генеалогии. Ему, калькулятору, дают только то, что стало развиваться после прохождения бутылочного горлышка. А хронофаг пишет о том, что таким образом он выявил в калькуляторе КК «очень много изъянов», и что я узнаю об этом «из других источников». Отвечать я не стал. Случай довольно безнадежный.
 
Потом ко мне пошли копии писем, которые хронофаг стал рассылать другим специалистам. У моего зарубежного коллеги-соавтора он допытывался, какой раздел программы PHYLIP тот использовал в расчетах. Он не знал, что тот вообще ничего не рассчитывал, но поставлял таблицы гаплотипов обширной ДНК-генеалогии своего клана, и активно участвовал в обсуждении материалов опубликованной статьи. Коллега так и ответил, что никакой PHYLIP не использовал. Отсюда хронофаг сделал вывод, что я и с коллегой секретничал, и стал писать об этом другим. У турецких попгенетиков он интересовался тем, зачем они разработали и опубликовали другой метод анализа филогении, когда доступен подход PHYLIP? И почему они анализировали гаплогруппу G, что, и у них такая же? С третьими он поделился своим вариантом дерева гаплотипов, хотя они его об этом и не просили:
 

 
В числе других он обратился и к основному разработчику пакета программ PHYLIP, сообщив, что турецкие специалисты (ответа от которых не получил), видимо, не считают PHYLIP подходящим для создания деревьев гаплотипов. Замечаете стиль хронофага? Не получив ответа, он уже сам додумывает их мотивы, и оповещает об этом других. Разработчику он тоже сообщает, что я держу способ использования PHYLIP в секрете. То-то разработчик, видимо, удивился, поскольку этот пакет программ используют по всему миру для самых разных проектов, совсем не связанных с гаплотипами. В завершение хронофаг спросил разработчика, можно ли использовать пакет PHYLIP для построения деревьев гаплотипов, и что тот думает о ДНК-генеалогии как новой области науки?
 
Разработчик программы, видимо, мало что понял, поскольку ответил, что, конечно, можно, особенно для анализа нуклеотидных последовательностей. И что вообще гаплотипы желательно превращать в частоты генов и использовать программу Gendist, но это не лучший вариант. А лучше использовать a better distance method, как, например, the delta-mu-squared distance, ну, и так далее. Но если используются данные нуклеотидной последовательности Y-хромосомы, то можно использовать программу Dnaml, а также программы MrBayes, RAxML, Phyml, PAUP*, и Mega. В общем, для хронофага просто подарок – теперь можно обсуждать это с разработчиком до бесконечности, особенно про секвенирование Y-хромосомы. На вопрос, что тот думает о ДНК-генеалогии как новой ветви науки, разработчик ответил дипломатично, что, мол, всё в науке можно рассматривать как новую ветвь, и любую новую научную статью можно рассматривать как установление «новой ветви».
 
Естественно, хронофаг тут же ответил разработчику, не забыв прислать копию и мне, перемежая свое письмо ему прибаутками, в общем, как обычно, и к моей радости, что он переключился на другого. Поскольку я не отвечал, поток писем и копий писем ко мне постепенно прекратился. Опасайтесь хронофагов. Слов от них дюже много, толку – никакого.
 
Анатолий А. Клёсов,
доктор химических наук, профессор
 
Перейти к авторской колонке
 
 
Ваши вопросы и комментарии можно отправить здесь.
Ответы будут даны на усмотрение автора отдельным постом.
 

Понравилась статья? Поделитесь ссылкой с друзьями!

Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Мой Мир
Опубликовать в Одноклассники
Подписывайтесь на Переформат:
ДНК замечательных людей

Переформатные книжные новинки
     
Наши друзья