Более года назад было «озвучено», как сейчас принято говорить, о планирующейся Лаборатории Академии ДНК-генеалогии в Москве. Срок начала ее работы первоначально приходился на весну 2014 года. Время, прошедшее с тех пор, показало, что не только весной, но и в течение года после того Лаборатория работу не начала. Причины объясняют два расхожих понятия – «бизнес по-русски» и «человеческий фактор».
Возможно, за первое на меня кое-кто обидится, но пусть обижающиеся посмотрят вокруг. К тому же никто из тех, кто обидится, бизнесом наверняка не занимался. Я – занимался, был вице-президентом одной компании, главным вице-президентом другой, был главным научным сотрудником компании. Все три – многомиллионные компании в США. Я плохо представляю, как не отвечать на е-мейлы и факсы в тот же день, или, в крайнем случае, на следующий день. Это – не бизнес. Таких из американской компании выставят в два счета, и лично я выставлю в первую очередь. Это не просто слова, действительно выставлял. А не отвечать неделями и месяцами? А не отвечать два месяца, а потом опять два? А менять е-мейл и месяцами не сообщать об этом, как и не сообщать новый е-адрес? А потом сообщать, что «сейчас лето и мы расслабились»? Это – после нескольких месяцев молчания и неответов на запросы…
Короче, за это время сменился инвестор и две группы генетиков, которые показали полную неспособность к оперативной работе, без которой дела не бывает. Не буду на этом останавливаться. Но я вынес из этого, что в деловом климате России есть проблемы. И не надо ругать Правительство, проблемы – на нижних уровнях.
К счастью, ситуация, похоже, выправилась. И выправилась в лучшую сторону, чем ожидалось раньше. Нашлись специалисты с опытом работы в экспериментальном определении гаплотипов и гаплогрупп-субкладов, в том числе желающие попробовать силы и в анализе древних ДНК, что раньше вообще рассматривалось как желательная, но относительно отдаленная перспектива. Есть взаимопонимание в целях и задачах работы Лаборатории и в направлении массового тестирования, и в направлении анализа древних ДНК. На днях заканчивается финансовая проработка проекта, ценообразования, технических вопросов, как, например, получение и хранение тысяч образцов. Как читатели Переформата уже знают, нам надо было набрать первую тысячу желающих определить свои гаплотип-гаплогруппу-субклад, чтобы продемонстрировать исполнителям-генетикам, что желание и намерение у «масс» есть. Потому что если бы набрали, скажем, всего 200 человек, это означало бы, что проект не созрел. Однако только через Переформат, не привлекая другие ресурсы, предварительные заявки подали уже более 1500 человек.
В итоге после перебирания многих вариантов мы вышли на партнерство. Иначе говоря, новая Лаборатория ДНК-генеалогии имеет две составляющих: одна – дизайн тестирования на снипы и гаплотипы Y-хрососомы, изучение получаемых данных и их глубокая персональная интерпретация (для тех, кто этого захочет); другая – исполнительская, в которую входит вся организационная часть работы, то есть рассылки пробирок для сбора тестов, хранение и обработка полученных образцов, лабораторная генетическая работа и получение первичных данных, которые передаются нам для последующего изучения и персональной интерпретации.
Первая составляющая выполняется в Академии ДНК-генеалогии, и во всяком случае на первом этапе работы, для первых нескольких сотен тестов, анализ результатов тестирования и получение персональных интерпретаций буду выполнять непосредственно я. Для меня это – сугубо научная работа, и этим она меня привлекает. За эту работу (и за никакую другую в отношении Лаборатории ДНК-генеалогии и в России вообще) я денег не получаю, но за проведение глубоких расшифровок тестов в каждом случае заказчик теста вносит установленную сумму в Фонд ДНК-генеалогии. Цели и задачи Фонда были объяснены ранее на Переформате. Если коротко – на покрытие расходов, связанных, например, с тестированием ископаемых гаплотипов, с поддержанием работы Академии, с тестированием людей, у которых нет средств на полномасштабное тестирование, но тестирование которых представляет явный или определенный интерес (предполагаемые потомки Рюриковичей, например).
Вторая составляющая – это наш партнер, или исполнитель, если угодно. Он ведет переговоры с зарубежными поставщиками оборудования и аналитических реагентов, делает соответствующие закупки, выполняет практическую работу по тестированию представляемых образцов ДНК, направляет результаты тестов тем, кто решил не делать глубокую персональную интерпретацию теста за дополнительную плату, и по своей инициативе делает для всех тестирование на мтДНК и аутосомы, которые прилагаются к Y-хромосомному тесту для мужчин, и направляются всем, в том числе и женщинам, которые решили сделать тест. Тем самым снимается дискриминация женщин в отношении тестирования. Но поскольку Академия ДНК-генеалогии делает персональную интерпретацию только для Y-хромосомных тестов, то наши партнеры-генетики уже сами направляют результаты тестов на мтДНК и аутосомы заказчикам. На первый взгляд, это делает систему несколько громоздкой, но главное то, что заказчики тестов получают полный пакет результатов – глубокое снипирование, 23-маркерные гаплотипы для тех, кто заказал глубокое снипирование (отдельного теста на гаплотипы не будет), мтДНК, аутосомы. Степень расшифровки двух последних тестов, которые делает наш партнер, нам пока не ясна, но будущее покажет. Все равно за них отдельно платить не надо, они идут в том же пакете заказа.
Важно отметить то, что поскольку наш партнер выполняет самую дорогостоящую часть работы – оборудование, реагенты, заказы за рубежом, генетическая работа (Y-ДНК, мтДНК, аутосомы), то он определяет цены, и все финансовые операции идут через него. Академия ДНК-генеалогии к финансам по тестированию отношения практически не имеет, за исключением небольших компенсаций на текущие расходы. Заказчики платят нашему партнеру. Иначе говоря, мы с ним работаем в синергизме – мы готовим платформу для анализа Y-хромосомных гаплогрупп-субкладов-снипов и проводим анализ получаемых данных, партнер делает это возможным, предоставляя оборудование и все прочее для генетической работы. Как я многократно подчеркивал на Переформате и в книгах, как только гаплогруппы-субклады-снипы определены, генетика на этом заканчивается. Работа с полученными результатами – это уже не генетика. Историческая интерпретация получаемых данных – это уже не генетика. Это – ДНК-генеалогия.
Итак, повторяю еще раз, чтобы всё было понятно. Заказчик выбирает один из пяти видов продукта:
• Мужчины – глубокие снипы Y-хромосомы, мтДНК, аутосомы.
• Мужчины – то же самое, что в п. 1, плюс 23-маркерный гаплотип за дополнительную оплату.
• Мужчины – то же самое, что в п. 1, плюс персональная интерпретация (за дополнительную оплату).
• Мужчины – то же самое, что в п. 2, плюс персональная интерпретация (за дополнительную оплату).
• Женщины – мтДНК и аутосомы.
Вопрос – что такое «глубокие снипы»?
Пример – некто имеет гаплогруппу I2a1 (скажем, узнал об этом раньше, или пока об этом не знает). Любой, у кого есть эта гаплогруппа, имеет следующие снипы – или один самый верхний, или какой-то из более глубоких, показанных на следующей диаграмме:
• • • I2a1 P37.2
• • • • I2a1a CTS595
• • • • • I2a1a1 M26
• • • • • • I2a1a1a L672
• • • • • • • I2a1a1a1 L160
• • • • • • • • I2a1a1a1a PF4088
• • • • • • • • • I2a1a1a1a1 CTS11338
• • • • • • • • • • I2a1a1a1a1a PF4189
• • • • • • • • • • I2a1a1a1a1b Z118
• • • • • • • • I2a1a1a1b F1295
• • • • • I2a1a2 S21825
• • • • • • I2a1a2a L1286
• • • • • • • I2a1a2a1 L1287
• • • • • • • • I2a1a2a1a L233
• • • • • • • • • I2a1a2a1a1 A417
• • • • • • • I2a1a2a2 L880
• • • • • • I2a1a2b L1294
• • • • I2a1b M423
• • • • • I2a1b1 L161.1
• • • • • • I2a1b1a L1498
• • • • • • I2a1b1b PF4135
• • • • • I2a1b2 L621
• • • • • • I2a1b2a CTS10936
• • • • • • • I2a1b2a1 CTS5966
• • • • • • • • I2a1b2a1a S17250
• • • • • • • • • I2a1b2a1a1 Z16971
• • • • • • • • • I2a1b2a1a2 Y4882
• • • • • • • • • I2a1b2a1a3 A356
• • • • • • • • I2a1b2a1b Y4460
• • • • • • • • • I2a1b2a1b1 Y3118
• • • • • • • • I2a1b2a1c Z17855
Здесь суммарно 31 снип. Это всё, что есть в классификации Международного общества по генетической генеалогии (ISOGG) по состоянию на март 2015 года (не считая дублирующих и эквивалентных). Так вот, все эти 31 снип определяются в московской Лаборатории ДНК-генеалогии. Вот это и есть глубокое тестирование. Другие примеры даны ниже в этой статье.
Как это возможно? Это возможно с помощью так называемого биочипа, на который нанесены «матрицы» для примерно 2200 снипов, и эти «матрицы» вылавливают снипы из образцов наших ДНК, как описано ниже в статье. Все снипы, которые показаны на диаграмме, и которые есть у носителя гаплогруппы I2a1, будет выловлены, «проявлены» и «закреплены», и информация будет сведена в результат тестирования. Дальше – моя задача (при подготовке персональной истории) обрисовать, какие снипы были определены, их место на дереве субкладов и в истории вообще, примерно так, как описано в статье про венетов-венедов, сопоставить с теми результатами, которые были получены ранее для других заказчиков тестов, провести анализ гаплотипов (если они были заказаны), возможно, понадобится построить дерево гаплотипов с персональным гаплотипом на дереве, в общем, показать максимальное количество информации.
Возьму сразу быка за рога. Почему такая лаборатория для масового тестирования ДНК создается только сейчас? Почему не раньше? Что, такие неповоротливые эти российские ДНК-генеалоги? Россия уже ведь опять отстала от США, где тестирование на ДНК проводится почти десять лет. Сколько можно терять темп на старте и наступать всё на те же грабли?
А ответ прост. Для того, чтобы начать тестирование на ДНК современными методами (о них – ниже), надо приобрести пакет на тестирование 1152 человек, и не меньше. Это – минимальный набор, который продается. Себестоимость его примерно 230 тысяч долларов (то есть примерно 200 долларов на человека), и это после всех возможных ухищрений и нудных переговоров с компанией-производителем. И это включая затраты по доставке в Россию и растаможиванию. В России такие не разрабатываются. Почему? Вопрос, в первую очередь, к руководству Российской Академии наук, а потом – к соответствующим потенциальным производителям, по цепочке.
Короче, надо для начала вынуть и положить как минимум 230 тысяч долларов, понимая, что нужно еще как-то собрать этих 1152 человек, которые хотели бы узнать о своей ДНК-генеалогии, причем за деньги. Вопросы есть? Кто когда-либо собирал тысячу человек, которые должны еще деньги дать, тот знает, что просто так, стоя на углу, это не делается. Нужен отлаженный механизм информации, оповещения, который тоже денег стоит. Нужны «клиентские базы данных». Нужны еще специалисты, которые тоже денег стоят. Их тоже нужно откуда-то сдернуть, под некие перспективы, которые в данной неопределенной ситуации туманны – ни 230 тысяч пока не вложены, ни люди не собраны, не организованы. То, что есть предварительные заявки от 1500 человек – это замечательно, собственно, это сделало данный проект возможным, и я постараюсь организовать хорошие скидки для всех этих 1500 человек.
Да и вообще о ДНК-генеалогии до недавнего времени в России знали только единицы, читателям Переформата это объяснять не нужно. Короче, для России такая задача была пока неразрешимой. А я еще не упомянул о том, что для тестирования на ДНК нужно оборудование, которое стоит еще бóльших денег, нужны реагенты для молекулярно-биологических реакций, для «проявления», чтения результатов тестирования, как когда-то проявляли и закрепляли фотопленки, и они тоже совсем не дешевые. Занимаясь созданием этой лаборатории, я получил ответ на запрос о стоимости главной единицы оборудования для чтения результатов тестирования на гаплогруппы и субклады. Это – элегантный электронный ящик размером 52х45х66 см и весом в 65 кг, стоимость с доставкой в Россию, как мне сообщили от производителя оборудования, 450 тысяч долларов, или по нынешним ценам около 27 миллионов рублей. К этому же нужно дополнительное оборудование для подготовки образцов для тестирования, включая экстракцию ДНК из пробирки с раствором, в которую плюнул тестируемый (а именно в таком виде лаборатория получает образец, если точнее – то в полученную пробирку надо собрать примерно 3 мл слюны, но это лучше, чем сдавать кровь) – и это дополнительное оборудование стоит около 150 тысяч долларов, или 9 миллионов рублей. Сюда же – еще оборудование для идентификации 23 маркеров для гаплотипов, стоимостью 18750 долларов, или более миллиона рублей. Наконец (а на самом деле, конечно, не «наконец», еще есть зарплата сотрудникам лаборатории) – стоимость пакета расходных материалов для идентификации 23-маркерных гаплотипов для тех же 1152 человек – 92 тысячи долларов, или 5 с половиной миллионов рублей (себестоимость 80 долларов на человека). Как видим, первичные вложения в лабораторию составляют как минимум 710 тысяч долларов (более 42 миллионов рублей), а еще зарплата сотрудникам, а еще производственные площади…
Короче, без государственной поддержки такая лаборатория была бы нереальной, а ее, поддержки, пока не ощущается. Годами обивать пороги – тоже удовольствие ниже среднего, а дело надо делать сейчас, иначе отстанем опять навсегда. Остается рассчитывать только на частных инвесторов, на спонсоров…
Теперь считаем опять – при затратах почти в миллион долларов на лабораторию, чтобы вернуть хотя бы те же деньги, забыв о прибылях, и добавив к себестоимости тестов хотя бы по 20 долларов на человека, нужно провести 50 тысяч тестов. Много это или мало? Есть два варианта ответа на этот вопрос. Тот замечательный элегантный электронный ящик при максимальной загрузке проводит 256 тестов в неделю, и это если не ломается, без профилактических осмотров и так далее. В таком режиме для 50 тысяч тестов потребуется 195 недель, то есть почти четыре года. Это чтобы только вернуть деньги, и то пока не все. Как, не пробовали находить таких инвесторов? И это при себестоимости одного теста 200 и 80 долларов на человека (снипы и гаплотип, соответственно, и это не включая себестоимость расходных материалов для работы с биочипами)… Не считая затрат на оборудование, зарплаты сотрудникам, аренды помещений.
Другой вариант ответа на вопрос, много это или мало – 50 тысяч тестов. Всего в России прошли тестирование (коммерческое) около тысячи человек. Это – за несколько последних лет. Из них половина оказалась гаплогруппы R1a, остальные в основном восточно-славянской и южно-славянской гаплогруппы I2 и южно-балтийской и финно-угорской гаплогруппы N1c1; остальные – I1, R1b, E1b, N (другие, нежели N1c1), G2a, которые составляют только единицы процентов у этнических русских. Иначе говоря, только за первый месяц новая лаборатория должна сделать столько тестов, сколько все россияне сделали за несколько лет. Инвесторы должны понимать, на что они идут.
Новая лаборатория планирует тестировать мужчин на ДНК с получением новых данных по ДНК-генеалогии персонального характера в количествах не менее тысячи человек в месяц, при выходе на стабильный желательный режим. Это, конечно, будет зависеть от притока желающих. Но для этого нужно объяснить, как будет проводиться тестирование, и какого рода информацию будут получать люди.
Итак, вывод – создание подобной лаборатории дело затратное и рискованное, потому таких лабораторий в России не было. Кое-что было, но работало по другим принципам и другим методологиям. Одна из компаний – «Гентис», о которой я рассказывал в очерке о том, как определить свой гаплотип и гаплогруппу. Но она определяла гаплогруппы и субклады только за отдельную, дополнительную плату, она определяла только 17-маркерные гаплотипы, и клиент платил… в общем, процитирую соответствующие строки (слегка осовремененные) из того очерка:
Цены у Гентис (в пересчете на современные цены):
• 17-маркерный гаплотип – примерно 190 долларов;
• 17-маркерный гаплотип с субкладом – 280 долларов.
Поэтому «Гентис» с рынка ушел, насколько мне известно.
Посмотрим, какие цены предлагает FTDNA (на сегодняшний день, определение гаплогруппы с одним основным субкладом входит в указанную сумму; приведены данные только с 37-маркерного гаплотипа и выше):
• 37-маркерный – 169 долларов;
• 67-маркерный – 268 долларов;
• 111-маркерный – 359 долларов;
• Family Finder – 99 долларов (это – аутосомы);
• BigY – 599 долларов, это большой набор снипов, что сближает данный тест с нашим. Для большинства людей наш тест будет достаточным, но сравните цены.
В отношении субкладов – Гентис предлагал только 46 субкладов (снипов) Y-хромосомы, и отмечал, что такие важнейшие субклады, как Z280, M458, Z93, L342.2 и другие они не определяют. Мы, напоминаю – 2200 снипов.
В списке FTDNA – многие сотни снипов Y-хромосомы, но каждый выполняется только за отдельную плату в 39 долларов (со специальной скидкой – 29 долларов). Хотите проверить у себя десяток снипов – платите еще 390 долларов. Или заказывайте BigY за 599 долларов.
Короче, каждый вариант тестов разный, и каждый выбирает для себя по потребности и исходя из стоимости. Одинаковых тестов на рынке практически нет.
Смотрим на цены швейцарской компании IGENEA. У них – три категории тестирования. Первая – Basic, 239 долларов. Туда входит определение 37-маркерного гаплотипа и основной гаплогруппы. Вторая – Premium, 559 долларов. Третья – Expert, 1399 долларов. В третьей категории определяют 111-маркерный гаплотип и несколько (именно так, всего несколько!) снипов, то есть маркеров SNP. Напоминаю, что в московской Лаборатории планируется определять 2200 снипов. Фактически всё, что на март 2015 года было в классификации ISOGG. С каждым годом число открытых снипов растет, поэтому биочипы можно наращивать по их количеству, если мы найдем это – с вашей помощью – нужным.
Я в этом рассказе уделяю ценам столь большое внимание, потому что не раз слышал разговоры, что на этих ценах компании «наживаются». Берут с тестируемых много, и гребут деньги лопатой. На самом деле – не так, на Западе вообще прибыль в 15% обычно расматривается как отличная. Выше нельзя, потому что конкуренты наступают на пятки, и при повышении цены продукт часто становится неконкурентоспособен. Естественно, бывают разные случаи, бывают продукты уникальные, но я сейчас о тех, где есть нормальная конкуренция. Так вот, на самом деле в классификации ISOGG на конец 2014 года было 12 тысяч снипов, но из них только четверть «уникальных», и еще более восьми тысяч снипов – дублирующие, эквивалентные, или синонимные. Это означает, что они равнозначны один другому. Например, наиболее распространенным снипом среди этнических русских гаплогруппы R1a является Z280, так называемый «субклад Русской равнины». На самом деле, он в классификации ISOGG идет как Z280/S466, S204/Z91. Это означает, что снип S466 – то же самое, что и Z280, только Z280 определен по геномной последовательности группой независимых исследователей (и все снипы, ими найденные, начинаются с индекса Z), а S466 найден в лаборатории Эдинбургского университета, у них все индексы начинаются буквой S. Снип один, но имеет два названия. Два других снипа, S204 и Z91, до сих пор находили у всех, у кого находили Z280. Возможно, Z280 (он же S466) образовался 4900 лет назад, а снип Z91 (он же S204) – 4850 лет назад, через пару поколений, и тогда, разумеется, он есть у всех наших современников, у кого есть Z280. Но если когда-нибудь случайно выкопают скелет потомка именно Z280, который родился, скажем, 4875 лет назад (или его прямого потомка), то у него не будет снипа Z91, но будет Z280. Таких пока не нашли.
Поэтому я, поначалу планируя работу новой Лаборатории, решил включить в поиск все 12 тысяч снипов, используя новую технологию биочипов, о которой расскажу ниже. Но цена, которую выставила компания-изготовитель биочипов, отрезвила. Цена за партию из 1152 тестов на снипы, плюс цена расходных материалов, плюс цена за 23-маркерный гаплотип, плюс расходы на зарплату и оборудование дали как минимум 500 долларов на человека за тестирование. Цена не фантастическая, но, на мой взгляд, высокая для российского потребителя. Хотя и близка к вилке цен FTDNA на 67- и 111-маркерный гаплотип, при том, что там определяют только один снип, а здесь 12 тысяч снипов, правда, только 23-маркерные гаплотипы. Но все равно хотелось бы цену уменьшить. Поэтому я вручную перебрал все 12 тысяч снипов классификации, и снял большинство дублей и синонимов, оставив только 2200 снипов, но без потери качества. В самом деле, зачем определять четыре снипа вместо одного R1a-Z280, когда это по сути ничего не даст, а денег стоит?
При определении 2200 снипов плюс 23-маркерные гаплотипы плюс прочие расходы себестоимость составит 200+80 = 280 долларов на человека. Плюс прочие операционные расходы, но на это я уже повлиять не могу. Окончательные цены от партнера с выходом на финальную стоимость теста будут представлены чуть позже (видимо, через несколько дней), когда появится объявление на Переформате, а те, кто отправил предварительные заявки – раньше других получат мейл-рассылку и, скорее всего, специальную для них скидку, о которой сейчас идут переговоры с нашим партнером. Прошу еще несколько дней подождать.
Чтобы снизить цены, я выходил на других представителей американской компании, в том числе в США. Но они работают только через представителей компании в данной стране, в нашем случае в России. Поэтому не прошел вариант поставок через Турцию (в итоге через Тбилиси, членом Академии которой я являюсь), и поставок через Ирак (в итоге через Курдистан, где работают мои коллеги). Все представители работают только по своим регионам. Так что опять прошу немного подождать.
Снипы – это необратимые мутации в ДНК, в данном случае – в Y-хромосоме, мужской половой хромосоме. Снипы передаются от отца сыну на протяжении десятков, сотен и тысяч поколений, и в ходе этих поколений в ДНК каждой линии образуются и накапливаются новые снипы. Они – необратимые метки каждого рода, каждого племени (как объединения родственников по мужской линии), каждой наследственной ДНК-генеалогической линии. Если у двух человек все снипы (включая «глубокие» снипы) почти одинаковы, это – близкие родственники. Чем больше снипов между людьми в их ДНК – тем дальше они расходятся по родословным, то есть расходятся по разным генеалогическим линиям, племенам, родам. Но все снипы никто не знает, приходится ограничиваться теми, что мы знаем. По последней классификации ISOGG, на конец 2014 г. в Y-хромосоме выявлены, как указано выше, 12 тысяч снипов, которые довольно детально характеризуют каждый ДНК-род и каждое ДНК-племя на планете. Всего главных родов человечества за всю его историю выявлено 37 (см. дерево гаплогрупп ниже; некоторые рода входят в одну основую гаплогруппу, например, R1a и R1b входят в гаплогруппу R), но не все рода дожили до настоящего времени. Часто говорят, что основных гаплогрупп всего двадцать, по числу букв латинского алфавита от А до Т, но это – упрощение, не принимающее в расчет гаплогруппы недавно открытые (например, А0 и А00 в современной Африке); гаплогруппы, исчезнувшие в древности, но обнаруженные в настоящее время, правда, в качестве промежуточных (например, А0-Т, А1, A1b); и сводные гаплогруппы (ВТ, СТ, DE, CF, GHIJK, HIJK, IJK, IJ, LT, NO). Это – древние гаплогруппы, но они оставили своих потомков.
Лаборатория Академии ДНК-генеалогии будет тестировать у каждого мужчины 2200 снипов Y-хромосомы, благодаря новой технологии, и все входят в ту же оплату за тест. Естественно, не все снипы определятся, так как они относятся суммарно ко всем 22 основным гаплогруппам по всему миру, и у каждого определятся только несколько десятков снипов, что у кого в ДНК есть. Плюс – для начала 23-маркерный гаплотип, что является отдельным продуктом, и будет тестироваться по заказу только у тех, кто тестировался на глубокие снипы. Потом предполагаем перейти на 67-маркерные гаплотипы. Вот такого сервиса-тестирования – тысячи снипов плюс гаплотип, плюс персональный анализ гаплотипа с предоставлением персональной же интерпретации – такого сервиса ни в одной компании в мире нет.
Здесь надо сказать, что 67-маркерные гаплотипы, конечно, лучше чем 23-маркерные, но основная ценность первых в том, что они позволяют лучше предсказывать снипы, по структуре самих гаплотипов (эти предсказания часто далеко не абсолютны). Вторая ценность их в том, что они позволяют точнее расчитывать времена жизни общих предков групп гаплотипов, причем чем больше группа, тем расчет точнее (хотя точность расчета обычно ограничивается ±10 процентами). При тестировании на 2200 снипов первая ценность 67-маркерных гаплотипов уже пропадает, поскольку снипы определяются независимо, причем напрямую. Вторая ценность 67-маркерных гаплотипов остается, особенно при малом числе гаплотипов в анализируемой группе. Но поскольку тестирование будет проводиться массово, то много 23-маркерных гаплотипов по ценности в этом отношении уже соотносимо с малым числом 67-маркерных гаплотипов. Иначе говоря, двести 23-маркерных гаплотипов по сути эквивалентны семидесяти 67-маркерным гаплотипам.
Так что при массовом анализе 23-маркерные гаплотипы вполне пригодны, особенно, когда они дешевле. Насколько дешевле? Смотрите сами, FTDNA набрасывает примерно 100 долларов при переходе от 37- к 67-маркерному гаплотипу. Переход от 23-маркерного к 67-маркерному стоил бы дополнительных 150 долларов. Себестоимость у нас возросла бы от 80 долларов до 230 долларов за тест, при сохранении пропорций. А реальный выигрыш? Есть, конечно, но умеренный, просто приятнее иметь 67-маркерный гаплотип, сравнивать друг с другом нагляднее. Так что перейдем со временем и к 67-маркерным, и к 111-маркерным, только надо тесты тогда удешевлять. А еще лучше – переходить к собственным наборам для тестирования, российского производства, включая биочипы, а не заказывать в США.
Как проводится тестирование? Для тех, кто интересуется современной молекулярной биологией, или вообще тонкой техникой, это – поэма. Основной носитель информации – это так называемый биочип, или просто чип – полоска гибкого материала, на которой видны 12 тонких рисок, или полосок шириной в миллиметр и длиной в полтора сантиметра (есть варианты и с 24 полосками на чипе). На каждой риске умещаются те самые 2200 фрагментов ДНК (плюс мтДНК, плюс аутосомы), каждый из которых несет характерную мутацию, определяющую род человека, и принадлежность его к племенам древности. Иначе говоря, среди тех тысяч фрагментов ДНК на каждой риске есть тот, который несет характерную и необратимую мутацию общего предка каждого основного рода на Земле – это гаплогруппы от А до Т. Но это только тридцать семь мутаций (см. дерево гаплогрупп) из 2200, заложенных на каждой риске чипа. Каждая риска предназначена для тестирования одного человека, то есть один чип тестирует 12 или 24 человек. Весь пакет для тестирования 1152 человек – это 96 маленьких «расчесок», а при 24 рисках на чипе – это всего 48 «расчесок», легко умещаются в одном кармане.
У каждого из тридцати семи общих предков были выжившие потомки, и раз во много поколений у них тоже в Y-хромосоме ДНК проскакивали свои характерные мутации, которые унаследовали их потомки. Так что каждый потомок унаследовал целую пирамиду необратимых мутаций, по всей своей ДНК-генеалогической линии, от первопредка десятки тысяч лет назад до относительно недавних предков, живших порой всего несколько сотен лет назад. И вот эти 2200 фрагментов ДНК на риске чипа отражают для каждого мужчины всю цепочку предыдущих поколений за десятки тысяч лет, точнее, тех поколений, в которых проскакивала необратимая мутация, сохранившаяся в потомках по всей цепи до каждого из нас. Всего введены в каталог до настоящего времени те самые 2200 мутаций (если не считать дубли и синонимы, как объяснено выше), и все они есть на чипе.
Тест делается так. Тестируемый банально плюет в присланную ему пробирку, точнее, заливает в нее 3 мл своей слюны, закрывает ее прилагаемой пробкой (при этом пробка автоматически выливает в пробирку консервирующий раствор), и отсылает в Москву. Тем самым, не происходит нарушения российских законов, согласно которым биологические образцы запрещено посылать за пределы России, и которые (законы) волей-неволей нарушали все, кто посылали свои образцы для тестирования в США или другие страны. Так что теперь переходим на самообеспечение. Получив пробирку, лаборатория присваивает ей номер, соответствующий конкретному тестируемому. Далее с использование приборов, описанных выше, из пробирки извлекается ДНК, обрабатывается специальными реагентами, фрагментирующими ДНК, умножающими количество копий фрагментов, и подготавливающими ее для последующего переноса на биочип. Далее крохотная капля подготовленного раствора ДНК наносится на чип, а именно на ту самую маленькую риску шириной в миллиметр, то есть на один чип наносятся образцы от 12 (или 24) человек, и далее фрагменты ДНК сами по себе, следуя законам природы, рассортировываются по всем 2200 фрагментам ДНК на каждой полоске, узнавая только те, которые им родственны. То есть фрагменты ДНК от тестируемого надежно и практически необратимо прилипают к соответствующим фрагментам ДНК на чипе, безошибочно выбирая только «родные», из своего рода-племени. А поскольку эти фрагменты к тому же несут специально прикрепленные флюоресцентные метки, то есть возможность «проявления» этих меток с определением, куда они пристроились, то есть «чтения» нужных фрагментов Y-хромосомы ДНК.
Полученные нано-гибриды, которых на каждой маленькой полоске образуются несколько десятков или сотен, читаются тем самым элегантным электронным ящиком стоимостью почти в полмиллиона долларов. Прибор выдает информацию, какие снипы, то есть характерные мутации, обнаружены в ДНК каждого тестируемого. Далее квалифицированный сотрудник лаборатории на основании этих снипов расшифровывает гаплогруппу и субклад тестируемого. В отдельном тесте происходит определение 23-маркерного гаплотипа тестируемого. После этого пока еще «сырая» информация поступает мне, и если тестируемый желает заказать дополнительное более детальное описание своей «ДНК-родословной», или «ДНК-генеалогической легенды» (легенды в хорошем смысле), то я дополняю «сырую» информацию о снипах и гаплотипе дополнительным описанием того, что увидел в гаплотипах и снипах, провожу расчеты времен жизни общих предков (с другими тестируемыми), строю деревья гаплотипов (если уже накопилась информация от других тестируемых с такой же гаплогруппой, или – лучше – с таким же субкладом). Эта легенда включает описание, к каким родам и племенам относились прямые предки тестируемого мужчины, иначе говоря, какую гаплогруппу и какие субклады несет в своей ДНК данный человек. Фактически, эта информация описывает ДНК-родословную, выявляет исторических родственников, живущих прямо сейчас, в наше время, происходящих из того же рода-племени и имеющих в древности общих предков, и в совокупности с их снипами и гаплотипами выстраивается история рода, встроенная в историю этноса, региона, страны, континента, мира.
У каждой гаплогруппы – своя характерная мутация, или свой снип, показанный рядом с индексом гаплогруппы на ДНК-генеалогическом дереве Y-хромосомы. Таких снипов у каждой гаплогруппы много, я оставил только по одному (иногда два), для примера. Каждая гаплогруппа – это мужской род современного человечества. Иначе говоря – это те рода, которые выжили в ходе человеческой истории на протяжении последних 200 тысяч лет. Вглубь времен от самых древних родов, A00 и A0, выявленных до настоящего времени, уходит ствол древнего генеалогического дерева, от которого в свое время (по разным данным от 300 до 600 тысяч лет назад) в сторону отошел неандерталец; примерно 5.5 миллионов лет назад на этом дереве мы видим общего предка человека и шимпанзе, и далее дерево уходит еще на миллионы лет ниже. Два подряд (в столбик) индекса – это вилка на генеалогическом дереве. Например, А00 и А0-Т – это вилка, расхождение дерева на две ветви. А0 и А1 – следующая вилка, А0a и A0b – следующая вилка, и так далее. А00, А0, A1a, A1b1 сейчас в основном африканские ветви, A0-T, A1, A1b и ВТ, разошедшиеся с ними по вилке, пока среди жителей планеты как самостоятельные субклады не обнаружены, но оставили потомство, которое живет сейчас. Возможно, мы их обнаружим при массовых тестированиях в московской Лаборатории.
Бóльшую часть Европы составляют носители гаплогруппы R, в самой нижней, самой молодой части дерева. Этой гаплогруппе – примерно 30 тысяч лет, в свою очередь, она образовалась от гаплогруппы Р, которой примерно 40 тысяч лет. О ее истории речь пойдет в следующем разделе статьи.
Чтобы было понятнее, приведу свой, личный пример. Ниже – дерево субкладов гаплогруппы R1a, к которой я отношусь. Как уже было упомянуто, примерно 40 тысяч лет назад образовалась гаплогруппа Р, а образовалась она тем, что у предка гаплогруппы Р, а именно у одного конкретного носителя гаплогруппы К, в Y-хромосоме проскочила мутация, которая и породила – в буквальном смысле – гаплогруппу Р. В буквальном, потому что эта мутация оказалась в Y-хромосоме новорожденного мальчика, которому было суждено стать патриархом рода как минимум в два миллиарда человек, которые живут на планете сейчас.
Мы не знаем, какая именно это мутация была, потому что сейчас все мы, потомки гаплогруппы Р, имеем 33 мутации (не считая эквивалентных), которые в разное время образовались в гаплогруппе, или роде Р, и мы не знаем, какая была первой. Мы их имеем все тридцать три. А поскольку они все были открыты в разных лабораториях независимо, и каждая лаборатория назвала ее своим индексом, то все они приведены на дереве ниже, разделенные косыми линиями. Красным отмечены те, что показал в моей Y-хромосоме упрощенный чип, с покрытием всего на 433 снипа. На более современный, с покрытием в 2200 снипов, я еще не тестировался. В принципе, полный чип (на 12 тысяч снипов) должен окрасить в красный цвет все 33 снипа гаплогруппы Р. Но мне это и не нужно, достаточно и двенадцати выделенных красным. В общем, достаточно и одного. А на самом деле, мне и ни одного снипа от гаплогруппы Р не нужно, так как у меня оказалась гаплогруппа R1a, а значит гаплогруппы Р, R и R1 у меня есть автоматически.
Зачем тогда они нужны? А затем, что среди нас есть носители только гаплогруппы Р, а R у них нет, они – прямые потомки предка из гаплогруппы Р, который жил 40 тысяч лет назад. Никаких других мутаций других последующих гаплогрупп – R, R1, R1a, R1b, а также гаплогруппы Q (которая есть у большинства американских индейцев) у них в ДНК нет. Вот для того, чтобы таких найти и рассказать им их историю, мы и определяем гаплогруппу Р, а также все 20 гаплогрупп, для большинства из нас излишние. Если такой найдется, будет сенсация.
Поскольку у меня гаплогруппа R1a, то, само собой, у меня нашлись снипы гаплогруппы R, целых пять штук – М207, Р224, Р232, Р280 и Р285 (первая – с синонимами других лабораторий), но меня это тоже не слишком интересует. Далее, у меня есть, разумеется, гаплогруппа R1, у которой мой маломощный чип с неглубоким покрытием нашел семь снипов (М173, М306, Р233, Р234, Р236, Р238 и Р286).
Далее, чип нашел у меня мутацию М420, показав, что у меня – гаплогруппа R1a, и не только R1a, но и R1a1 (cнип SRY10831.2) и R1a1a (снип М198). А вот дальше маломощный чип ничего не показал, сил не хватило. Но я-то знаю, что у меня есть снипы М417, Z645, Z283, Z282, Z280, CTS1211, CTS3402, Y33, CTS8816, Y2902, YP1447, поскольку их для меня специально определяли в коммерческих компаниях (один уровень из этих помечен желтым ниже). Я поначалу предполагал, что мои снипы есть и в бирюзовой секции ниже, но оказалось, что паралельно L1280 в бирюзовой секции есть еще две ветви, S18681 и Y2902, вот я в последней и оказался. L1280 – это первая северо-карпатская ветвь, S18681 – это вторая северо-карпатская ветвь, и моя Y2902 – это восточно-карпатская ветвь, подветвь – снип YP1447. Туда достал только BigY тест, о котором я ещё расскажу. Он анализирует примерно 10 миллионов пар нуклеотидов, то есть одну шестую часть всей Y-хромосомы (58 миллионов пар нуклеотидов). Еще более глубокие тестыпри их анализе в системе YFull (это – сервисная компания) выявили наличие еще как минимум восьми подветвей ветвей восточно-карпатской ветви. Но это заставляет поставить резонный вопрос – а это в самом деле всем нужно? В смысле, безостановочный поиск среди сотен ветвей и подветвей своей гапогруппы? Что это на самом деле дает большинству людей (не специалистов)? К этому мы еще вернемся.
Восточно-карпатская ветвь находится в самом правом нижнем углу следующей диаграммы (составлена В. Таганкиным и М. Милевским, картинка кликабельна). Мы видим, что для девяти человек, которые прошли YFull тест и у которых оказалась восточно-карпатская ветвь (у всех девяти был найден снип Y2902), выше этого снипа имеется 21 предшествующих снипов. Для всех 77 человек субклада R1a-Z280, образованного примерно 4900 лет назад, среднее количество снипов, образованных за эти 4900 лет, равно 35.2±4.5, то есть снип в среднем возникал раз в 139±18 лет. Таким образом, можно рассчитать, что снип Y2902, то есть восточно-карпатская ветвь, образовался 21х139 (±21х18), то есть 2920±380 лет спустя образования снипа Z280, или примерно 2000±400 лет назад, в конце прошлой – начале нашей эры.
Анализ гаплотипов показал, что у меня действительно восточно-карпатская ветвь гаплогруппы R1a, которая в бирюзовой секции выше не показана. Она на самом деле расширяет бирюзовую ветвь. Восточно-карпатская ветвь имеет общего предка, который – при расчете по мутациям в гаплотипам – жил 2400±200 лет назад. Мы видим, что полученные датировки перекрываются в пределах погрешности расчетов, но расчет по гаплотипам точнее.
Вот так производятся расчеты по снипам (SNP) и по мутациям в гаплотипах (STR). Это сокращения терминов Single Nucleotide Polymorphism и Short Tandem Repeats. Много примеров расчетов даны в недавней статье про венетов и венедов (часть 1, часть 2).
Как ведутся расчеты по гаплотипам? Приведем пример для 17-маркерных гаплотипов, хотя в новой Лаборатории будут определяться 23-маркерные гаплотипы. Сначала у большой группы мужчин определяются гаплотипы, которые в 17-маркерном варианте выглядят следующим образом (на примере моего гаплотипа):
13 24 16 11 11 15 10 13 11 17 – 16 14 20 12 15 11 23
У других гаплотипы будут, например, такие:
13 25 17 10 10 14 10 13 11 17 – 16 14 20 12 16 11 23
13 25 16 10 11 14 11 13 11 16 – 16 14 20 12 17 11 23
13 25 16 10 11 14 11 13 11 17 – 15 14 20 13 16 11 23
13 24 16 11 11 15 10 13 11 17 – 15 14 20 13 15 11 24
13 25 15 11 11 14 10 13 11 17 – 15 14 20 12 16 11 23
Из них строится дерево гаплотипов, которое расходится на ветви, например, как на дереве ниже для 514 гаплотипов гаплогруппы R1a. Эти ветви разделяются, и в них считаются мутации – чем больше мутаций в ветви, тем она древнее. Для расчетов, когда жил общий предок ветви (или субклада), нужно знать число мутаций, число гаплотипов в ветви и константу скорости мутации (ее мы знаем, и она многократно проверена). Возраст ветви определяет ее историю, что есть важная часть ДНК-генеалогии.
Если посчитать формально мутации между приведенными выше шестью гаплотипами, то получится 22 мутации, и общий предок этих шести гаплотипов жил примерно 3025 лет назад (для расчетов используется константа скорости мутации для данных, 17-маркерных гаплотипов). Но так считать нельзя, если эти гаплотипы относятся к разным родам или племенам (то есть ветвям на дереве гаплотипов ниже), потому что «нельзя усреднять поперек разных ветвей». Именно потому для таких расчетов надо знать, к каким родам-племенам относятся гаплотипы, точнее, их носители. Для этого и определяются снипы.
Еще пример – гаплотип моего коллеги по Академии ДНК-генеалогии. Он относится тоже к гаплогруппе R1a, но ее центрально-европейской ветви, субклад R1a-M458-L1029. Диаграмма родительского субклада R1a-M458 представлена ниже, в центральной части диаграммы, М458 находится на 11-м уровне (цифры на полях диаграммы), L1029 – на 31-м уровне, то есть на 20 снип-мутаций позже, чем М458, или на 139х20 = 2780 лет моложе. Картинка кликабельна:
Осталось установить, когда образовался субклад R1a-M458, параллельный субкладу R1a-Z280 (их общий предок – евразийский субклад R1a-Z283, который образовался примерно 5500 лет назад). Каждая из 39 ветвей субклада M458 на диаграмме выше имеет в среднем 36.3±4.0 мутаций от образования М458 до нашего времени, то есть действительно практически столько же, сколько и до субклада Z280 (35.2±4.5 мутаций, см. выше). Это означает, что R1a-М458 возник 139х(36.3±4.0) = 5050±560 лет назад (Z280 – примерно 4900 лет назад), и центрально-европейский субклад R1a-M458-L1029 на 2780 лет позже, то есть примерно 2300±400 лет назад, в I тыс. до н.э.
По мутациям в гаплотипах получается, что общий предок ветви жил 2900±400 лет назад, то есть в пределах погрешности от величины, расчитанной по снипам. Часть носителей этого субклада передвинулись в ходе 1-го тыс. до н.э. с Русской равнины на запад, и вошли клином в Европу, образовав две главных ветви – западно-славянскую и центрально-европейскую. Лужицкие сербы (венды), которые сейчас живут в Германии (Саксония и Брандербург) – часть этого субклада. Территория нынешнего заселения субкладом R1a-M458 – это западная часть Украины и Белоруссии, Польша, Чехия, Словакия, Австрия. Потому и называется – центрально-европейский субклад гаплогруппы R1a. Есть сильное подозрение, что именно они были первыми кельтами в центрально-европейском регионе, и их (индоевропейский) язык и культуру подхватили эрбины (гаплогруппа R1b), которые сейчас населяют 60% Европы (Франция, Испания, Бельгия, Британские острова, значительная часть Германии), и сейчас потомками кельтов считают их. У R1a-M458 – богатая и во многом пока неизвестная история. Нет сомнений, что новая лаборатория значительно прояснит их историю по значительно более широкому набору гаплотипов.
Еще пример того, как определение гаплогрупп, субкладов и гаплотипов позволяет узнать историю древних предков. Следующий тестируемый – носитель гаплогруппы R1b, данные пока получены опять на маломощном чипе на 433 снипа, но результаты получились неплохие. Следует сказать, что гаплогруппа R1b проработана намного лучше, чем R1a: если у R1a выявлено до настоящего времени 66 субкладов, то у R1b – 289 субкладов. Поэтому мне пришлось обрезать нижнюю часть дерева R1b, оставив только первые 30 субкладов. Чип опять прошелся по гаплогруппам Р, R, R1, которые в данном случае неинтересны, поскольку снип уже выявил нижестоящую гаплогруппу R1b, снип М343. По причине маломощности он проскочил субклад R1b1, но выявил субклады R1b1a-P297 и R1b1a2-M269, и в итоге идентифицировал синонимные снипы М405 и U106. Это уже глубоко, и ниже остается только зона, окрашенная желтым цветом. Где-то там – конечный, относительно недавний субклад тестируемого человека, который завершает его ДНК-генеалогию на данном этапе. А она у тестируемого интересна.
Носитель снипа R1b-U106 – это потомок археологической культуры колоколовидных кубков, которые пришли в Европу со стороны Пиреней 4800 лет назад, после огромной по длительности миграции со стороны Байкала – огромной как по расстоянию, так и по времени миграции, она заняла многие тысячелетия. Предки этой ДНК-линии прошли по Русской равнине, оставив после себя многие археологические культуры (включая хвалынскую, самарскую, средневолжскую, древнеямную, часть майкопской), пересекли Кавказ и вышли в Месопотамию, заложили шумерское государство, оттуда прошли на запад по Северной Африке, посадили на царство египетских фараонов (у Тутанхамона – гаплогруппа R1b, субклад M269, тот же, что и у нашего тестируемого), дошли до Атлантики, перебрались через Гибралтар, высадились на Пиренеях примерно 4800 лет назад, и как археологическая культура колоколовидных кубков заселили всю западную и центральную Европу между 4500 и 3000 лет назад. Ныне около 60% населения Европы – их прямые потомки. Общий предок субклада R1b-U106 жил примерно 4175 лет назад, и его носители сейчас чаще всего встречаются в Голландии и Бельгии. В Россию они попадали часто как служащие Иноземного Легиона (поступив на службу к царю, как правило, получая при этом дворянство), как заводчики с запада, как пленные наполеоновской армии, как немецкие переселенцы, и так далее. Для более детальной информации и нужны снипы желтой зоны. А для оценки хронологии, и, соответственно, истории в годах нужны гаплотипы. И глубокая ДНК-генеалогическая интерпретация…
Продолжение (надеюсь) – через несколько дней…
Анатолий А. Клёсов,
доктор химических наук, профессор
Перейти к авторской колонке