Проблемы картирования QTL

Аксенович Т.И.
Институт цитологии и генетики СО РАН, Новосибирск

В последние годы создан богатый арсенал методов картирования генов, детерминирующих комплексные признаки (QTL). Несмотря на это, результаты картирования часто противоречивы, и возможно поэтому до сих пор не заметен прогресс в идентификации QTL и выяснении механизмов генетического контроля комплексных признаков. В работе проведен анализ различных методов, отличающихся друг от друга биологическими принципами, лежащими в их основе, набором предположений, требованиями к эмпирическому материалу и точностью картирования. Показано, что в большинстве методов для описания комплексных признаков используется идеология менделевских признаков, базирующаяся на предположении о существовании определенной мутации в одном структурном гене. В контроле комплексных признаков участвуют многие взаимодействующие локусы, затрагивающие не только структурные, но и регуляторные участки генома, каждый из этих локусов может иметь большое число аллелей, наборы которых могут варьировать от популяции к популяции. Поэтому для прогресса в идентификации QTL нам надо прежде всего дополнить и пересмотреть наши представления о природе комплексных признаков. Одна из основных задач современной генетики заключается в выяснении природы комплексных признаков, к которым в частности относятся многие распространенные болезни человека и характеристики продуктивности сельскохозяйственных животных. Стартовым этапом на пути решения этого вопроса является картирование генов, детерминирующих полиморфизм комплексных признаков (QTL-quantitative trait loci). В отличие от менделевских признаков, контролируемых генотипами одного локуса, комплексные признаки характеризуются сложным механизмом детерминации, в которой участвуют различные взаимодействующие между собой генетические и средовые факторы. Поскольку в подавляющем большинстве случаев ни сами эти факторы, ни их взаимодействие не известны, основным методом картирования QTL является статистический анализ.

Долгие годы статистический анализ оставался лимитирующим звеном на пути прогресса в картировании QTL. Однако в последние годы благодаря усилиям многих исследователей удалось достичь заметного прогресса и сейчас в распоряжении генетиков имеется большой арсенал статистических методов картирования QTL.

В настоящее время существует четыре основные группы методов картирования QTL: рекомбинационный анализ, анализ компонент дисперсии, анализ общности происхождения аллелей, и анализ ассоциаций.

РЕКОМБИНАЦИОННЫЙ АНАЛИЗ

Этот принцип картирования является самым древним, он был предложен как только выяснилось, что геном имеет линейно упорядоченную структуру. В своем первоначальном варианте метод был рассчитан на анализ менделевских признаков. Он предполагал, что генотипы родителей по локусу, детерминирующему признак, и по маркеру известны вплоть до фазы сцепления и рекомбинантные и нерекомбинантные потомки визуально различимы. В этом случае оценка коэффициента рекомбинации легко получается как доля рекомбинантных потомков. Достоверное отличие коэффициента рекомбинации от 0.5 рассматривается как доказательство того, что локус, лежащий рядом с тестируемым генетическим маркером, контролирует анализируемый признак.

Эта же идеология используется для картирования QTL. Предполагается, что среди локусов, детерминирующих комплексный признак, существует хотя бы один, полиморфизм аллелей которого вносит значимый вклад в полиморфизм признака. Именно этот локус и является объектом картирования. Однако, когда анализируется не менделевский, а комплексный признак, генотипы картируемого локуса не визуализируемы, и здесь используется принцип максимального правдоподобия. Функция правдоподобия эмпирических данных записывается как функция модели наследования и в явном виде включает коэффициент рекомбинации. Тестирование сцепления осуществляется с помощью различных вариантов критерия отношения правдоподобия, наиболее популярным из которых является lod score. Материалом для анализа служат родословные, причем предпочтительными оказываются родословные, состоящие из трех и более поколений. Для применения этого подхода необходимо по возможности наиболее полно и корректно описать модель наследования признака. Однако для комплексных признаков это не всегда возможно и здесь на помощь приходят непараметрические методы картирования.

НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ КАРТИРОВАНИЯ

В своем классическом варианте непараметрическое картирование базируется на анализе происхождения аллелей маркерного гена у пары пораженных сибов. Вводится понятие идентичных по происхождению аллелей (IBD) - т.е. аллелей, являющихся копиями одного и того же родительского аллеля. Число IBD аллелей у пары пораженных сибов может принимать три значения: 0, 1 и 2. Если маркер не сцеплен с анализируемым геном, то мы вправе ожидать, что распределение числа IBD аллелей у пар пораженных сибов будет 0.25:0.5:0.25. Отклонение от этого отношения рассматривается как свидетельство в пользу локализации искомого гена вблизи маркера.

Сейчас созданы модификации этого метода, позволяющие изучать не только сибов, но и любых других родственников, анализировать не только качественные, но и количественные признаки. Материалом для анализа как правило являются ядерные родословные, состоящие из родителей и их потомков.

МЕТОД РАЗЛОЖЕНИЯ ДИСПЕРСИЙ

Третий подход является новым, корни его лежат в количественной генетике, где долгие годы основная задача сводилась к оценке вклада генотипа в изменчивость признака и в оценку коэффициента наследуемости. Коэффициент наследуемости определяется как доля генотипической дисперсии в общей дисперсии признака. Для его оценки необходимо разложить дисперсию на компоненты, обусловленные генотипом и средовыми воздействиями. Заполняется вариационно- ковариационная матрица, диагональные элементы которой соответствуют общей дисперсии признака в популяции, а недиагональные элементы, описывающие сходство между парой родственников, определены степенью их родства и генотипической составляющей дисперсии.

Теперь, допустим, что у нас есть дополнительная информация о генотипах маркерного локуса. Тогда можно проверить, не лежит ли один из QTL вблизи этого маркера. Это делается следующим образом. Генотипическая компонента дисперсии раскладывается на две составляющие: одна обусловлена тестируемым локусом, а вторая - всеми остальными QTL. Для первой составляющей коэффициент определяется по IBD маркерных аллелей, а второй - по степени родства. Анализ сцепления в этом случае сводится к проверке значимости вклада генотипа предполагаемого локуса в полиморфизм признака. Материалом для анализа как правило являются ядерные родословные.

АНАЛИЗ АССОЦИАЦИЙ

Четвертый подход заключается в анализе ассоциаций аллелей маркерного локуса и фенотипических характеристик признака. В основе этого подхода лежит предположение о том, что аномальный фенотип вызван определенной мутацией какого-то гена, тесно сцепленного и находящегося в неравновесии по сцеплению с изучаемым маркером. Тогда частота болезни среди случайно выбранных из популяции особей должна зависеть от генотипа маркера. Для редких болезней используют другое сравнение - частота определенного аллеля у больных должна быть выше, чем у здоровых членов популяции. Как видно, этот подход, в отличие от трех предыдущих не требует информации о родственниках, он может быть реализован на популяционных данных. Однако, из-за неоднородности популяций анализ ассоциаций может дать ложно положительный ответ. Чтобы предотвратить это было предложено использовать не популяционный, а родительский контроль, сравнивая аллели переданные и не переданные больному потомку. Для проверки значимости различий был предложен очень популярный в последнее время TDT критерий. Анализ ассоциаций позволяет тестировать гены-кандидаты, а также устанавливать тесное сцепление предполагаемого гена с маркером. Из-за этого, а также из-за простоты использования на этот подход возлагаются очень большие надежды.

МНОГОТОЧЕЧНОЕ КАРТИРОВАНИЕ

Первоначально для картирования генов использовали отдельные маркеры, поочередно проводя двуточечный анализ. Развитие молекулярной генетики обеспечило создание огромного числа маркеров, что позволило перейти от рассмотрения пары локусов, состоящей из маркера и анализируемого гена, к позиционированию анализируемого локуса в каждую точку генома. В результате такого анализа строится кривая, описывающая правдоподобие локализации анализируемого гена в каждой точке генома. Локусы с высоким значением LOD рассматриваются как места локализации предполагаемого гена. Многоточечное картирование имеет ряд преимуществ перед двуточечным, основным из которых является повышение информативности данных.

Таким образом, за последние 10 лет был создан богатый арсенал статистических методов, направленных на картирование QTL. Не удивительно поэтому, что каждый месяц в журналах появляются десятки статей, в которых описывается сцепление или ассоциация маркеров с различными болезнями. Несмотря на это прогресс в идентификации генов, детерминирующих комплексные болезни, и в установлении механизмов их контроля мало заметен. Прежде всего, настораживает то, что результаты картирования часто неоднозначны. Сцепление, найденное одними авторами на определенном материале, часто не подтверждается другими исследователями при анализе других популяций. Ярким примером этого является рак простаты или диабет второго типа, для которого обнаружено более 20 мест возможной локализации QTL. Только менее половины из них подтверждено на двух и более выборках. Отмечены случаи, когда ни один из структурных генов, находящихся в районе локализации QTL, не обнаруживает корреляции с признаком. И наконец, часто гены, по своей биологической функции претендующие на роль генов кандидатов, не проходят проверку.

В чем причины таких ситуаций? Прежде всего, в недостаточной мощности существующих методов картирования QTL. Необходима разработка новых методов. Например сейчас предлагается объединять анализ сцепления и анализ ассоциаций. Среди существующих методов наибольшей мощностью обладают параметрические методы анализа сцепления. Однако это их свойство сохраняется лишь до тех пор, пока модель наследования признака определена правильно. Искажение модели помимо потери мощности может привести к сдвигу района возможной локализации гена, так что в указанный район действительно не попадет ген-кандидат. Поэтому сейчас продолжаются исследования по созданию новых моделей наследования комплексных признаков. Кроме того изучаются вопросы, связанные с информативностью выборки, на основе решения которых можно будет заранее планировать ее структуру.

Увеличение мощности анализа сцепления и разработка более точных моделей наследования признаков - технические задачи, которые, вероятно, будут решены в ближайшее время. Можно ли мы надеяться, что за их решением последует мощный прорыв в идентификации QTL? Скорее всего нет. И дело здесь не в степени разработки статистических методов анализа, а в наших представлениях о природе комплексных признаков, которые мы в явном или неявном виде закладываем в этот анализ. В самом деле, все существующие методы рассматривают комплексные признаки как усложненные варианты менделевских признаков. Если в менделевских признаках фенотип определяется генотипом одного локуса, то для комплексных признаков также предполагается существование майоргена, эффект которого может модифицироваться другими генетическими и средовыми компонентами. Не случайно поэтому наибольший прогресс в картировании QTL наблюдается именно для признаков с майоргенным типом наследования.

Более того, по крайней мере при анализе ассоциаций предполагается, что экстремальный фенотип или болезнь вызывается определенной мутацией картируемого гена, то есть существует только один аллель предрасполагающий к болезни. Если для редких рецессивных болезней такое предположение кажется оправданным, то вряд ли с ним можно согласиться, когда речь идет о распространенных болезнях. Мало вероятно, что у всех больных независимо возникла одна и та же мутация или что все больные произошли от одного общего предка. Поэтому концепция комплексных признаков должна учитывать множественность локусов и аллелей.

Еще одно допущение, взятое из генетики менделевских признаков, заключается в том, что предрасположенность к болезни определена изменением структурного гена. Именно структурные гены рассматриваются в роли генов-кандидатов. Уже сейчас показано, что в качестве QTL могут выступать некодирующих последовательности. Например один из генов (calpain-10), ассоциированных с риском диабета второго типа, лежит в интроне (притом, вероятнее всего, не влияет на альтернативный сплайсинг, но может принимать участие в регуляции экспрессии).

Кроме того, модели наследования комплексных признаков могут быть разными для разных популяций. Если в одной популяции низок полиморфизм аллелей какого-то локуса, то этот локус выпадает из модели, объясняющей полиморфизм признака. Ясно, что поэтому в разных популяциях ведущую роль в детерминации признака могут играть различные гены. Это можно проиллюстрировать на примере наших исследований, посвященных анализу наследования размера помета у многоплодных млекопитающих. Было известно, что у сельскохозяйственных и лабораторных животных коэффициент наследуемости размера помета мал (0-15%). Однако, у этих животных размер помета входит в список селекционируемых признаков. Поэтому, можно было предположить, что низкий уровень генетической изменчивости связан с отбором и унификацией генотипов. Мы исследовали размер помета у представителей природных популяций бразильского полевого хомячка (Akodon cursor). Оказалось, что коэффициент наследуемости составляет более 50% и признак имеет классическое полигенное наследование без иерархии вкладов отдельных генов. Далее, были обнаружены популяции мускусной землеройки (Suncus murinus), вдвое отличающиеся по размеру помета. Были получены межпопуляционные гибриды, и мы изучили, чем определяется разница этих популяций по размеру помета. Оказалось, что значительная доля этой разницы может быть объяснена полиморфизмом аллелей единственного локуса. Таким образом, если делать вывод о генетическом контроле размера помета, то из первого эксперимента следует, что его вообще нет, из второго - что генетическая компонента объясняет больше половины изменчивости признака и существует много генов малого эффекта определяющих фенотип. Из третьего эксперимента можно заключить, что изменения аллелей одного гена достаточно, чтобы вдвое увеличить размер помета.

Из сказанного следует, что наши представления о биологии комплексных признаков еще очень далеки от действительности и именно это сейчас является узким звеном в изучении этих признаков. Генетика комплексных признаков - это больше, чем генетика "нескольких генов"; необходим пересмотр и расширение наших концепций о детерминации фенотипа генотипом.


Грант РФФИ 01-04-49518

Ваши комментарии
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2001, Сибирское отделение Российской академии наук, Новосибирск
© 2001, Объединенный институт информатики СО РАН, Новосибирск
© 2001, Институт вычислительных технологий СО РАН, Новосибирск
© 2001, Институт систем информатики СО РАН, Новосибирск
© 2001, Институт математики СО РАН, Новосибирск
© 2001, Институт цитологии и генетики СО РАН, Новосибирск
© 2001, Институт вычислительной математики и математической геофизики СО РАН, Новосибирск
© 2001, Новосибирский государственный университет
Дата последней модификации Monday, 13-Aug-2001 21:32:24 NOVST