РАСШИФРОВКА ГЕНОМОВ ЖИВЫХ ОРГАНИЗМОВ -- СЕГОДНЯ И ЗАВТРА
К целостному представлению о системном молекулярно-генетическом
уровне исследований в вышедших на приоритетный уровень развития
науках о жизни сегодня стремятся исследователи из самых разных
областей знания. В одном из прошлых номеров "НВС"
(N 18, май,
2000 г.) была опубликована статья профессора В.Ратнера,
изложившего историю и основные принципы современной концепции
молекулярно-генетических систем управления -- МГСУ, являющихся
замкнутыми конструкциями, схемами функциональных взаимодействий.
В продолжение темы автор предлагает вниманию читателей статью,
посвященную самому интригующему аспекту проблемы -- расшифровке
геномов живых организмов, в том числе, человеческого генома.
Эпоха секвенирования -- конкретные решения
В 1977-1978 гг. в биотехнологии и молекулярной биологии произошло
важное событие: были разработаны достаточно быстрые и удобные
методы секвенирования (расшифровки последовательностей)
полинуклеотидов. После этого стал стремительно нарастать вал
расшифрованных последовательностей генов, вирусных геномов,
различных фрагментов и т.д. В начале 80-х гг. возникли основные
международные банки данных нуклеотидных и полипептидных
последовательностей, т.е. генетических текстов. На повестке дня
возник вопрос об использовании этого богатейшего материала в
рамках теории МГСУ, а конкретно -- о разработке компьютерных
методов для извлечения генетической информации из этого моря
данных и ее интерпретации.
Важно подчеркнуть, что, имея опыт работы в рамках концепции
молекулярно-генетических систем управления -- МГСУ, мы оказались
полностью подготовленными к такому повороту событий. Очень быстро
наши сотрудники начали собственные разработки и влились в мировой
поток биоинформатики, причем весьма успешно. Возглавил эту работу
доктор наук из Института цитологии и генетики Н.Колчанов, а
наиболее активными участниками были В.Соловьев, А.Жарких,
И.Шиндялов, М.Пономаренко, А.Кель, И.Рогозин и другие. Ими были
разработаны методы сравнительного анализа последовательностей,
поиска генов и знаков управления, восстановления пространственной
структуры макромолекул, филогенетического анализа и так далее.
Таким образом, "рамочная" концепция МГСУ стала наполняться
конкретным содержанием о строении компонент, их взаимодействии и
эволюции. Концепция фактически стала перерастать в теорию МГСУ.
За два последних десятилетия были проанализированы десятки
коллекций и семейств генов, РНК, белков, знаков пунктуации и
управления, построены сотни филогенетических деревьев. Общие
исходные предположения о принципах организации МГСУ подтвердились
на большом фактическом материале.
Однако стратегия массового секвенирования не сводится просто к
накоплению разрозненных фрагментов генетических текстов. Прежде
всего, стали направленно накапливаться данные о генах и
механизмах управления некоторых достаточно сложных клеточных и
межклеточных подсистем: иммунитета, кроветворения, отклика на
тепловой шок, клеточного цикла, SOS-репарации и др. Такие
подсистемы характеризуются генными сетями -- схемами
взаимодействий, на которых базируются динамические модели
функционирования. Этот раздел моделирования МГСУ становится
сейчас чрезвычайно актуальным и продуктивным, так как позволяет
выявить режимы функционирования клеточных подсистем и их
возможные нарушения.
Следует отметить, что генетические взаимодействия в значительной
степени реализуются через регуляторные белки, их функциональные
центры, знаки управления генов и отчасти -- через регуляторные
сигналы (метаболиты, гормоны, модифицирующие воздействия).
Поэтому в последние годы стремительно развиваются исследования
функциональных знаков -- сайтов -- управления транскрипцией:
операторов, сайтов узнавания общеклеточных активаторов,
энхансеров, инсуляторов, тканеспецифичных и гормонспецифичных
сайтов, сайтов "распаковки" хроматина, сайтов ответа на тепловой
шок и др. Компьютерный анализ регуляторных зон генов позволяет
выявить такие знаки управления и замкнуть связи в схемах генных
сетей.
С другой стороны, в последние годы появились новые
экспериментальные технологии, позволяющие автоматически следить
за динамикой сотен и тысяч генов и их продуктов в ходе
функционирования и развития клеток. Такова технология микрочипов
ДНК. Сотни и тысячи клонированных фрагментов ДНК с определенными
генами распределяются по микро-лункам панели и гибридизуются с
меченой валовой РНК клетки (через так называемую к-ДНК).
Благодаря комплементарности цепей, в каждой лунке гибридизуется
отдельная фракция к-ДНК. Затем автоматически микрометодами
измеряются концентрации гибридных молекул. В результате на каждый
момент времени можно выписать все активно транскрибируемые гены.
Эти данные можно сравнить с моделями генных сетей.
Уже в начале 80-х гг. были секвенированы первые полные геномы
вирусов и фагов, среди них -- фага, обозначаемого греческой
буквой "лямбда" . В конце 80-х гг. были начаты крупные
международные проекты полного секвенирования клеточных геномов
бактерий, грибов, высших животных и растений: кишечной палочки,
дрожжей, дрозофилы, мыши, пшеницы, человека и др. В настоящее
время многие из проектов уже завершены; опубликовано свыше 20
полных клеточных геномов микоплазм, архебактерий, кишечной
палочки, возбудителей ряда болезней, а также пекарских дрожжей,
маленького червя-нематоды и растения арабидопсиса.
Вероятно, истинное число секвенированных геномов гораздо больше,
потому что многие фармацевтические фирмы засекречивают свои
результаты, не публикуя их в печати. В последующие месяцы,
вероятно, будет завершено полное секвенирование генома дрозофилы
-- классического объекта генетики, в ближайшее время появятся
данные о завершении секвенирования генома человека. Это
чрезвычайные по важности события в молекулярной генетике и
биоинформатике! Они означают существенный прорыв знаний,
возможностей эксперимента и развития теории МГСУ. Наука о полных
геномах получила название "Геномика".
Уже первые результаты полного секвенирования клеточных геномов
позволили наполнить конкретным содержанием основные модули МГСУ.
Бактериальные геномы содержат примерно от 500 генов у микоплазм
до почти 5000 генов у кишечной палочки. Сравнительные оценки
показывают, что клетки должны содержать не менее 300 генов, в
основном принадлежащих центральной подсистеме МГСУ.
Анализ генома кишечной палочки выявил 4909 генов, из которых 4288
кодируют белки, но функции 38 процентов из них пока неизвестны.
На долю модуля сайзера приходится свыше 460 известных генов
(около 10 процентов), на долю блока контроля метаболизма -- свыше
1047 известных генов (около 25 процентов). Интересно, что эти
1047 генов контролируют 804 известных фермента и 988 известных
метаболических реакций, то есть, их сложность сопоставима. Около
20 процентов известных генов связано с клеточными структурами и
процессами. Поскольку не все выявленные гены опознаны и
идентифицированы, число их будет возрастать, но доли генов вряд
ли существенно изменятся. Кроме того, в геноме кишечной палочки
найдено 2584 оперона -- управляемых единиц транскрипции (секций
архива). Примерно такие же доли генов показывают в основных
блоках другие бактерии, имеющие иные размеры геномов.
Таким образом, МГСУ бактериальных клеток действительно сложны, но
не чрезмерно. Сайзер занимает существенную часть МГСУ и ее архива
-- до 10 процентов, блок метаболизма -- до 25 процентов, блок
клеточного цикла и морфологии -- до 20 процентов. Подавляющее
число генов кишечной палочки входит в автономно управляемые
секции архива, имеющие знаки управления и подчиненные
регуляторным белкам. На оперон приходится в среднем 1-2
регуляторных белка и 1-2 знака управления. Иначе говоря,
регуляторные зоны генов достаточно просты. В то же время, число
выявленных и предполагаемых регуляторных белков у кишечной
палочки приблизительно около 178, т.е. на порядок величины
меньше, чем число оперонов. Это значит, что опероны скорее
образуют ассоциации, управляемые совместно небольшим числом
регуляторных белков. Так начинают вырисовываться контуры
конструкции клеточных МГСУ. "Рамочная" концепция МГСУ оказалась
весьма эффективным средством их описания.
Сравнительный анализ полных геномов фагов, вирусов и клеточных
органелл с клеточными ядерными геномами показывает, что обычно
они не имеют блока контроля метаболизма и полноценного сайзера,
но содержат блок развития и морфологии. Например, у фага "фита"
X174 от блока репликации присутствует только нуклеаза А,
остальные гены и блоки сайзера, а также блок метаболизма,
отсутствуют. У фага "лямбда" от блока репликации присутствуют
только регуляторные гены (О и Р), но полимеразы и полностью блоки
транскрипции и трансляции, а также блок метаболизма отсутствуют.
У фага Т4 имеется полноценный блок репликации, но полностью
отсутствуют блоки транскрипции и трансляции. В митохондриях
млекопитающих имеется часть системы трансляции, но остальные
блоки сайзера и блок метаболизма отсутствуют. В хлоропластах
растений присутствуют полноценная система трансляции, гены блока
транскрипции, но отсутствует система репликации. Поэтому фаги и
органеллы воспроизводятся только с участием клетки-хозяина, они
не самостоятельны.
Перспективы: на уровне прорыва
Бурное развитие биоинформатики и геномики последних лет,
появление новых комплексных экспериментальных технологий создали
новую и весьма продуктивную ситуацию. Полное секвенирование и
идентификация генов таких объектов, как вирусы, бактерии, дрожжи,
дрозофила, нематода, арабидопсис, человек, создают возможность
глобального моделирования МГСУ клеток, в том числе, и в процессе
развития.
На этой основе ожидается прорыв в медицине, биотехнологии,
производстве продуктов питания, фармакологии. Моделирование
развития вирусов позволит выявить "слабые" секции, мишени
фармакологического и иммунного воздействия. Модели МГСУ бактерий
и грибов позволят выявить и оптимизировать пути биосинтеза
лекарств, антибиотиков, метаболических продуктов, а также
нащупать мишени противодействия многим заболеваниям.
Модели МГСУ растений позволят выявить лимитирующие звенья
продуктивности и преодолеть их естественными и гено-инженерными
средствами. Модели МГСУ дрозофилы, скорее всего, внесут основной
вклад в изучение фундаментальных процессов генетической
организации, онтогенеза, изменчивости и тому подобного. Модели
МГСУ человека позволят ускорить поиск средств фармакологической и
иммунной защиты от заболеваний, генной терапии и т.д. Возможно
моделирование взаимодействия МГСУ "паразит-хозяин",
"патоген-хозяин", "симбионт-хозяин", также -- онкогенного
перерождения МГСУ и так далее.
Несомненно, будет расширяться разнообразие видов с изученными
МГСУ. Среди них уже появляются некоторые экзотические формы,
изучение которых может пролить свет на условия выживания в
экстремальных ситуациях: при высоком уровне радиации, высоких или
очень низких температурах, в бескислородной среде, в полной
темноте, в условиях химического и иного загрязнения...
В теории МГСУ остаются нерешенными многие принципиальные
проблемы. Необходимо построение полноценной генетической
лингвистики, правил генетического языка с возможностями прогноза
молекулярных функций. На этом пути уже имеется ряд крупных
открытий, но они не позволяют, скажем, точно предсказать
пространственную структуру белка по его аминокислотной
последовательности. Вероятно, кроме ключевых правил -- "крупных
мазков" -- существует еще "шлейф" весьма специфичных и локальных
правил, число которых очень велико и практически не может быть
описано. Поэтому и в модели, и в реальном эксперименте допустим
случайный поиск оптимальных решений.
На базе секвенированных геномов и генных сетей необходимо
разработать динамические модели онтогенеза, клеточного цикла,
канцерогенеза, физиологических функций, иммунного ответа и
прочего. Единую теорию молекулярной эволюции необходимо построить
как теорию эволюции МГСУ и ее подсистем управления, механизмов
регуляции, лимитирующих факторов организации и так далее.
Все это означает, что роль теории МГСУ и вообще теоретических
методов в молекулярно-биологических науках ближайшего будущего и
их приложениях будет существенно нарастать. Во многих случаях эта
теория становится ключом решения краеугольных проблем и
непременной составляющей каждодневной исследовательской работы
любой биологической лаборатории.
В.Ратнер, зав. лабораторией молекулярно- генетических систем
управления Института цитологии и генетики СО РАН, профессор,
д.б.н., академик РАЕН.
|