В.В.Аленин, В.Н.Серов, А.В.Спиров, М.Г.Самсонова
Институт высокопроизводительных вычислений и баз данных Миннауки РФ, Санкт-Петербург
Тел.: (812) 251-00-38, факс: (812) 251-83-14, e-mail: samson@fn.csa.ru
В настоящее время одним из основных направлений исследований в области молекулярной биологии является анализ структуры и принципов функционирования генных сетей. Генные сети образуются ансамблями взаимодействующих генов. Центральную роль в генных сетях играют гены, кодирующие факторы транскрипции, которые активируют или репрессируют другие гены сети. Продукты этих генов, в свою очередь, действуют на другие гены-мишени, которые в конечном итоге включают или выключают структурные гены. Таким образом генную сеть можно представить как сложную "паутину" генов, включающих или, наоборот, выключающих работу друг друга.
В настоящее время акцент в биомедицинских исследованиях смещается от идентификации генов к выяснению их функции. В связи с этим выяснение механизмов взаимодействия генов, а следовательно организации и функционирования генных сетей становится одной из главных задач молекулярной биологии.
Выяснение структуры, логики и динамики генных сетей является очень сложной задачей, поскольку, к примеру геном человека насчитывает около 80 000 генов. Поэтому ее решение потребует разработки новых математических теорий и алгоритмов, а также создания адекватных баз данных.
Базы данных генных сетей (БДГС) должны обеспечить поддержку пользователя на большинстве этапов решения научной проблемы - выяснения принципов организации и функционирования генных сетей. Эти этапы включают поиск информации, ее интерпретацию, получение новых данных в результате моделирования и совместной научно-исследовательской работы в сети Интернет.
БДГС должны содержать различные наборы данных (компоненты): данные о генных сетях, данные об экспрессии генов сетей и теоретические модели генных сетей. По своей сути эти данные представляют собою текстовую информацию, цифровые изображения, карты, анимацию, количественные данные и алгоритмы. Интерфейс к БДГС должен обеспечивать пользователю возможность визуализации структуры генной сети и ее функционирования во времени и пространстве, а также результатов моделирования динамики передачи сигнала в генных сетях.
Мы работаем над созданием прототипа БДГС - базы данных GeNet. Работа проводится в несколько этапов. На первом этапе мы сосредоточились на сборе информации и разработке методов визуализации структуры генной сети, ее функционирования во времени и пространстве, а также результатов моделирования динамики передачи сигнала в генных сетях.
Функционирующая в настоящее время версия GeNet содержит информацию о структуре и функции генетических сетей, контролирующих эмбриогенез и ответ клеток эукариотических организмов на стресс.
Эта версия GeNet представляет собою гипертекстовую базу данных. Она доступна on-line по адресу http://www.csa.ru/Inst/gorb_dep/inbios/genet/genet.htm, зеркальная копия GeNet установлена на сервере http://www.mssm.edu/molbio/genet/genet.htm.
GeNet содержит карты генных сетей, данные о механизмах взаимодействия генов, количественные данные и цифровые изображения картин экспрессии генов сети на разных этапах, данные полученные в результате экспериментов по "обратной инженерии" (т.е. данные о структуре и функции генетической сети, полученные в результате математического моделирования и статистическими методами), теоретические модели генных сетей. Интерфейс к базе данных GeNet, основанный на использовании языка программирования Java, делает возможной визуализацию структуры генной сети, ее функционирования во времени и пространстве, а также результатов моделирования динамики передачи сигнала в генных сетях в рамках модели Булевых сетей. Разработано приложение, позволяющее пользователю интерактивно конструировать любую генетическую сеть.
Три точки входа в базу делают возможными просмотр информации в базе, поиск информации и работу с картами генных сетей. Текущая версия GeNet содержит около 1200 файлов в форматах *.html и *.gif и занимает около 15 Мб дискового пространства. Она содержит информацию о 400 генах и 120 регуляторных элементах. GeNet содержит 20 карт генных сетей и 50 изображений картин экспрессии генов.