Игнатьева Е.В.,
Подколодная О.А.,
Ананько Е.А.,
Степаненко И.Л.,
Меркулова Т.И.,
Подколодный Н.Л.,
Наумочкин А.Н.,
Коростышевская И.М.,
Ромащенко А.Г.,
Колчанов Н.А.
Институт цитологии и генетики СО РАН
Базы данных транскрипционных регуляторных районов (Transcription Regulatory Regions Database, TRRD) разрабатываются и поддерживаются в Институте цитологии и генетики СО РАН (г.Новосибирск) с 1993. Доступ к ним возможен через Интернет по адресу http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/. В настоящее время TRRD представляет собой семейство из шести баз данных, которые содержат экспериментальную информацию об особенностях структурно-функциональной организации регуляторных районов генов эукариот. Каждый вход в TRRD соответствует отдельному гену и содержит описание таких иерархических уровней регуляции транскрипции как 1) сайты связывания транскрипционных факторов; 2) регуляторные единицы (промоторы, энхансеры, сайленсеры); 3) регуляторные районы (5' 3' регуляторные районы, экзоны, интроны). Описание каждого уровня регуляции может включать как его структурные характеристики (последовательность, локализация), так и функциональные свойства (влияние на транскрипционную активность гена, специфичность функционирования на определенных стадиях клеточного цикла или этапах индивидуального развития, а также в конкретных типах клеток, тканях и органах). Помимо данных о регуляторных районах гена в базу вносятся также описания транскрипционных факторов, использованных в экспериментах по исследованию связывающей способности либо функциональной активности сайтов, паттерны экспрессии генов, а также ссылки на исходные публикации. Подробное описание формата TRRD приведено в [2, 4].
Данные по каждому гену содержатся в шести базах, связанных взаимными ссылками:
TRRDGENES - общее описание гена;
TRRDUNITS - описание регуляторных единиц (промоторов, энхансеров, сайленсеров); TRRDEXP - паттерны экспрессии геновe;
TRRDSITES - сайты связывания транскрипционных факторов;
TRRDFACTORS - транскрипционные факторы;
TRRDBIB - экспериментальные статьи.
Отличительной особенностью TRRD является то, что в ней содержится только информация, подтвержденная специальными экспериментами. Информационные поля ``ExperimentCodes'' баз TRRDSITES и TRRDUNITS содержат цифровые коды типов экспериментов, подтверждающих функциональность сайтов связывания транскрипционных факторов и регуляторных единиц [5]. Пример представления информации в базе TRRDSITES о сайте связывания транскрипционного фактора HNF-4 в регуляторном районе гена аполипопротеина В человека с цифровыми кодами экспериментов представлен на рисунке 1
Визуализация информации из семейства баз TRRD осуществляется с помощью программы ``TRRD-Viewer'', разработанной с использованием jdk 1.2. TRRD-Viewer обеспечивает представление данных по структурной организации регуляторных районов гена в виде карт гена. Пример регуляторной карты человеческого гена аполипопротеина А II представлен на рисунке 2.
Интерфейс вьюера имеет три окна:
Подвижные скобки в навигационном окне позволяют задать левую и правую границу района, который будет изображен в нижнем окне. Устанавливая указатель мышки на изображения регуляторных единиц (промоторов, энхансеров, сайленсеров), или сайтов связывания транскрипционных факторов, можно получить всплывающую подсказку с краткой текстовой информацией о них. Изображения регуляторных единиц и сайтов являются гиперссылками к их полным тестовым описаниям в базах TRRDUNITS и TRRDSITES. На рисунке 2 видно, что ген аполипопротеина А II содержит энхансер (-911.-653) промотор (-573/-1) и сайленсер (+28/+206) (длинные отрезки выше шкалы). В этих районах локализованы 24, 19 и 5 сайтов связывания транскрипционных факторов соответственно (короткие отрезки ниже шкалы).