|
Сибирское отделение РАН |
Генетические основы биоразнообразия
Базы данных паттернов стали важными инструментами для идентификации отдаленного сходства последовательностей, и следовательно, для предсказания функции белка и его структуры.. Были разработаны технология и программное обеспечение для построения образов семейств белков. С их использованием построен банк образов семейств белков PROF_PAT 1.3.. Этот банк основан на аминокислотных последовательностях SWISS-PROT (rl. 38) и TrEMBL (rl. 11) и содержит образы (паттерны) более чем 14000 групп родственных белков в формате, близком к PROSITE. Отбирались мотивы паттернов, которые имели минимальный уровень вероятности, быть обнаруженными в случайных последовательностях. Банк сопровождает гибкая быстрая программа поиска. Исследователь может определить матрицу сходства/различий для аминокислотных остатков (типа PAM, BLOSUM и др.). Можно также задавать минимальный уровень сходства, что определяет стратегии поиска от точных совпадений до отдаленной гомологии. Тысячи аминокислотных последовательностей могут быть обработаны и идентифицированы в течение нескольуих минут.
Для полного использования потенциала PROF_PAT необходимо его обновлять с каждой новой версией порождающих банков SWISS-PROT + TrEMBL. Для этого разработана автоматизированная процедура, так что новая версия PROF_PAT появляется примерно через месяц после появления новых версий SWISS-PROT или TrEMBL. Последняя версия банка, основанная на 320 000 полных последовательностей SWISS-PROT (rl.39) и TrEMBL (rl.16), содержит образы более чем 27,000 групп родственных белков. Общее число мотивов в паттернах равно 431062, их суммарная длина – 4241824 позиций, по сравнению с более чем 57 000 000 позиций белков, входящих в семейства PROF_PAT.
Банк PROF_PAT размещен на сервере Института Цитологии и Генетики СО РАН (http://wwwmgs.bionet.nsc.ru/mgs/programs/prof_pat/, Новосибирск, РФ), его локальная версия доступна анонимному пользователю на FTP серверах: (ftp://ftp.bionet.nsc.ru/pub/biology/vector/prof_pat/, ИЦиГ, Новосибирск, РФ), и (ftp://ftp.ebi.ac.uk/pub/databases/prof_pat/, Европейский Институт Биоинформатики, Хинкстон, Великобритания).
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск
Дата последней модификации: 06-Jul-2012 (11:44:54)