В настоящее время коллективная работа с данными и знаниями получила значительный импульс в силу доступности для большинства исследователей ресурсов сети Интернет. Одной из форм такой работы являются распределенные информационные системы. Примером такой системы является распределенная информационно-вычислительная система "Молекулярная спектроскопия", разрабатываемая для научной общественности тремя группами спектроскопистов.
Базовые узлы этой системы будут расположены в Томске, Санкт-Петербурге, Нижнем Новгороде и Москве. В системе используются три типа данных: структурные параметры молекул, параметры спектральных линий и спектральные функции. Обмен данными между базовыми узлами основан на репликации баз данных и тиражировании метаданных. В настоящее время функционируют два базовых узла с адресами http://saga.atmos.iao.ru/ и http://saga.molsp.phys.spbu.ru/.
Кроме базовых узлов предполагается создание узлов-поставщиков для организаций являющихся собственниками информационных ресурсов в области молекулярной спектроскопии. Эти организации обеспечиваются типовым программным обеспечением для поддержки узла. Между узлом поставщиком и базовым узлом осуществляется только обмен метаданными.
Доклад посвящен описанию организации обмена метаданными в распределенной системе “Молекулярная спектроскопия”. На примере случая расчета коэффициента поглощения показаны все этапы: от создания документа и его метаданных, до механизма обмена метаданными.
Работа с метаданными по коэффициенту поглощения для экспериментальных данных в информационной системе “Молекулярная спектроскопия” состоит из двух этапов. Первый этап включает в себя формирование метаданных для опубликованного в литературе описания эксперимента, другими словами описывается источник данных. Метаданные формируются с помощью веб-форм и сохраняются в базе данных по коэффициенту поглощения. Второй этап состоит в формировании метаданных для результатов научного эксперимента. Это разделение было необходимо, так как для одного научного эксперимента в конечном результате возможно появление нескольких выходных наборов данных. Запись метаданных в формате RDF проводится на втором этапе. Мы используем две схемы метаданных: форматную схему Dublin Core и предметную схему по коэффициенту поглощения в молекулярной спектроскопии. Метаданные, соответствующие этим двум схемам, сохраняются в отдельные RDF-документы для последующего применения.
Для проверки достоверности вводимых данных мы используем XML-документ и соответствующие XML-схемы, затем если все данные были корректными они идут на дальнейшую обработку.
RDF-документы формируются последовательно из данных пользователя и технических данных информационного портала, сначала формируется RDF-документ по схеме Dublin Core, а затем RDF-документ по RDF-схеме для коэффициента поглощения. Затем эти RDF-документы добавляются в реестр аннотаций текущего узла.
Для работы с реестром аннотаций у администратора узла есть три основных модуля: модуль поддержки обновлений, сборщик мусора в реестре аннотаций и модуль обмена аннотациями.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск