Конференции ИВТ СО РАН


IX рабочее совещание по электронным публикациям
"EL-Pub2004” (с участием иностранных ученых)

23-25 сентября, Академгородок, Новосибирск

Тезисы докладов


Метаданные в распределенной информационной системе по молекулярной спектроскопии

Привезенцев А.И., Фазлиев А.З.

ИОА СО РАН (Томск)

В настоящее время коллективная работа с данными и знаниями получила значительный импульс в силу доступности для большинства исследователей ресурсов сети Интернет. Одной из форм такой работы являются распределенные информационные системы. Примером такой системы является распределенная информационно-вычислительная система "Молекулярная спектроскопия", разрабатываемая для научной общественности тремя группами спектроскопистов.

Базовые узлы этой системы будут расположены в Томске, Санкт-Петербурге, Нижнем Новгороде и Москве. В системе используются три типа данных: структурные параметры молекул, параметры спектральных линий и спектральные функции. Обмен данными между базовыми узлами основан на репликации баз данных и тиражировании метаданных. В настоящее время функционируют два базовых узла с адресами http://saga.atmos.iao.ru/ и http://saga.molsp.phys.spbu.ru/.

Кроме базовых узлов предполагается создание узлов-поставщиков для организаций являющихся собственниками информационных ресурсов в области молекулярной спектроскопии. Эти организации обеспечиваются типовым программным обеспечением для поддержки узла. Между узлом поставщиком и базовым узлом осуществляется только обмен метаданными.

Доклад посвящен описанию организации обмена метаданными в распределенной системе “Молекулярная спектроскопия”. На примере случая расчета коэффициента поглощения показаны все этапы: от создания документа и его метаданных, до механизма обмена метаданными.

Работа с метаданными по коэффициенту поглощения для экспериментальных данных в информационной системе “Молекулярная спектроскопия” состоит из двух этапов. Первый этап включает в себя формирование метаданных для опубликованного в литературе описания эксперимента, другими словами описывается источник данных. Метаданные формируются с помощью веб-форм и сохраняются в базе данных по коэффициенту поглощения. Второй этап состоит в формировании метаданных для результатов научного эксперимента. Это разделение было необходимо, так как для одного научного эксперимента в конечном результате возможно появление нескольких выходных наборов данных. Запись метаданных в формате RDF проводится на втором этапе. Мы используем две схемы метаданных: форматную схему Dublin Core и предметную схему по коэффициенту поглощения в молекулярной спектроскопии. Метаданные, соответствующие этим двум схемам, сохраняются в отдельные RDF-документы для последующего применения.

Для проверки достоверности вводимых данных мы используем XML-документ и соответствующие XML-схемы, затем если все данные были корректными они идут на дальнейшую обработку.

RDF-документы формируются последовательно из данных пользователя и технических данных информационного портала, сначала формируется RDF-документ по схеме Dublin Core, а затем RDF-документ по RDF-схеме для коэффициента поглощения. Затем эти RDF-документы добавляются в реестр аннотаций текущего узла.

Для работы с реестром аннотаций у администратора узла есть три основных модуля: модуль поддержки обновлений, сборщик мусора в реестре аннотаций и модуль обмена аннотациями.

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск