next up previous contents
Next: Пилотный вариант информационной системы Up: Построение распределенных информационных систем Previous: Атлас ``Атмосферные аэрозоли Сибири''   Contents


Атлас ``Биоразнообразиее животного и растительного мира Сибири''

В области биоразноообразия возникает жизненно важная потребность объединить хранилища информации разных типов: традиционной -- печатные и рукописные материалы, гербарные листы, полевые дневники и данные наблюдений, изображения, кино- и фотодокументы, а также цифровой -- массивы данных, файлы и прочие материалы в цифровой форме.

На основе описанной выше технологии и оригинальных подходов к созданию информационных ресурсов в настоящее время создаются базы данных, описывающие различные аспекты биологического разнообразия растительного и животного мира. Информационной базой для этих электронных библиотек служит материал, накопленный биологическими институтами Сибирского Отделения РАН в течение последних десятилетий. Создаваемые базы данных призваны решать следующие задачи:

Подробное описание создаваемых в рамках данной электронной библиотеки информационных систем и баз данных дано в коллективной монографии ``Биоразнообразие и динамика экосистем: информационные технологии и моделирование''. Отв. ред. акад. РАН В.К. Шумный и акад. РАН Ю.И. Шокин. Новосибирск: Изд-во СО РАН, 2006 г. Внешний вид интерфейсов представлен на рис. 15.

Выбор модели данных для представления логической структуры содержательной части информационной системы полностью зависит от структуры данных в предметной области. Задача особенно усложняется, если первоначальные данные сильно варьируются по формату и структуре. В этом случае перед выбором конкретной модели данных необходимо выбрать схему формализации информационных объектов в предметной области.

Ранее мы отмечали, что электронные документы могут и не быть машиночитаемыми, поэтому всю понимаемую компьютером информацию о документе будем считать внешней по отношению к самому документу и представленной в виде набора атрибутов и их значений. Согласно такому подходу, каталог библиотеки состоит из значений всех атрибутов всех документов и поэтому необходимо более детально описать схему формирования и функционирования атрибутов.

Существуют свойства, характерные практически для каждого типа документов -- это информация, касающаяся происхождения и авторства документа. Специальным комитетом, состоящим из специалистов в области образования, библиотечного дела, информатики, музейного дела был разработан базовый набор элементов метаданных для обозначения базовых свойств электронных документов, характерных для всех предметных областей (Dublin Core). По аналогии с Dublin Core были созданы наборы элементов для описания документов из конкретных предметных областей. Например, для первичных документов по биоразнообразию был создан набор Darwin Core, а затем и его более формализованная и уточнённая версия Darwin Core 2, включающая в себя 45 элементов. Помимо атрибутов из общепринятых форматов, могут также создаваться новые атрибуты, например, на основе описаний существующих биологических коллекций.

Можно считать, что задано множество атрибутов (включающее в себя общепринятые стандартные элементы метаданных), с каждой коллекцией сопоставлен набор атрибутов, значениями которых описываются документы из этой коллекции. Атрибуты можно условно разделить на две группы относительно типа значений, которые они могут содержать -- это атомарные и комплексные атрибуты. Атомарные содержат элементарные и неделимые блоки информации; к ним, например, относятся атрибуты ``заголовок документа'' или ``цвет листьев''. Комплексные атрибуты могут содержать весьма сложную по структуре информацию; например, в документе может быть атрибут ``список видов растений с указанием количества каждого вида'' или атрибут ``список листов гербария'', содержащий ссылки на документы из коллекции ``Гербарий''. Всего можно выделить два принципиально отличающихся подтипа комплексных атрибутов -- это внешние и внутренние. Признаком внутреннего подтипа является отсутствие области значения атрибута в других коллекциях, то есть внутренний атрибут не содержит в себе каких-либо логических связей с другими документами. Признаком внешнего подтипа, наоборот, являются связи его значения с данными других документов. Важно отметить, что атрибут может являться внешним в зависимости от интерпретации, например, ``список видов'' может существовать просто как набор строк текста -- в этом случае это внутренний атрибут; однако если каждое название вида связано, скажем, с гербарным листом -- это уже внешний атрибут. Все связи между документами представляются именно внешними атрибутами, кроме того, они являются единственным связующим звеном между различными документами.