next up previous contents
Next: Многоуровневая архитектура Up: Построение распределенных информационных систем Previous: Электронные библиотеки   Contents

Документы

Как уже упоминалось выше, главным элементом электронной библиотеки является документ. Документ -- это цельный информационный объект, представленный в электронном виде, имеющий некоторый стандартный набор атрибутов и допускающий однозначную идентификацию. Документом может являться статья из журнала, сам журнал, оцифрованное изображение, экспериментальные данные, база данных, фрагмент базы данных и т.п. Если все документы представляют собой электронное отображение стандартных элементов данных традиционных библиотек, к ним можно применять уже существующие методы каталогизации и систематизации -- как это происходит во многих новых электронных библиотеках, возникших на базе традиционных библиотек. Однако для систематизации документов различной природы традиционный подход малоприменим. В этом случае часто используется комбинация методов формирования электронных коллекций, состоящих из электронных документов и объектного подхода к представлению всех информационных объектов ЭБ.

Электронная коллекция -- это набор документов, объединённых по смысловому признаку и имеющих одинаковую структуру. Примером электронной коллекции может служить коллекция описаний всех видов растений, встречающихся в России -- в этом случае каждый документ в коллекции имеет одинаковую структуру, и они объединены по смыслу хранимой информации.

Объектный подход -- это подход, при котором каждый информационный элемент системы представляется в виде объекта в терминах объектно-ориентированного программирования (ООП). Вкратце объект в терминах ООП можно охарактеризовать так:

Здесь важно отметить, что объектная модель документов реализуется не на уровне внутреннего функционирования программной среды ЭБ, а на ``внешнем'' -- пользовательском уровне, т.е. для пользователя документ (и коллекция) имеет вид объекта, а не таблицы, файла или иного типа данных. Это накладывает определённые требования на логику работы с системой, которая в корне отличается от традиционной, даже от логики работы с файлами на персональных системах и базах данных.

Ещё одним ключевым моментом в построении ЭБ является использование структурных метаданных для формирования структуры (схемы данных) информационных элементов системы, описания схемы данных и поддержки каталога системы. Любая электронная библиотека (корпоративная или общедоступная) опирается на метаинформацию, содержащую онтологию, описывающую принципы организации информации. Онтология, описывающая конкретную предметную область, конкретизируется в схеме данных (атрибутов), описывающих информацию в метаданных.

Рассмотрим сначала общую схему системы построенной на использовании метаданных для задания структуры хранимой информации.

Figure: Схема системы, построенной на базе использования метаданных
\includegraphics[width=14cm]{ris/ris1.eps}

Как видно из схемы, представленной на рис. reffig1, -- система функционирует в рамках архитектуры ``клиент-сервер''. Пользователь обращается к ЭБ при помощи специального приложения (или браузера, если система имеет веб-интерфейс). Главные элементы системы - это сервер метаданных (или сервер метаописаний), который хранит информацию о структуре информационных объектов системы и центральный диспетчер, который осуществляет управление потоками данных с учетом данных сервера метаописаний. Содержательная информация хранится в некоторой базе данных (или в нескольких), причем хранится она во внутреннем формате - т.е. её нельзя использовать из базы напрямую, минуя систему. Центральный диспетчер преобразует запросы клиента в запросы базы данных, используя данные сервера метаописаний, и наоборот - преобразует ответы базы в данные, передаваемые пользователю. Также диспетчер занимается ведением системы прав доступа пользователей к элементам системы, поддержкой согласованности с удалёнными базами данных и другими задачами. Важно отметить, что все схемы данных генерируются динамически на основе данных сервера метаописаний и служебных баз данных обеспечивающих целостность системы информационных объектов.

Система оперирует со следующими типами информационных объектов -- коллекция, документ, объект.

Коллекция определяется своими параметрами (стиль, атрибуты) и структурой входящих в нее документов. Документ определяется своими параметрами (стиль, атрибуты) и структурой объектов из которых он состоит. Объект определяется типом данных (в соответствии с выбранной схемой данных), которые он содержит, описанием свойств и методов объекта.

Таким образом, главным элементом рассмотренной схемы являются структурные метаданные (то есть формализованные описания структуры хранимой информации). Это позволяет достаточно легко строить библиотеку с распределённым хранилищем данных - связь хранилища с системой будут обеспечивать метаописания данных хранилища. Для включения нового элемента в систему будет достаточно создать относительно простую программу-преобразователь (провайдер данных -- ПД), которая будет служить переходным звеном между ЭБ и непосредственно хранилищем, при этом фактическая структура данных хранилища может быть произвольной -- главное, чтобы после программы- преобразователя структура информации соответствовала принятому метаописанию.

В рамках одной информационной системы (Электронной Библиотеки) может одновременно функционировать несколько совершенно различных по природе хранимых данных коллекций. Преимуществом ЭБ в данном случае будет то, что между всеми коллекциями возможно установление связей -- то есть взаимное использование данных в рамках одной системы.