next up previous contents
Next: Модель отношений между документами Up: Модель распределенной виртуальной среды Previous: Модель создания документов   Contents


Модель представления документов

В данном разделе предложена и описана реализация модели представления и генерации документов, основанная на формировании внутреннего представления документов (см. определение на стр. [*]) посредством семантической сети с использованием технологии RDF и его последующем приведении к требуемому формату. Она используется для генерации динамических документов в создаваемых в рамках данного проекта информационных системах.

При создании информационно-справочных систем для научного сообщества представляется важным предоставить пользователю максимально удобную навигацию по системе, в полной мере использующую возможности гипертекста, то есть позволяющую переходить от одного документа к другому, минуя каталог. К сожалению, эти возможности реализуются далеко не всегда -- очень часто внутренние иерархические связи между документами отсутствуют.

Однако в процессе отображения документов нередко оказывается целесообразным в качестве составной части одного документа включать другой (полностью или частично, в том числе и в виде гиперссылки). Такая ситуация возникает, если о сущностях, описываемых документами, может быть построено истинное высказывание (представляющее интерес с точки зрения содержания системы) типа: ``Сущность А есть (или была) нечто (по отношению к) сущности Б'' или ``Сущность А имеет (или имела) в некотором качестве сущность Б''. Например: Евклид -- автор ``Начал'' или ``С.Л.Соболев был директором Института математики СО РАН''.

Тем самым становится актуальной разработка технологии создания информационно-справочных систем, позволяющей отображать в документе автоматически генерирующиеся ссылки на другие документы системы и выполнять вставки (полные или частичные) одного документа в другой. Одним из основных элементов этой технологии является разработка информационной модели отношения между документами системы.

Информационная система представляет собой множество связанных различными отношениями документов (см. определение на стр. [*]), описывающих некие сущности (объекты, факты или понятия). Информация о той или иной сущности содержится в системе либо непосредственно в виде документа, который ее представляет, описывает или моделирует, либо в виде упоминаний об этой сущности, которые имеются в других документах, т.е. содержат опосредованную информацию об этой сущности.

Определение 1: Документом $d_i$ называется пара: $d_i = <S_i ,V_i >$, где $S_i$ - структура документа в соответствии с выбранной схемой данных; $V_i$ - содержание документа (информационное наполнение).

Для унификации работы, выполнения определенных требований мы представляем информационную систему в виде набора коллекций (см. определение на стр. [*].

Ввиду того, что документы, принадлежащие одной коллекции, имеют одинаковые структурные метаданные, нами достигается унифицированность работы с документами.

Определение 2. Структурным элементом является элемент схемы данных документа (часть самого документа) или элемент описания документа (описательные метаданные). Структурный элемент (далее просто элемент) имеет идентификатор, значение (или содержание) и обладает некоторыми свойствами.

Таким образом, элемент $E$ - это совокупность $<ID, V, P>$, где $ID$ - идентификатор элемента, $V$ - содержание элемента, $P$ - свойства элемента.

Примеры элементов: заголовок документа, аннотация документа, фамилия в визитной карточке, авторы документа. Значение элемента -- его конкретная содержательная часть, а свойства элемента описывают его структуру. Для элемента визитной карточки Фамилия значение -- Матвеев, идентификатор - 1, свойства - имя last_name, тип word и т.д.

Отметим, что значением элемента может быть и внешний объект. Например, для элемента визитной карточки Фотография значением является внешний объект -- графический файл.

Элемент при своем создании получает генерируемый системой идентификатор $ID$, который связан с элементом все время его существования и не меняется при изменении значения элемента. Идентификатор является частью значения элемента и обеспечивает идентификацию элемента в документе. В пределах документа идентификатор элемента должен быть уникален, однако в различных документах могут существовать элементы с одним и тем же идентификатором.