Модель отношений между документами

Next: Модель предметной области Up: Модель распределенной виртуальной среды Previous: Модель представления документов Contents

Модель отношений между документами

В основу нашей модели отношений между документами в информационной системе легла модель RDF.

Описанная связь между документами системы устанавливаются путем задания на множестве документов бинарных отношений, которые в соответствии с правилами RDF могут быть записаны в виде : имеет атрибут со значением . Например, тот факт, что Барахнин В.Б. занимает некоторую должность (post) в ИВТ СО РАН, записывается как Post('ИВТ СО РАН', 'Барахнин В.Б.'), где Post -- то или иное значение из списка (тезауруса) должностей.

В информационно-справочных системах для научного сообщества в рамках модели отношений решаются две задачи:

навигация по коллекциям (навигационное дерево);
установление связей между документами (гиперссылки, вставки).

Исходя из этих двух задач, мы выделяем два вида отношений:

внутреннее отношение -- отношение порядка между документами, выстраивающее иерархию подчинения в коллекции, например отношение подчиненности между документами;
внешнее отношение -- отношение между документами безотносительно структуры подчиненности.

Особенность внешних отношений состоит в том, что они, как правило, имеют несколько дополнительных атрибутов. Например, отношение типа Post не просто описывает принадлежность персоны к организации, но и обладает следующими атрибутами: название должности, ключевые слова, дата назначения, дата освобождения от должности, видимость и др. Внутреннее отношение, как правило, имеет не более одного атрибута, например название подчинения (территориальное, научно-методическое и т.д.).

Назовем элементы, являющиеся частью документа, а не частью описания документа объектами. Исходя из свойств внешних отношений, в документе можно выделить два типа объектов:

объекты, содержание которых не зависит от значений атрибутов внешнего отношения;
объекты, содержание которых может зависеть от значений атрибутов внешнего отношения (например, от должности персоны в организации зависит служебная информация).

Отметим, что объекты второго типа являются, как правило, множественными.

Однако использование указанной схемы не решает всех проблем, возникающих при создании информационно-справочных систем для научного сообщества, например, проблему утраты с течением времени актуальности информации, сконцентрированной вокруг организаций, сообществ и т.п. Так, для нас может представлять интерес метод Бубнова-Галеркина решения операторных уравнений или сама биография И.Г.Бубнова, но вряд ли мы будем искать эту информацию посредством поиска сведений о Морской академии или Оптовом судостроительном бассейне, где служил Бубнов.

Поэтому информацию целесообразно группировать следующим образом: 1) вокруг персон ученых; 2) вокруг понятий и фактов науки; 3) вокруг описываемых наукой реалий окружающего мира (для естественных и некоторых гуманитарных наук).

Для информационной модели системы, в основе которой находится персона, при поиске возникает необходимость сопоставить персоне все ее позиции (в том числе и относительно публикаций), т.е. пользоваться подходом, обратным описанному выше. Решение этой задачи с помощью контекстных запросов (даже к конкретному полю) не всегда удобно, т.к. может привести к выдаче нерелевантных документов. Таким образом, возникает потребность в построении обратной модели отношений, которая носила бы достаточно универсальный характер.

**Figure:** RDF-представление множественного элемента коллекции ``Персоны''
$\includegraphics[width=0.8\textwidth]{ris/iris-1.eps}$

В качестве примера на рис. 4 приведена RDF-схема, описывающая представление множественного элемента Position из схемы данных коллекции персон, содержащего должность персоны.