next up previous contents
Next: Модель предметной области Up: Модель распределенной виртуальной среды Previous: Модель представления документов   Contents


Модель отношений между документами

В основу нашей модели отношений между документами в информационной системе легла модель RDF[*].

Описанная связь между документами системы устанавливаются путем задания на множестве документов бинарных отношений, которые в соответствии с правилами RDF могут быть записаны в виде $A(R,V)$: $R$ имеет атрибут $A$ со значением $V$. Например, тот факт, что Барахнин В.Б. занимает некоторую должность (post) в ИВТ СО РАН, записывается как Post('ИВТ СО РАН', 'Барахнин В.Б.'), где Post -- то или иное значение из списка (тезауруса) должностей.

В информационно-справочных системах для научного сообщества в рамках модели отношений решаются две задачи:

Исходя из этих двух задач, мы выделяем два вида отношений:

Особенность внешних отношений состоит в том, что они, как правило, имеют несколько дополнительных атрибутов. Например, отношение типа Post не просто описывает принадлежность персоны к организации, но и обладает следующими атрибутами: название должности, ключевые слова, дата назначения, дата освобождения от должности, видимость и др. Внутреннее отношение, как правило, имеет не более одного атрибута, например название подчинения (территориальное, научно-методическое и т.д.).

Назовем элементы, являющиеся частью документа, а не частью описания документа объектами. Исходя из свойств внешних отношений, в документе можно выделить два типа объектов:

  1. объекты, содержание которых не зависит от значений атрибутов внешнего отношения;
  2. объекты, содержание которых может зависеть от значений атрибутов внешнего отношения (например, от должности персоны в организации зависит служебная информация).

Отметим, что объекты второго типа являются, как правило, множественными.

Однако использование указанной схемы не решает всех проблем, возникающих при создании информационно-справочных систем для научного сообщества, например, проблему утраты с течением времени актуальности информации, сконцентрированной вокруг организаций, сообществ и т.п. Так, для нас может представлять интерес метод Бубнова-Галеркина решения операторных уравнений или сама биография И.Г.Бубнова, но вряд ли мы будем искать эту информацию посредством поиска сведений о Морской академии или Оптовом судостроительном бассейне, где служил Бубнов.

Поэтому информацию целесообразно группировать следующим образом: 1) вокруг персон ученых; 2) вокруг понятий и фактов науки; 3) вокруг описываемых наукой реалий окружающего мира (для естественных и некоторых гуманитарных наук).

Для информационной модели системы, в основе которой находится персона, при поиске возникает необходимость сопоставить персоне все ее позиции (в том числе и относительно публикаций), т.е. пользоваться подходом, обратным описанному выше. Решение этой задачи с помощью контекстных запросов (даже к конкретному полю) не всегда удобно, т.к. может привести к выдаче нерелевантных документов. Таким образом, возникает потребность в построении обратной модели отношений, которая носила бы достаточно универсальный характер.

Figure: RDF-представление множественного элемента коллекции ``Персоны''
\includegraphics[width=0.8\textwidth]{ris/iris-1.eps}

В качестве примера на рис. 4 приведена RDF-схема, описывающая представление множественного элемента Position из схемы данных коллекции персон, содержащего должность персоны.