next up previous contents
Next: Модель создания документов Up: Модель распределенной виртуальной среды Previous: Общая модель цифровых информационных   Contents

Мультистилевые информационные системы

Рассмотрим понятие документа, определенного нами как носитель информации, обладающий некоторой структурой. Для передачи документа должна существовать договоренность между его отправителем и получателем о том, в какой форме будет представлен процесс передачи, каким образом будет организован поток (слов, знаков, символов), передаваемый через канал связи и как его нужно интерпретировать. Действительно, один и тот же документ может быть отображен различными способами: для текстовых устройств, для графических устройств с низким или высоким расширением, для специализированных агентов, которые ``понимают'' информацию только в определенной схеме данных. Поэтому любому документу должно соответствовать одно или несколько его представлений (образов), каждое из которых согласовано с некоторым форматом.

Определение. Форматом $\phi$ называется контекстно-свободная грамматика (записанная, например в виде БНФ), задающая множество образов документов (или, другими словами, язык образов документов) $L_\phi$.

Определение. Образ документа в формате $\phi$ называется последовательность символов $d^\phi \in L_\phi$, задаваемая тройкой (структура, наполнение, формат).

В определении образа в явном виде не сказано о способе его получения. Этот вопрос будет рассмотрен ниже.

Рассмотрим понятие внутреннего представления документа как некоторый универсальный образ документа, имеющим специфичный внутренний формат $\phi_{int}$. Универсальность здесь понимается в том смысле, что из этого образа можно получить образ того же документа в любом формате. При этом универсальный образ не включает в себя сведений о других форматах. Можно сказать, что внутреннее представление документа является описанием его содержания, которое отображается в различные образы документа в зависимости от требуемого формата.

Определение. Внутреннее представление документа (ВПД) есть образ документа в формате $\phi_{int}$. Соответственно, язык образов документов $L_{\phi_{int}}$ называется языком внутреннего представления документов.

Определение. ВПД-функция есть функция $c: {\cal A}^n \rightarrow L_{\phi_{int}}$, отображающая кортеж параметров в ВПД.

Определение. Стиль для формата $\phi$ есть функция $s_\phi: L_{\phi_{int}} \rightarrow L_\phi$, возвращающая образ документа по его внутреннему представлению.

Теперь можно сказать, что Образ документа в формате $\phi$ есть $d_\phi = s_\phi (c(\alpha))$ и задается тройкой ($c$, $\alpha$, $s_\phi$).

Данные определения носят достаточно абстрактный характер, поскольку они не делают никаких предположений о том, как их следует реализовывать на практике. Информационные системы, использующие эту модель, должны иметь собственный язык внутреннего представления и реализацию всех функций.

Определение. Мультистилевая информационная система (МИС) есть пятерка

\begin{displaymath}is_M = \langle \Gamma, C, S, \Phi, {\cal A}^n\rangle.\end{displaymath}

Здесь $C = \{c_\gamma\}_{\gamma \in \Gamma}$ -- ВПД-функции, $S = \{s_{\gamma,\phi}\}_{\gamma \in \Gamma, \phi \in \Phi}$ -- стилевые функции, $\Phi$ -- конечное множество допустимых форматов документов. В мультистилевых системах получение документа из коллекции $\gamma \in \Gamma$ по данному кортежу параметров $\alpha \in A$ в формате $\phi$ обеспечивается с помощью композиции преобразований $s_{\gamma,\phi} \circ c_\gamma(\alpha)$.

Полученную функцию $df_{\gamma,\phi}(\alpha) = s_{\gamma,\phi} \circ c_\gamma(\alpha)$ назовем функцией документоформирования. В большинстве информационных систем запрашиваемый документ создается серверными программами (скриптами), которые являются ни чем иным, как реализациями документоформирующих функций $df_{\gamma,\phi}$. Это наиболее простой и широко используемый подход при разработке информационных систем «с нуля». Его основной недостаток заключается в том, что коллекции имеют фиксированный конечный формат документов (обычно, HTML) и поэтому ориентированы только на один тип пользователя, которым, почти всегда, является человек. При этом логическая структура и оформление документа оказываются неотделимыми друг от друга. Другими словами, функции документоформирования не может быть разложена на ВПД-функцию и функцию стиля. Такие системы мы будем называть скриптовыми информационными системами, определяемыми как четверка:

\begin{displaymath}is_S = \langle \Gamma, {\cal }^n, DF, \Phi\rangle,\end{displaymath}

где $DF = \{df_{\gamma,\phi}\}_{\gamma \in \Gamma, \phi \in \Phi}$.

Определение. Две информационные системы называются эквивалентными, если эквивалентны множества создаваемых ими образов документов.

Утверждение 1. Класс скриптовых информационных систем эквивалентен классу коллекционных информационных систем: $IS_S = IS_K$.

Доказательство см. в [25], прямым следствием утверждения 1 и данных определений является

Следствие. Между классами информационных систем имеют место следующие отношения:

\begin{displaymath}IS_M \subset IS_S = IS_K \subset IS.\end{displaymath}

Утверждение 1 демонстрирует недостатки скриптовых информационных систем по сравнению с мультистилевыми. Каждая коллекция должна быть тиражирована столько раз, сколько различных образов должны иметь порождаемые ей документы.

Вторая примечательная деталь в том, что существование нескольких стилевых представлений документов делает МИС доступной для большего числа различных типов клиентов, не прибегая к дублированию описаний коллекций. ВПД-функции являются единственным информационным источником, имеющим минимальную избыточность, что облегчает их модификацию. Добавление нового формата представления информационной системы заключается в определении стилей для соответствующих коллекций, а не фактическое дублирование всей системы, как это требуется в скриптовых информационных системах.

Наконец, последняя важная особенность МИС в наличии явного представления содержащейся в ней информации. Именно оно позволяет не только адаптировать документы для запрашивающих клиентов, но и создавать собственные дополнительные сервисы, которые было бы трудно реализовать в другой архитектуре. Например, явно выраженное внутреннее представление документа позволяет автоматически его классифицировать и отнести к некоторой категории. Таким образом, становится возможным создание подсистем каталогизации и поиска документов, что является важной частью информационных систем.