Digital Library WWW-SBRAS

ЭЛЕКТРОННАЯ БИБЛИОТЕКА
Сибирского отделения РАН
Проект

Обеспечение унифицированного доступа к разнородным коллекциям и информационным ресурсам на основе технологии CORBA
Проект РФФИ 98-07-91256

Научный руководитель д.ф.-м.н. Марчук А.Г.

Введение

Информационные ресурсы, доступные в среде Internet, как правило являются разнородными и несовместимыми, тогда как пользователю часто требуется однородный доступ к информации вне зависимости от ее источника. При этом, существенными являются две составляющих доступа: запрос на поиск документа (или ресурса) и форма получаемого документа. Желательно иметь технологию, позволяющую объединять информационные источники, родственные по предоставляемой информации в единую пользовательскую среду доступа к ним.

Одним из наиболее актуальных информационных ресурсов в Internet являются электронные библиотечные и библиографические системы. При существующей множественности и разнородности библиотечных систем кажется разумным дать объединяющие средства через дополнительный интерфейс, позволяющий согласовать разнородность представления баз данных и хранимых документов не на уровне реализации библиотечной системы, а на уровне удовлетворения (однородных) пользовательских запросов. Это позволит ставить задачу быстрого объединения территориально и организационно разнесенных библиотек в единую среду, унифицированную по характерным пользовательским (поисковым) заявкам.

Необходимо обеспечить: - легкий поиск по разным видам ресурсов; - система должна быть максимально гибкой и расширяемой, позволяющая добавлять новые ресурсы и виды хранимой информации; - возможность объединения ресурсов, территориально разнесенных на большие расстояния.

Подходы к решению

Стандартные решения не позволяют справиться с задачей в полном объеме и приводят к громоздким, дорогостоящим и неудобным в эксплуатации системам. В связи с этим, предлагается, в качестве основной технологии, использовать технологию CORBA. Технология CORBA разработана Object Management Group (OMG; http://www.omg.org) - организацией, членами которой являются такие фирмы, как Sun, IBM, Cray и другие. Технология CORBA была разработана с целью усовершенствования технологии разработки распределенных информационных систем, распределенных вычислений и др. С помощью CORBA программа может использовать объект, реализованный на удаленном сервере, так, как если бы он находился на локальной машине.

Общие принципы работы cистемы.

Все коллекции документов объединяются в библиотечные кластеры по принципу территориального расположения или близости тематики хранимой информации. То есть одна и та же коллекция документов может входить в несколько различных кластеров. Кластеры, в свою очередь, объединены в сеть с помощью диспетчеров запросов. Таким образом, для получения необходимой информации, пользователю нет необходимости знать как связаться с конкретным кластером, и тем более, с конкретной коллекцией документов. Запрос отправляется на ближайший кластер и с помощью диспетчеров распространяется по сети связанных кластеров. Результатом исполнения кластером запроса пользователя является множество ссылок на документы, каждый из которых пользователь может просмотреть с помощью демонстраторов документов в любом удобном для него виде.

Принцип работы серверов

Основной логической единицей системы является документ. Физически информация может храниться в любой базе данных - в виде файлов или даже формироваться динамически по запросу. Коллекция документов является оболочкой над хранилищем данных, которая может обрабатывать запрос (например, переводить запрос на язык SQL и переадресовывать его к базе данных) и представлять полученную информацию в виде документа. Естественно, что для каждой коллекции документов способ обработки запроса специфичен и нуждается в реализации. Для подключения библиотечного ресурса (например, новой библиотеки) к системе необходимо лишь реализовать обработчик запросов и представить его в виде обработчик запросов и представить его в виде стандартного интерфейса для системы. Таким образом, видно, что коллекция документов является основным функциональным элементом системы. Именно здесь происходит поиск информации и преобразование конкретной информации в документы системы.

Принцип работы клиентов

Пользователь работает с системой, порождая запросы и просматривая полученные документы с помощью демонстраторов документов. Здесь возможны два принципиально разных для пользователя, но совершенно одинаковых для системы способа работы. Пользователь имеет у себя специальную клиентскую программу, с помощью которой преобразует критерии поиска документа в запросы. Запросы направляются в систему и полученные документы просматриваются с помощью имеющихся в доступности демонстраторов документов. При этом технология CORBA позволяет пользователю использовать существующие где-то в сети демонстраторы документов без загрузки их на локальную систему пользователя. При наличии общей базы всех имеющихся в наличии демонстраторов документов один и тот же документ может быть просмотрен самыми разнообразными способами.

Пользователь не имеет специальной программы а пользуется Internet броузером для составления запросов и просмотра документов обращаясь при этом к специальному серверу. Сервер преобразует введенную пользователем информацию в запрос и получив множество ссылок на документы, с помощью специального демонстратора документов в формате HTML (желательно чтобы все документы имели демонстратор документа порождающий HTML) показывает конечному пользователю результат поиска.

Общая схема работы

Пользователь составляет запрос на основе шаблона запросов. Запрос отсылается диспетчеру запросов, обрабатывается им и пересылается различным кластерам, согласно указанных в запросе территориальных, языковых, тематических и других критериев. Кластер, получив запрос и обработав его, передает его нужным хранилищам данных. Хранилище данных переводит запрос в необходимый вид, получает результат, переводит его в вид списка ссылок на объекты типа Документ и пересылает этот список клиенту. Список ссылок представляет, в свою очередь документ. Списки объединяются диспетчером запросов в один документ, который представляется пользователь с помощью клиентской программы. Пользователь, получив ссылку на нужный документ, может работать с этим документом, как с объектом, т.е., например, закачать содержимое документа на свое рабочее место, осуществить поиск по тексту или просто просмотреть выходные данные документа.

Общий план работы

1-й год проекта - создание демонстрационной системы. 2-й год проекта - создание прототипной системы, совместная работа с создателями электронных библиотек по обеспечению доступа к библиотекам с использованием создаваемой технологии. 3-й год проекта - опытная эксплуатация системы, создание методик и технологий для: подключения информационных хранилищ, объединения информационных систем, введения новых типов документов, подключения мультимедийных ресурсов, динамически порождаемых документов, создания и поддержания информационных ресурсов второго уровня.

Демонстрационная система (результат первого года)

На первом этапе предполагается объединить в систему небольшое количество (три-четыре) электронных библиотек, реализованных разными способами. Также предполагается реализовать несколько видов способов поиска и просмотра документов, например, с помощью специальной клиентской программы и Internet-броузера. Для этого должны быть созданы несколько типов документов, демонстраторы документов для каждого типа документа и типа клиентского рабочего места, и соответствующие каждой библиотеке хранилища данных. Хранилища данных мы предполагаем объединить в несколько кластеров (<виртуальных библиотек>) на основе различных принципов объединения. Должны быть реализованы также несколько шаблонов запросов по различным тематическим областям и соответствующие им обработчики запросов. Должна быть разработана в деталях и реализована схема маршрутизации запросов. В итоге этого этапа работы предполагается сделать полную спецификацию системы, с тем, чтобы к системе можно было легко подключить любой ресурс.

Технологии

В настоящее время технологии CORBA находятся в центре внимания специалистов, разрабатывающих информационные системы. Предложение использовать эти технологии для создания однородной среды доступа к информационным ресурсам типа коллекций документов видимо является новым и актуальным.

В институте систем информатики им. А.П.Ершова проведены исследования и разработки по проблемам обеспечения доступа из Internet к библиографическим и другим базам данных, освоены необходимые клиент-серверные технологии: Java, CORBA, Servlets, RMI, TPC/IP, Thin clients, RSA, SSL, MD5, JDBC, SQL. Все указанные технологии предполагается использовать для реализации проекта.

Публикации

Елепов Б.С., Марчук А.Г., Бобров Л.К., Константинов В.И. Новые информационно-библиотечные технологии. Информационные технологии и вычислительные системы. - 1997. - N 2. С 83-89.
Константинов В.И. Библиографическая информационная система на основе фондов Мемориальной библиотеки А.П.Ершова// Информационные системы в науке - 95. - М., 1995.
Елепов Б.С., Марчук А.Г., Бобров Л.К., Константинов В.И. Новые информационно-библиотечные технологии. Информационные технологии и вычислительные системы. - 1997. - N 2. С 83-89.
Z.V. Apanovich, A.V. Klekovkin, A.G. Marchuk "Full-Chip Mask Layout Decomposition for Technology Migration" in Proc. of Workshop on Design Methodologies for Microelectronics, Smolenice castle, Slovakia, September 1995 , pp.322-323.
Apanovich Z.V., Marchuk A.G. DECOMP: a Technology Migration Subsystem for Full Chip Mask Layouts.- in Proceedings of 1997 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing (PAC- RIM'97), August 20-22, 1997. Victoria, B.C., Canada.- P. 8.

А.М.Федотов
fedotov@ict.nsc.ru

Головная страница

© 1998-2013, Сибирское отделение Российской академии наук. Разработано и поддерживается Институтом вычислительных технологий СО РАН.
Последнее обновление: Saturday, 01-Apr-2000 19:07:43 NOVST

ЭЛЕКТРОННАЯ БИБЛИОТЕКА Сибирского отделения РАН Проект

Обеспечение унифицированного доступа к разнородным коллекциям и информационным ресурсам на основе технологии CORBA Проект РФФИ 98-07-91256