ЭЛЕКТРОННАЯ БИБЛИОТЕКА
Сибирского отделения РАН

Проект

Создание интегрированной информационной системы по
Наукам о Земле СО РАН

Исполнители: Жижимов Олег Львович
Мазов Николай Алексеевич
Ким Виталий Иннокентьевич
Ключевые слова: информационные системы и сети, базы данных, телекоммуникации, Internet, информационно-поисковые системы коллективногопользования, электронные публикации

Аннотация

Проект предполагает создание в Новосибирском Научном Центре интегрированной информационной системы по наукам о Земле коллективного пользования на основе использования внутренних и внешних информационных ресурсов и современных сетевых технологий, интегрированных с Internet. В рамках этой системы предполагается организация доступа к распределенным базам данных формата CDS/ISIS, предоставление электронных копий документов из фондов библиотеки ОИГГиМ СО РАН, создание электронных копий журналов "Геология и геофизика", "Криосфера Земли", "География и природные ресурсы" и предоставление к ним доступа.

Содержание проекта

  1. Фундаментальные научные проблемы, на решение которых направлен проект.
  2. Описание структуры и функциональных характеристик создаваемой системы, методы разработки системы; общий план работ.
  3. Ожидаемые к концу 1998 года результаты
  4. Современное состояние имеющихся ИВТР в данной области науки, сравнение с мировым уровнем, наличие аналогов
  5. Имеющийся у коллектива задел по предлагаемому проекту
  6. Способы предоставления разработанных ИВТР научной общественности
  7. Ресурсы, необходимые для использования создаваемой системы
  8. Характеристики ИВТР
  9. Перечень дорогостоящего оборудования

 

 

Фундаментальные научные проблемы, на решение которых направлен проект.

Развитие коммуникационной инфраструктуры научных подразделений в Академии Наук, вообще, и в Сибирском Отделении, в частности, создало предпосылки интенсивного применения в научных исследованиях технологий, ориентированных на сетевой доступ к различным информационным ресурсам, как внутренним (институтские), так и к внешним (ресурсы других организаций, ресурсы Internet). При этом возможность доступа к ресурсам Internet не только существенно расширила возможности информационного обеспечения, но и привела к необходимости согласования внутренних ресурсов со стандартами, принятыми в мире.

С другой стороны, из-за ограниченности средств сегодня практически все научно-исследовательские институты не имеют возможности самостоятельно приобретать всю необходимую научную литературу,
банки и базы данных на машинных носителях. Даже крупные региональные библиотеки не могут обеспечить своих пользователей всей необходимой информацией. Особенно это ощутимо для научных
центров, удаленных от Москвы. Выход из подобной ситуации - создание регионального Центра, куммулирующего информационные ресурсы по конкретным научным направлениям и предоставляющего их пользователям в сетевом доступе.

Примеры - программы создания подобных центров в Сибирском Отделении по математике и химическим наукам. Настоящий проект предполагает создание подобного центра для наук о Земле.
Создаваемая ИС будет использоваться коллективами научных учреждений СО РАН, которым необходима информация, связанная с науками о Земле. Таких учреждений более 10. По каналам Internet
будет возможен доступ и для других организаций.

Описание структуры и функциональных характеристик создаваемой системы, методы разработки системы; общий план работ.

Предлагаемый комплекс мероприятий направлен на создание в ОИГГМ СО РАН информационного центра по наукам о Земле, задача которого - куммуляция информационных ресурсов по конкретным научным направлениям и предоставление их пользователям в сетевом доступе.

Основными составляющими этого Центра являются:


Поскольку некоторые составные части подобного Центра уже имеются, настоящий Проект предполагает поддержку и развитие следующих направлений:

Все перечисленные направления предполагается развивать собственными силами, опираясь на опыт сотрудников соответствующих подразделений ОИГГМ СО РАН.

В рамках этого проекта предполагается дальнейшее развитие  системы доступа к распределенным базам данных CDS/ISIS из Internet  (ОИГГМ и других организаций СО РАН) с централизованным каталогом  ресурсов на базе существующей системы. Функционально эта система состоит из 3 или 4 уровней, програмное обеспечение каждого из которых способно исполняться на отдельном компьютере с
организацией межуровневого потока данных по сети TCP/IP. Эти функциональные уровни представляют из себя следующее:

Уровень 1: Собственно данные
- представляют собой обычные файлы данных в формате, необходимом  для работы сервера БД. В случае CDS/ISIS данные хранятся в виде набора файлов в отдельном каталоге для каждой БД в кодировке,   принятой в MS-DOS. Кроме собственно данных каталог может включать информацию о полях доступных для поиска, а также предопределенных форматах для отображения данных и файл заголовка
для расширенного названия БД.

Уровень 2: Сервер баз данных
реализует основные функции выборки информации из БД. Для публичной информационной системы эти функции сводятся к следующим


В соответствии с этим сервер БД обрабатывает следующие запросы:

Информационный - запрос на информацию о конкретной базе данных. Во входном потоке - идентификатор базы данных сервера БД, в выходном - заголовок, количество записей и комментарий указанной БД, описание поле БД.

Словарный - запрос на список терминов указанного поля с параметрами. Во входном потоке - идентификатор БД, шаблон термина поля, порядковый номер термина, количество терминов в выходном буфере, в выходном - список затребованных терминов указанного поля и их частота  встречаемости в базе данных.

Форматный - запрос на предоставление списка предопределенных форматов вывода данных. Во входном потоке - идентификатор БД, в выходном - пронумерованный список предопределенных   форматов для данной БД.

Основной - запрос на предоставление данных в требуемом формате с параметрами. Во входном потоке - идентификатор БД, строка запроса на языке CDS/ISIS, номер записи начала вывода, количество записей для вывода, идентификатор формата, в выходном - форматированная выборка из БД.

Служебный - запрос на номер версии сервера БД. В выходном потоке - номер версии текущего сервера БД, пронумерованный список доступных БД, индентификатор внутренней кодировки сервера БД.

Сервер баз данных функционирует в многозадачной операционной системе в виде сервисной службы (Windows NT) или даймона (UNIX). Обмен информацией с уровнем 1 происходит через файловую систему (локальную или сетевую), с уровнем 3 - по протоколам TCP через фиксированный программный порт. В последнем случае для лучшей межплатформенной совместимости данные передаются только в текстовом виде.

Дополнительной нагрузкой на сервер уровня 2 является организация обратной связи с сервером уровня 3 для передачи информации о своем состоянии (по отношению к уровню 3 здесь уровень 2 выступает как клиент). Информация передается на SQL-сервер уровня 3 в моменты включения и выключения сервера БД и по командам оператора.

Уровень 3: Сервер WWW с модулем управления серверами БД
- диспетчер БД - предназначен для обработки запросов пользователей, формирования запросов к серверам БД и возврата клиентам полученной информации по протоколу HTTP и спецификациям HTML. Оптимальным вариантом является Windows NT 4.0 + IIS 4.0 с поддержкой JAVA и ASP (Active Server Pages) ввиду тесной интеграции IIS с операционной системой и возможностью организации  многопоточной обработки данных сравнительно простыми и дешевыми средствами. Управляющий модуль (диспетчер БД) может быть реализован в виде динамической библиотеки и (или) набора объектов ASP. Все метаданные по конфигурации доступных серверов БД и вся статистика работы хранится в таблицах SQL-сервера (MS SQL 6.5). При этом диспетчер БД и SQL-сервер выполняют следующие функции:

Уровень 4: Для организации полнофункциональной системы достаточно перечисленных трех уровней. Однако при построении территориально распределенной системы с ярко выраженными районами и ненадежными линиями связи между ними желательно локализовать все три уровня в каждом районе с интеграцией последних на уровне 4. Уровень 4 представляет из себя набор серверов уровня 3 с активизированным механизмом репликации конфигурационных метаданных стандартными функциями
SQL-серверов.

Общий план работ выглядит следующим образом:

1998 год

1999 год

2000 год

Ожидаемые к концу 1998 года результаты

К концу 1998 года следует ожидать:

 

Современное состояние имеющихся ИВТР в данной области науки, сравнение с мировым уровнем, наличие аналогов

В настоящее время в мире широко развиты онлайновые услуги библиотек и специализированных сайтов, предоставляющих телекоммуникационный  доступ к научной информации. Расширяется круг научных изданий,   имеющих электронные версии, либо издающихся только в электронной форме. Повышается оперативность извещения научной общественности о публикуемых материалах, когда многие журналы выставляют для широкого доступа содержание и аннотации статей готовящихся к
публикации выпусков. В качестве примеров можно предложить в области наук о Земле журнал "Geology" Геологического общества Америки, International Digital Electronic Access Library - проект издательства Academic Press, LINK издательства Springer, и т.д. Подавляющее большинство зарубежных журналов предоставляет   свободный доступ только к содержанию и аннотациям статей.Полные тексты статей предоставляются только привилегированным пользователям, как правило, за плату. Основной способ
предоставления информации - сервис WWW Internet.

В России существует не более 10 серверов, реально предоставляющих пользователям услуги по научному информационному обслуживанию, в основном это каталоги существующих библиотек. Крупные
информационные центры (ВИНИТИ, Институт Патентной Информации) предоставляют услуги в Internet, но плата за эти услуги высока. В России по наукам о Земле в свободном доступе информация
практически отсутствует.

Для доступа к библиографическим базам данных из Internet в мире используются совершенно различные методы и протоколы. Чаще всего применяются протоколы и программное обеспечение оригинальной разработки, однако довольно большую часть занимают системы, функционирующие по протоколу Z39.50.

 

Имеющийся у коллектива задел по предлагаемому проекту

На сегодняшний день в ОИГГМ имеется локальная сеть персональных компьютеров и рабочих станций на базе протоколов семейства TCP/IP. Локальная сеть имеет иерархическую структуру с   коммутируемой магистралью 100 Мбит/с на основе Ethernet. Около 400 компьютеров в пяти корпусах имеют постоянный доступ  (10 Мбит/с) к информационным ресурсам, сосредоточенных на  серверах (SPARClassic, Intel/Pentium-200), функционирующих под управлением операционных систем SPARC Solaris 2.5 и Windows NT Server 4.0. Организация локальной сети по образу Internet позволила обеспечить прозрачный доступ к последней с каждого рабочего места. Этот доступ осуществляется через роутер CISCO--2505 по каналу с пропускной способностью 2 Mбит/с с выходом в Центр Internet Академгородка и далее через
спутниковый канал (1024 kбит/с) на Европу.

Информационное обеспечение пользователей ИБЦ ОИГГМ СО РАН в настоящее время базируется на использовании следующих библиографических базах данных, являющихся собственностью ОИГГМ:

Наряду с перечисленными информационными ресурсами ИБЦ ОИГГМ активно использует ресурсы других организаций СО РАН, таких как ГПНТБ СО РАН, ИК СО РАН и др.:

Общий объем баз данных ИБЦ ОИГГМ в настоящее время составляет более 5 Гб. В качестве основных источников наполнения БД используются реферативно-библиографические БД РЖ ВИНИТИ "Геология", "Геофизика", получаемых по FTP; "Current Contents on Disk"; "GeoRef" SilverPlatter on CD-ROM.

Существенным заделом коллектива в области сетевого доступа к информационным ресурсам - БД в формате CDS/ISIS - явилась разработка собственной системы доступа к данным с использованием стандартных протоколов Internet. Система предоставляет пользователю функционально полный набор средств для выполнения тематического запроса к базам данных: формулирование запроса на
языке близком к естественному с использованием логических  операторов И, ИЛИ, И-НЕ; просмотр словаря базы данных с  возможностью выбора необходимых терминов для выполнения поиска;
просмотр найденных по запросу записей в различных форматах. Система находится в опытно-промышленной эксплуатации в течение 1997-1998 гг и доступна на сервере ОИГГМ СО РАН по адресу http://proxy.uiggm.nsc.ru/LibraryService/ISISSearch.html с ограниченными возможностями для внешних пользователей.

Основные результаты были доложены в виде докладов на Международных  Конференциях и опубликованы в трудах конференций

Кроме вышеперечисленного в ОИГГМ СО РАН имеется опыт издательской деятельности с использованием настольных издательских систем с 1992 г. Суммарное количество подготовленных в электронной форме оригинал-макетов научных изданий - выпусков журналов и книг - превышает 150, общим объемом более 1.5 тыс. учетно-издательских листов. Годовой объем научных изданий в ОИГГМ составляет в последние годы свыше 400 уч.-изд. листов. Работы ведутся на 7 рабочих местах, включая 2 графические станции, объединенных в локальную сеть (10 Мбит/с) с выходом в сеть ОИГГМ. Для верстки используются  лицензионные DOS Ventura 3.0 и Corel Ventura 4.2.

 

Способы предоставления разработанных ИВТР научной общественности

Все ресурсы планируемого Центра предполагается предоставлять в телекоммуникационном доступе через Internet (WWW). Наличия специализированного программного обеспечения клиента не требуется, достаточно обычного Web-броузера (MS InternetExplorer 3.0 и выше,   NetscapeCommunicator 4.0 и выше).

По причине наличия ограничения на доступ к информации, все пользователи ИС делятся на группы:

- пользователи ОИГГМ СО РАН
- пользователи СО РАН
- пользователи, зарегистрированные в системе
- прочие пользователи

Предполагается, что каждая группа пользователей будет иметь различные права на доступ к информации.

А.М.Федотов
fedotov@ict.nsc.ru
[SBRAS]
Головная страница
© 1998, Сибирское отделение Российской академии наук
    Последнее обновление: Tuesday, 05-May-1998 01:00:00 NOVST