ЭЛЕКТРОННАЯ БИБЛИОТЕКА |
|
Исполнители: | Жижимов Олег Львович | |
Мазов Николай Алексеевич | ||
Ким Виталий Иннокентьевич | ||
Ключевые слова: | информационные системы и сети, базы данных, телекоммуникации, Internet, информационно-поисковые системы коллективногопользования, электронные публикации |
Аннотация
Проект предполагает создание в Новосибирском
Научном Центре интегрированной информационной
системы по наукам о Земле коллективного
пользования на основе использования внутренних
и внешних информационных ресурсов и современных
сетевых технологий, интегрированных с Internet. В
рамках этой системы предполагается организация
доступа к распределенным базам данных формата
CDS/ISIS, предоставление электронных копий
документов из фондов библиотеки ОИГГиМ СО РАН,
создание электронных копий журналов "Геология
и геофизика", "Криосфера Земли",
"География и природные ресурсы" и
предоставление к ним доступа.
Содержание проекта
Фундаментальные научные проблемы, на решение которых направлен проект.
Развитие коммуникационной инфраструктуры
научных подразделений в Академии Наук, вообще, и
в Сибирском Отделении, в частности, создало
предпосылки интенсивного применения в научных
исследованиях технологий, ориентированных на
сетевой доступ к различным информационным
ресурсам, как внутренним (институтские), так и к
внешним (ресурсы других организаций, ресурсы
Internet). При этом возможность доступа к ресурсам
Internet не только существенно расширила
возможности информационного обеспечения, но и
привела к необходимости согласования внутренних
ресурсов со стандартами, принятыми в мире.
С другой стороны, из-за ограниченности средств
сегодня практически все
научно-исследовательские институты не имеют
возможности самостоятельно приобретать всю
необходимую научную литературу,
банки и базы данных на машинных носителях. Даже
крупные региональные библиотеки не могут
обеспечить своих пользователей всей необходимой
информацией. Особенно это ощутимо для научных
центров, удаленных от Москвы. Выход из подобной
ситуации - создание регионального Центра,
куммулирующего информационные ресурсы по
конкретным научным направлениям и
предоставляющего их пользователям в сетевом
доступе.
Примеры - программы создания подобных центров в
Сибирском Отделении по математике и химическим
наукам. Настоящий проект предполагает создание
подобного центра для наук о Земле.
Создаваемая ИС будет использоваться
коллективами научных учреждений СО РАН, которым
необходима информация, связанная с науками о
Земле. Таких учреждений более 10. По каналам Internet
будет возможен доступ и для других организаций.
Описание структуры и функциональных характеристик создаваемой системы, методы разработки системы; общий план работ.
Предлагаемый комплекс мероприятий направлен
на создание в ОИГГМ СО РАН информационного
центра по наукам о Земле, задача которого -
куммуляция информационных ресурсов по
конкретным научным направлениям и
предоставление их пользователям в сетевом
доступе.
Основными составляющими этого Центра являются:
Поскольку некоторые составные части подобного
Центра уже имеются, настоящий Проект
предполагает поддержку и развитие следующих
направлений:
Все перечисленные направления предполагается
развивать собственными силами, опираясь на опыт
сотрудников соответствующих подразделений
ОИГГМ СО РАН.
В рамках этого проекта предполагается
дальнейшее развитие системы доступа к
распределенным базам данных CDS/ISIS из Internet
(ОИГГМ и других организаций СО РАН) с
централизованным каталогом ресурсов на базе
существующей системы. Функционально эта система
состоит из 3 или 4 уровней, програмное обеспечение
каждого из которых способно исполняться на
отдельном компьютере с
организацией межуровневого потока данных по
сети TCP/IP. Эти функциональные уровни представляют
из себя следующее:
Уровень 1: Собственно данные
- представляют собой обычные файлы данных в
формате, необходимом для работы сервера БД. В
случае CDS/ISIS данные хранятся в виде набора файлов
в отдельном каталоге для каждой БД в кодировке,
принятой в MS-DOS. Кроме собственно данных
каталог может включать информацию о полях
доступных для поиска, а также предопределенных
форматах для отображения данных и файл заголовка
для расширенного названия БД.
Уровень 2: Сервер баз данных
реализует основные функции выборки
информации из БД. Для публичной информационной
системы эти функции сводятся к следующим
В соответствии с этим сервер БД обрабатывает
следующие запросы:
Информационный - запрос на информацию о
конкретной базе данных. Во входном потоке -
идентификатор базы данных сервера БД, в выходном
- заголовок, количество записей и комментарий
указанной БД, описание поле БД.
Словарный - запрос на список терминов
указанного поля с параметрами. Во входном потоке
- идентификатор БД, шаблон термина поля,
порядковый номер термина, количество терминов в
выходном буфере, в выходном - список
затребованных терминов указанного поля и их
частота встречаемости в базе данных.
Форматный - запрос на предоставление списка
предопределенных форматов вывода данных. Во
входном потоке - идентификатор БД, в выходном -
пронумерованный список предопределенных
форматов для данной БД.
Основной - запрос на предоставление данных в
требуемом формате с параметрами. Во входном
потоке - идентификатор БД, строка запроса на
языке CDS/ISIS, номер записи начала вывода,
количество записей для вывода, идентификатор
формата, в выходном - форматированная выборка из
БД.
Служебный - запрос на номер версии сервера
БД. В выходном потоке - номер версии текущего
сервера БД, пронумерованный список доступных БД,
индентификатор внутренней кодировки сервера БД.
Сервер баз данных функционирует в многозадачной
операционной системе в виде сервисной службы
(Windows NT) или даймона (UNIX). Обмен информацией с
уровнем 1 происходит через файловую систему
(локальную или сетевую), с уровнем 3 - по
протоколам TCP через фиксированный программный
порт. В последнем случае для лучшей
межплатформенной совместимости данные
передаются только в текстовом виде.
Дополнительной нагрузкой на сервер уровня 2
является организация обратной связи с сервером
уровня 3 для передачи информации о своем
состоянии (по отношению к уровню 3 здесь уровень 2
выступает как клиент). Информация передается на
SQL-сервер уровня 3 в моменты включения и
выключения сервера БД и по командам оператора.
Уровень 3: Сервер WWW с модулем управления
серверами БД
- диспетчер БД - предназначен для обработки
запросов пользователей, формирования запросов к
серверам БД и возврата клиентам полученной
информации по протоколу HTTP и спецификациям HTML.
Оптимальным вариантом является Windows NT 4.0 + IIS 4.0 с
поддержкой JAVA и ASP (Active Server Pages) ввиду тесной
интеграции IIS с операционной системой и
возможностью организации многопоточной
обработки данных сравнительно простыми и
дешевыми средствами. Управляющий модуль
(диспетчер БД) может быть реализован в виде
динамической библиотеки и (или) набора объектов
ASP. Все метаданные по конфигурации доступных
серверов БД и вся статистика работы хранится в
таблицах SQL-сервера (MS SQL 6.5). При этом диспетчер БД
и SQL-сервер выполняют следующие функции:
Уровень 4: Для организации
полнофункциональной системы достаточно
перечисленных трех уровней. Однако при
построении территориально распределенной
системы с ярко выраженными районами и
ненадежными линиями связи между ними желательно
локализовать все три уровня в каждом районе с
интеграцией последних на уровне 4. Уровень 4
представляет из себя набор серверов уровня 3 с
активизированным механизмом репликации
конфигурационных метаданных стандартными
функциями
SQL-серверов.
Общий план работ выглядит следующим образом:
1998 год
1999 год
2000 год
Ожидаемые к концу 1998 года результаты
К концу 1998 года следует ожидать:
Современное состояние имеющихся ИВТР в данной области науки, сравнение с мировым уровнем, наличие аналогов
В настоящее время в мире широко развиты
онлайновые услуги библиотек и
специализированных сайтов, предоставляющих
телекоммуникационный доступ к научной
информации. Расширяется круг научных изданий,
имеющих электронные версии, либо издающихся
только в электронной форме. Повышается
оперативность извещения научной общественности
о публикуемых материалах, когда многие журналы
выставляют для широкого доступа содержание и
аннотации статей готовящихся к
публикации выпусков. В качестве примеров можно
предложить в области наук о Земле журнал
"Geology" Геологического общества Америки,
International Digital Electronic Access Library - проект издательства
Academic Press, LINK издательства Springer, и т.д. Подавляющее
большинство зарубежных журналов предоставляет
свободный доступ только к содержанию и
аннотациям статей.Полные тексты статей
предоставляются только привилегированным
пользователям, как правило, за плату. Основной
способ
предоставления информации - сервис WWW Internet.
В России существует не более 10 серверов, реально
предоставляющих пользователям услуги по
научному информационному обслуживанию, в
основном это каталоги существующих библиотек.
Крупные
информационные центры (ВИНИТИ, Институт
Патентной Информации) предоставляют услуги в
Internet, но плата за эти услуги высока. В России по
наукам о Земле в свободном доступе информация
практически отсутствует.
Для доступа к библиографическим базам данных из
Internet в мире используются совершенно различные
методы и протоколы. Чаще всего применяются
протоколы и программное обеспечение
оригинальной разработки, однако довольно
большую часть занимают системы, функционирующие
по протоколу Z39.50.
Имеющийся у коллектива задел по предлагаемому проекту
На сегодняшний день в ОИГГМ имеется локальная
сеть персональных компьютеров и рабочих станций
на базе протоколов семейства TCP/IP. Локальная сеть
имеет иерархическую структуру с
коммутируемой магистралью 100 Мбит/с на основе
Ethernet. Около 400 компьютеров в пяти корпусах имеют
постоянный доступ (10 Мбит/с) к информационным
ресурсам, сосредоточенных на серверах (SPARClassic,
Intel/Pentium-200), функционирующих под управлением
операционных систем SPARC Solaris 2.5 и Windows NT Server 4.0.
Организация локальной сети по образу Internet
позволила обеспечить прозрачный доступ к
последней с каждого рабочего места. Этот доступ
осуществляется через роутер CISCO--2505 по каналу с
пропускной способностью 2 Mбит/с с выходом в Центр
Internet Академгородка и далее через
спутниковый канал (1024 kбит/с) на Европу.
Информационное обеспечение пользователей ИБЦ
ОИГГМ СО РАН в настоящее время базируется на
использовании следующих библиографических
базах данных, являющихся собственностью ОИГГМ:
- РЖ ВИНИТИ "Геология", "Геофизика" (сводные тома)
ретроспективный охват: 1987-1997 гг.
объем: более 500 тыс. записей
- "GeoRef" БД Американского геологического общества
ретроспективный охват: 1785-1996 гг.
объем: более 2.5 млн. записей
- "Труды сотрудников ОИГГМ СО РАН" (обменно-резервный фонд)
ретроспективный охват: 1960-1997 гг.
объем: более 2500 записей
- "Труды сотрудников ОИГГМ СО РАН" (аналитическая роспись)
ретроспективный охват: 1960-1997 гг.
объем: более 5500 записей
- "Каталог отечественных и иностранных книг ОИГГМ СО РАН"
ретроспективный охват: 1995-1997 гг.
объем: около 4000 записей
- "Каталог отечественной и иностранной периодики ОИГГМ СО РАН"
ретроспективный охват: 1960-1997 гг.
объем: около 500 записей (наименований журналов)
Наряду с перечисленными информационными
ресурсами ИБЦ ОИГГМ активно использует ресурсы
других организаций СО РАН, таких как ГПНТБ СО РАН,
ИК СО РАН и др.:
- "Каталог отечественных и иностранных книг" ГПНТБ СО РАН
ретроспективный охват: 1991-1997 гг.
объем: свыше 150 тыс. записей
- "Каталог диссертаций" ГПНТБ СО РАН
ретроспективный охват: 1991-1997 гг.
объем: около 60 тыс. записей
- "Каталоги отечественной и иностранной периодики" ГПНТБ СО РАН
ретроспективный охват: 1992-1997 гг.
объем: свыше 3000 записей
- РЖ ВИНИТИ "Химия" (сводный том)
ретроспективный охват: 1987-1997 гг.
объем: около 2 млн. записей
- РЖ ВИНИТИ "Физика" (сводный том)
ретроспективный охват: 1995-1997 гг.
объем: около 200 тыс. записей
- РЖ ВИНИТИ "Охрана окружающей среды и воспроизводство
природных ресурсов" (отдельный выпуск)
ретроспективный охват: 1986-1997 гг.
объем: около 130 тыс. записей
- БД "Цеолиты России" (аналог соотв. указателя литературы)
ретроспективный охват: 1986-1997 гг.
объем: более 20 тыс. записей
- РЖ ВИНИТИ "Механика" (сводный том)
ретроспективный охват: 1987-1997 гг.
объем: более 350 тыс. записей
- БД "Current Contents on Disk" Института информации США
(серия: "Физика, химия, науки о Земле")
ретроспективный охват: 1992-1997 гг.
объем: более 1.2 млн. записей
- БД "Current Contents on Disk" Института информации США
(серия: "Прикладные науки")
ретроспективный охват: 1993-1997 гг.
объем: более 600 тыс. записей
- БД "Science Citation Index" Института информации США
ретроспективный охват: 1986-1997 гг.
объем: более 6 млн. записей
Общий объем баз данных ИБЦ ОИГГМ в настоящее
время составляет более 5 Гб. В качестве основных
источников наполнения БД используются
реферативно-библиографические БД РЖ ВИНИТИ
"Геология", "Геофизика", получаемых по
FTP; "Current Contents on Disk"; "GeoRef" SilverPlatter on CD-ROM.
Существенным заделом коллектива в области
сетевого доступа к информационным ресурсам - БД в
формате CDS/ISIS - явилась разработка собственной
системы доступа к данным с использованием
стандартных протоколов Internet. Система
предоставляет пользователю функционально
полный набор средств для выполнения
тематического запроса к базам данных:
формулирование запроса на
языке близком к естественному с использованием
логических операторов И, ИЛИ, И-НЕ; просмотр
словаря базы данных с возможностью выбора
необходимых терминов для выполнения поиска;
просмотр найденных по запросу записей в
различных форматах. Система находится в
опытно-промышленной эксплуатации в течение 1997-1998
гг и доступна на сервере ОИГГМ СО РАН по адресу http://proxy.uiggm.nsc.ru/LibraryService/ISISSearch.html
с ограниченными возможностями для внешних
пользователей.
Основные результаты были доложены в виде
докладов на Международных Конференциях и
опубликованы в трудах конференций
Кроме вышеперечисленного в ОИГГМ СО РАН
имеется опыт издательской деятельности с
использованием настольных издательских систем с
1992 г. Суммарное количество подготовленных в
электронной форме оригинал-макетов научных
изданий - выпусков журналов и книг - превышает 150,
общим объемом более 1.5 тыс. учетно-издательских
листов. Годовой объем научных изданий в ОИГГМ
составляет в последние годы свыше 400 уч.-изд.
листов. Работы ведутся на 7 рабочих местах,
включая 2 графические станции, объединенных в
локальную сеть (10 Мбит/с) с выходом в сеть ОИГГМ.
Для верстки используются лицензионные DOS Ventura
3.0 и Corel Ventura 4.2.
Способы предоставления разработанных ИВТР научной общественности
Все ресурсы планируемого Центра
предполагается предоставлять в
телекоммуникационном доступе через Internet (WWW).
Наличия специализированного программного
обеспечения клиента не требуется, достаточно
обычного Web-броузера (MS InternetExplorer 3.0 и выше,
NetscapeCommunicator 4.0 и выше).
По причине наличия ограничения на доступ к
информации, все пользователи ИС делятся на
группы:
- пользователи ОИГГМ СО РАН
- пользователи СО РАН
- пользователи, зарегистрированные в системе
- прочие пользователи
Предполагается, что каждая группа
пользователей будет иметь различные права на
доступ к информации.
А.М.Федотов fedotov@ict.nsc.ru |
Головная страница |