ПРОГРАММА "РОССИЙСКИЕ ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ"

А.В.Богданов (*), О.В.Сюнтюренко (**), Ю.Е.Хохлов (***)

(*) Институт высокопроизводительных вычислений и баз данных, Санкт-Петербург, (**) Российский фонд фундаментальных исследований, Москва, (***) Институт "Информационное общество", Москва

E-mail: bogdanov@hm.csa.ru, hohlov@risi.ru

В докладе излагаются основные положения новой межведомственной программы "Российские электронные библиотеки", намечены основные направления и этапы разработки. К этим направлениям относятся как развитие необходимой сетевой и высокопроизводительной вычислительной инфраструктуры для оперирования сверхбольшими объемами информации, так и создание наиболее значимых фондов разнообразных электронных документов научного, культурного и образовательного характера. Особое внимание уделено координации усилий различных министерств и ведомств, участвующих в Программе, предложены конкретные механизмы взаимодействия и финансирования комплексных межотраслевых проектов, направленных на создание электронных библиотек.

Введение

Быстрое развитие и использование современных информационных и коммуникационных технологий, в том числе в сфере науки, культуры и образования, привело к появлению большого числа разнообразных информационных ресурсов. Обеспечение публичного доступа (в том числе и удаленного) российских пользователей к этим ресурсам стало одной из первоочередных задач информационного обслуживания науки, культуры и образования. Сегодня очевидно, что наиболее эффективно это достигается путем создания электронных библиотек, которые реализуют качественно иной подход к оперированию разнообразной информацией в электронном виде и предоставлению ее массовому пользователю. Под электронной библиотекой далее понимается распределенная информационная система, позволяющая надежно сохранять и эффективно использовать разнообразные коллекции электронных документов (текст, графика, аудио, видео и др.), доступные в удобном для конечного пользователя виде через глобальные сети передачи данных [1].

В той или иной форме идея электронной библиотеки уже работает во многих университетах и крупных библиотеках ведущих стран мира. Например, электронная "библиотека XXI века" создается в Японии путем соединения усилий Агентства по внедрению новых технологий, Национальной парламентской библиотеки, целого ряда министерств, более 20 библиотек и культурных центров. Несколько лет назад Библиотека Конгресса США начала реализацию национальной программы создания электронной библиотеки; примерно в это же время по инициативе NSF, DARPA и NASA в США была развернута исследовательская программа Digital Library Initiative (DLI) [2] по электронным библиотекам. На второй стадии развития в начале 1998 года эти программы были объединены в единую межведомственную программу DLI - Phase 2 [3], в которой, кроме того, участвуют Национальная медицинская библиотека, Агентство по статистике США, Национальный гуманитарный фонд, Национальный архив США и другие федеральные агентства. Начиная с 1995 года осуществляется проект создания электронных библиотек для стран G7 [4].

В последние годы многочисленные разрозненные проекты стали превращаться как в национальные программы создания электронных библиотек (США, Канада, Япония и др.), так и в международные программы.

Создание распределенной сети электронных библиотек требует вложения значительных ресурсов и координации усилий различных федеральных, региональных и местных органов власти, общественных и коммерческих структур, действующих в области формирования и использования электронных информационных ресурсов. Необходимы проведение полномасштабных научных исследований и разработка программно-технологических средств обработки информации нового поколения, создание современной телекоммуникационной инфраструктуры и сети компьютерных центров для проведения высокопроизводительных вычислений.

Осознавая роль государства в формировании информационного общества, ряд министерств и ведомств России с 1998 года начали финансирование межведомственной программы "Российские электронные библиотеки" (РЭБ), что позволит нашей стране занять достойное место среди стран, ведущих аналогичные национальные и международные программы. Основными направлениями Программы будут как развитие необходимой сетевой и высокопроизводительной вычислительной инфраструктуры для оперирования сверхбольшими объемами информации, так и создание наиболее значимых фондов разнообразных электронных документов научного, культурного и образовательного характера, доступных в удобном виде для конечного пользователя - ученого, инженера, работника культуры, студента, учащегося.

В Программе РЭБ предполагается активное участие не только коллективов вузов, отраслевых и академических НИИ, но и организаций, хранящих наиболее ценные и значимые коллекции документов и материалов - библиотек, информационных центров и агентств, музеев, галерей, архивов, издательств и др. Сеть электронных библиотек России будет организована как развивающаяся система, интегрирующая все увеличивающиеся объемы как оцифрованных традиционных документов, так и создаваемых изначально в электронном виде. Особое внимание будет уделено решению вопросов согласования используемых стандартов, технологических решений, юридических аспектов (включая проблемы интеллектуальной собственности).

Предыстория создания Программы

Последние годы, несмотря на социально-экономический кризис в России, наблюдается заметный прогресс в использовании современных информационных технологий. Состояние дел с автоматизированными информационными ресурсами России к 1995 г. детально освещено в материалах, подготовленных Комитетом при Президенте Российской Федерации по политике информатизации к Национальному докладу [5].

В 1997 г. в стране выпущено несколько сотен электронных изданий на компактных оптических дисках, возникли сотни российских Web-серверов в глобальной сети Internet, содержащих разнообразную научную, культурную, образовательную, массовую и другую некоммерческую информацию. Создано несколько тысяч оригинальных учебно-образовательных программ, в том числе и для дистанционного обучения. Тысячи исследовательских и учебных организаций, библиотеки, музеи, архивы имеют компьютерное оснащение и подключены к Internet. Как на федеральном уровне, так и на уровне субъектов Федерации из бюджета финансируются многочисленные проекты по созданию электронных информационных ресурсов. В той же сфере активно действуют государственные и негосударственные фонды, а также коммерческие организации.

Существенную роль в формировании программы "Российские электронные библиотеки" сыграли федеральная программа "Федеральный информационный фонд" (Миннауки РФ), программа информационного обеспечения фундаментальной науки (РФФИ, начиная с 1994) и, особенно, межведомственная программа "Создание сети научных телекоммуникаций для науки и высшей школы. 1995-1998" (Миннауки РФ, РФФИ, ГКВШ, РАН). Ряд направлений последней программы посвящен организации распределенных предметно-ориентированных и общенаучных информационных систем и сетей. Среди них проекты создания сетей для специалистов в области физики высоких энергий (RuHEP) и молекулярной биологии (EMBnet), математики (EMnet) и востоковедения, проект распределенной библиотечной сети LibWeb и др.

Проблемы создания и использования информационных ресурсов, доступных через глобальные сети передачи данных, последние годы широко обсуждались на российских и международных конференциях. Этому были посвящены: международная конференция "Информационные системы в науке - 95" (РФФИ, Миннауки, ГКВШ, ИНТАС, МНФ, РАН, январь 1995), всероссийские конференции "Телематика '96-'97" (ГКВШ, Миннауки, РАН, РФФИ, 1996-1997) серия международных семинаров "Перспективы развития систем баз данных и информационных систем (ADBIS)" (РАН, РФФИ, 1994-1997), российско-японский семинар "Электронные библиотеки" (Российская государственная библиотека - Национальная парламентская библиотека Японии, сентябрь 1996), международная конференция "Широкополосные коммуникации для науки и образования" (Миннауки, РАН, РФФИ, CEC-DGXIII, июнь 1997).

Начальной стадии создания Программы РЭБ был посвящен недавний российско-американский семинар "Электронные библиотеки" (Миннауки, РФТР, РФФИ, NSF, апрель 1998) [6].

В ходе подготовки к разработке и реализации Программы ее цели и основные положения были рассмотрены и одобрены Рабочей группой по телекоммуникациям Российско-американской комиссии по экономическому и технологическому сотрудничеству [7]. Программа РЭБ также поддержана на Парламентских слушаниях, организованных Комитетом по информационной политике и связи Государственной Думы [8], рядом федеральных министерств и ведомств, многими организациями, учеными и специалистами.

Организация работ по Программе

Наполнение Программы "Российские электронные библиотеки" определяется как общесистемными вопросами создания и функционирования электронных библиотек и научными исследованиями в этом направлении, так и развитием инфраструктуры электронных библиотек, разработкой инструментальных средств, полномасштабной деятельностью по созданию электронных ресурсов. При этом должны быть изучены и решены проблемы организации и управления электронными библиотеками, правовые и экономические аспекты их создания и использования, вопросы безопасности и стандарты представления информации в электронном виде.

Не менее важны и, безусловно, в рамках Программы будут поддерживаться проекты, направленные на создание средств организации хранения больших и сверхбольших объемов информации, средств поиска разнородной информации, интероперабельных систем, пользовательских средств и интерфейсов.

Наконец, проблема создания электронных библиотек характеризуется большими объемами информационных ресурсов, которые либо требуется перевести в электронную форму, либо конвертировать в форматы, допускающие организацию этих данных в виде распределенной сети электронных библиотек. При этом одним из важнейших становится вопрос экспертного отбора материалов и очередности их перевода в электронную форму. В этом случае в рамках Программы необходимо определить наиболее значимые информационные массивы как в науке, культуре, промышленности, сельском хозяйстве, образовании, экономике, праве, здравоохранении так и в других областях, которые будут конвертироваться или изначально создаваться в электронной форме.

Создаваемые электронные библиотеки должны содержать библиографические данные, полнотекстовую информацию, фактографию, графику, аудио, видео и т.п. К формированию отечественных электронных библиотек следует привлечь основных фондодержателей и производителей информационных ресурсов России: библиотеки, музеи, галереи, архивы, издательства, исследовательские организации, органы НТИ, учебные заведения и другие.

Предполагаемые сроки выполнения всей Программы: 1998 - 2001 г.г. Детальное содержание Программы, сроки реализации и стоимость отдельных проектов планируется привести в системном проекте, разработка которого должна быть завершена в 1998 году.

Общесистемные вопросы создания и функционирования ЭБ

Основное различие традиционной библиотеки и электронной библиотеки заключается в том, что пользователь обращается к сервисам последней за необходимой информацией, а не просто за отсылками к документу и/или самими документами. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к гетерогенным банкам электронных данных. Так как в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен далеко не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме, необходимы такие информационные системы, которые обеспечат эффективный комплексный поиск и анализ информации в коллекциях гетерогенных объектов. Не менее важным является решение проблемы представления разнородной информации в удобном виде для конечного пользователя, что требует новых исследований и разработок в области человеко-машинных интерфейсов.

Особое внимание при создании электронных библиотек будет уделяться согласованию используемых стандартов (в первую очередь - выполнению требований интероперабельности), технологических решений, юридических аспектов их использования (включая вопросы интеллектуальной собственности).

Одно из представлений об этапах развития системы электронных библиотек состоит в том, что на начальной стадии электронные библиотеки будут представлять собой сеть распределенных депозитариев, где объекты любого типа могут быть отысканы в индексированных коллекциях электронных документов. Затем технологии должны будут развиться так, чтобы можно было осуществить прозрачный поиск непосредственно в самих депозитариях с учетом различных используемых протоколов и форматов представления данных. На последующей стадии технологии информационного поиска должны позволить осуществлять прозрачный поиск, учитывающий изменения как в содержании, так и в смысле накопленной информации. Это - последовательные шаги на пути удовлетворения запросов пользователей по отысканию информации: документ - данные - знание.

Множественный взгляд на распределенные депозитарии электронных документов означает, что различные механизмы информационного поиска могут и должны быть одновременно использованы для поиска в сети. Среди них - тезаурусы предметных областей, частотные списки, контекстный поиск, поиск по фрагменту образа и т.п. Так, например, для работы с полнотекстовыми базами данных пользователи должны иметь возможность применять любой из подходящих механизмов, чтобы в интерактивном режиме получать оптимальный результат.

Необходимо отметить, что для работы с большими объемами полнотекстовой информации особое значение имеют средства поиска по свободной лексике естественных языков. Русский язык обладает существенными особенностями, не позволяющими эффективно использовать для этой цели зарубежные программные средства, ориентированные, например, на английский язык. В последние годы в России разработано несколько программных продуктов, предоставляющих возможность поиска информации на русском языке с учетом его грамматики, более того, с учетом орфографии, существовавшей до реформы русского языка 1917 г. Эти же средства позволяют осуществлять поиск на других языках, использующих латинский алфавит.

Активно ведущиеся в последнее время исследования в области создания электронных библиотек, также направлены на решение проблем семантической интероперабельности, лежащей в основе проблем отображения содержания или смысла информации из распределенных коллекций электронных документов. Однако здесь еще больше предстоит достичь, чем достигнуто.

Координация деятельности различных ведомств

Финансовое обеспечение Программы РЭБ планируется осуществлять из нескольких источников - средств, планируемых и выделяемых каждым из ведомств на проведение собственных работ по созданию электронных библиотек; дополнительных средств, направляемых на Программу централизованно; привлекаемых внебюджетных средств. Все средства будут распределяться на конкурсной основе в соответствии с правилами и требованиями каждого из ведомств, а координация работ будет осуществляться Наблюдательным советом и Техническим комитетом Программы.

На начальном этапе в состав участников Программы РЭБ желательно привлечение таких федеральных министерств, ведомств и фондов как Государственный комитет РФ по печати, Государственный комитет РФ по связи и информатизации, Министерство общего и профессионального образования РФ, Министерство культуры РФ, Министерство науки и технологий РФ, Российская академия наук, Российский гуманитарный научный фонд, Российский фонд технологического развития, Российский фонд фундаментальных исследований, Федеральная архивная служба России.

Указанные ведомства создают Наблюдательный совет и Технический комитет, которые осуществляют непосредственную координацию проектов, выполняемых в рамках Программы РЭБ. Предполагается, что в течение 1998 года представители ведомств-участников сформируют эти управляющие органы и организуют работу над системным проектом. Предполагается также, что в течение этого года работы выполняются за счет средств, планируемых и выделяемых ведомствами-участниками в соответствии с правилами и условиями каждого из ведомств.

Первыми о конкурсе на 1998 г. по Программе "Российские электронные библиотеки" объявили Российский фонд технологического развития и Российский фонд фундаментальных исследований [9].

Одновременно должны быть предприняты усилия по получению дополнительных средств на реализацию Программы из других источников. Прежде всего, необходимо добиваться включения Программы РЭБ в федеральный бюджет 1999 г. для финансирования отдельной строкой. Одним из оснований для этого является то, что данная Программа является естественным развитием упоминавшейся ранее МВП "Создание национальной сети компьютерных телекоммуникаций для науки и высшей школы", финансировавшейся из федерального бюджета в 1995-1998 году и направленной по большей своей части на создание телекоммуникационной инфраструктуры.

Кроме того, необходимо стремиться к расширению состава участников Программы, привлекая в нее другие федеральные ведомства, создающие электронные информационные ресурсы, органы власти субъектов Федерации, а также международные и российские инвестиционные и благотворительные фонды, зарубежных партнеров и другие внебюджетные средства.

Заключение

Подробное описание всех результатов Программы "Российские электронные библиотеки" планируется дать в системном проекте, разработка которого должна быть завершена в 1998 году. Однако в рамках данного доклада хотелось бы отметить, что первые значительные результаты по формированию отечественных электронных библиотек планируется получить уже в этом году.

Создание распределенной сети электронных библиотек России позволит кардинально изменить ситуацию в создании, развитии и распространении отечественных информационных ресурсов для использования в науке, культуре, образовании. В результате реализации Программы будет развита инфраструктура для создания, организации, поиска и передачи разнородной электронной информации от информационных центров-производителей к конечному пользователю. Электронные библиотеки позволят коренным образом изменить сам принцип информационного обслуживания в фундаментальной науке, культуре и образовании, когда пользователь, обращаясь к системе получает не только ссылку (библиографию или реферат) на имеющийся электронный документ, но и сам документ (полную копию оригинальной статьи, автореферат диссертации, графический образ картины или технического чертежа, видеозапись проведенного исследования или экскурсии по музею и т.д.).

Будут сокращены расходы по многочисленному дублированию создаваемых локальных баз данных и информационных систем и, в то же время, устранены пробелы в информационном пространстве России, препятствующие ускоренному развитию отечественной науки, культуры и образования.

Литература

1. Вигурский К.В., Хохлов Ю.Е. Программа создания электронной библиотеки в Российской государственной библиотеке. (URL: http://www.risi.ru/rdlp/backg/prehist.ru.htm)

2. Digital Library Initiative. (URL: http://dli.grainger.uiuc.edu/national.htm)

3. Digital Library Initiative. Phase 2. (URL: http://www.nsf.gov/pubs/1998/nsf9863/nsf9863.htm)

4. Bibliotheca Universalis. (URL: http://www.ispo.cec.be/g7/projects/g7pr4.html)

5. Автоматизированные информационные ресурсы России: Состояние и тенденции развития: Национальный доклад. - М., 1995. - НТИЦ "Информрегистр". - 96 с.

6. Российско-американский семинар "Электронные библиотеки". (URL: http://www.risi.ru/radlw98)

7. Протокол заседания Рабочей группы по телекоммуникациям Российско-американской комиссии по экономическому и технологическому сотрудничеству 19 февраля 1998. (URL: http://www.risi.ru/rdlp/backg/prehist.ru.htm)

8. Хохлов Ю.Е. О развитии информационного общества в России. Выступление на Парламентских слушаниях "Развитие информационного пространства России". 2 декабря 1997 г. (URL: http://www.risi.ru/ru/publish/yh01.htm)

9. Межведомственная программа "Российские электронные библиотеки". Газета "Поиск", Э 13 (463), 21-27 марта 1998 г. с. 7. (URL: http://www.risi.ru/rdlp)