next up previous contents
Next: Документы Up: Построение распределенных информационных систем Previous: Построение распределенных информационных систем   Contents


Электронные библиотеки

Способы организации традиционных типов информации (данных) уже хорошо изучены и организованы, однако из-за возрастающего объема данных становится всё более сложно организовывать эффективный поиск, систематизацию, обработку традиционных типов данных -- книг, статей, журналов, дневников, рукописных материалов. Тем не менее, за относительно небольшое время существования информационно-коммуникационных технологий накоплен очень большой объем разнообразных данных, представленных исключительно в электронной форме. Возникают задачи обеспечения доступа (в том числе и удалённого) пользователей к разнородным информационным ресурсам, обеспечения защиты авторских прав на цифровые и преобразованные из традиционных типов в электронные документы, систематизации большого объема разнородных типов документов.

Создание и организация доступа к информационным ресурсам является одной из важнейших задач информационно-вычислительной поддержки современной науки. На сегодняшний день наиболее эффективный способ решения таких проблем является организация информации в информационные системы, электронные публикации и коллекции, обличенные в форму электронных библиотек.[*]

Электронные библиотеки -- это распределённые каталогизированные информационные системы, позволяющие хранить, обрабатывать, распространять, анализировать, а также организовывать поиск в разнообразных коллекциях электронных документов через глобальные сети передачи данных. Электронные публикации научных коллекций представляют собой новую форму хранения и обмена информацией. Для нее характерны, прежде всего, динамичность (возможность обновления) и глобальный доступ (через компьютерные сети).

Электронные библиотеки (ЭБ) можно рассматривать как новый этап развития традиционных библиотек (ТБ)[*]. Следует отличать традиционные библиотеки, использующие современные средства информационных технологий от собственно электронных библиотек. Можно выделить несколько ключевых различий:

Важной проблемой при создании ЭБ выступает организация разнородной информации в удобном для конечного пользователя виде, что требует новых исследований и разработок интерфейсов для корректного отражения предметной области. Другой задачей обслуживания электронных библиотек является стандартизация данных, разработка технологических решений и юридических аспектов использования информации, включая вопросы интеллектуальной собственности. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к электронным данных. Так, в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме. Для ЭБ необходимы такие информационные системы, которые бы обеспечивали эффективный комплексный поиск и анализ информации в коллекциях разнородных объектов. При создании ЭБ безусловно следует учитывать опыт, накопленный в традиционной библиотечной и информационной деятельности, включая требования российских и международных стандартов и рекомдаций.

Основным объектом (ресурсом) хранения данных в ЭБ является документ, снабженный метаданными[*]. Понятие метаданных уже давно и успешно используют в таких контекстах, как информационные хранилища и системы аналитической обработки данных, электронный документооборот и управление потоками работ, управление знаниями. Они позволяют описывать классы объектов, представляющие типы информационных документов, атрибуты и отношения между различными типами документов и ресурсов. Электронный документ -- это наиболее близкое представление обычного документа -- то есть такого элемента данных, с которым удобнее всего работать человеку. Отметим, что принятые в обычных видах информационных систем (ИС) типы элементов данных не в полной мере отражают потребности и интересы пользователей.

В настоящий момент основной принцип, согласно которому, главным отличием ЭБ от прочих видов ИС, это является способность ЭБ накапливать и использовать (например, распространять) информацию в виде документов. Поэтому следует предоставить как можно более формальное определение того, что мы сейчас понимаем по термином ``электронная библиотека''. Из-за относительной новизны этого понятие ещё нет устоявшегося общепринятого определения, однако можно выделить несколько ключевых признаков электронных библиотек:

Основные задачи ЭБ -- ``интеграция информационных ресурсов и эффективная навигация в них''. Под интеграцией информационных ресурсов понимается их объединение с целью использования (с помощью удобных и унифицированных пользовательских интерфейсов) разнородной информации с сохранением ее свойств, особенностей представления и пользовательских возможностей манипулирования с ней. При этом объединение ресурсов не обязательно должно осуществляться физически, оно может быть виртуальным, главное -- оно должно обеспечивать пользователю восприятие доступной информации как единого информационного пространства. В частности предполагается, что ЭБ должны обеспечивать работу с гетерогенными наборами и базами данных или системами баз данных, обеспечивая пользователю эффективность информационных поисков независимо от особенностей конкретных информационных систем, к которым осуществляется доступ.

Под эффективной навигацией в ЭБ понимается возможность для пользователя находить интересующую его информацию с наибольшей полнотой и достоверностью при наименьших затратах усилий во всем доступном информационном пространстве. При таком подходе хорошо известные информационно-поисковые системы, используемые в информационных системах и базах данных, являются частными случаями навигационных средств.

В ходе создания ЭБ возникает целый ряд проблем, которые до сих пор в полной мере не решены. Можно выделить следующие группы проблем:

Решение этих проблем возможно только в рамках сотрудничества специалистов и организаций самого разного профиля. Сейчас теория построения ЭБ развивается как у нас в стране, так и за рубежом. В России приняты и реализуются несколько государственных программ, за рубежом организована федерация электронных библиотек - Digital Library Federation (DLF). Большая часть работ по развитию ЭБ ведется в учебных и научных центрах - ВУЗах, научно-исследовательских институтах, научных центрах крупных корпораций.

Практически во всех случаях источником информации для ЭБ служат данные -- как электронные, так и традиционные, преобразованные в электронную форму. Однако электронные библиотеки можно использовать и как систему для накопления, представления, обработки разнообразных данных. Именно с такой целью в СО РАН создан целый ряд упомянутых выше ЭБ. Далее мы рассмотрим некоторые методы организации электронных библиотек на примере технологий, разработанных в СО РАН.