Л.К. Бобров
ГПНТБ СО РАН, г. Новосибирск

ЭЛЕКТРОННЫЙ КАТАЛОГ И МЕТОДЫ ПОВЫШЕНИЯ ЕГО ИНФОРМАТИВНОСТИ

     В чем   заключается   проблема?
     Занимая важное место в системе информационно-библиотечного  обеспечения
НИР,   существующие   электронные   каталоги   обладают  рядом  существенных
недостатков, в том числе:
     невысокая глубина ретроспективного охвата  ввиду  большой  трудоемкости
ввода информации, недостаточной технической оснащенности библиотек, нехватки
технических и финансовых ресурсов;
     невысокая сравнительно с качественными библиографическими базами данных
глубина индексирования;
     нераскрытость содержания периодических и продолжающихся изданий.
     Поэтому, если позволяют условия,  имеет смысл использовать  электронные
каталоги   в   комплексе  с  набором  ретроспективных  библиографических  БД
соответствующего тематического наполнения (например,  БД ВИНИТИ  РАН,  ИНИОН
РАН, и др., а также различные зарубежные БД, в т.ч. Current Contents).
     Но даже такое решение чаще всего не дает  пользователю  ответа  на  все
интересующие  его вопросы,  и,  в частности,  ответа на вопрос о том,  какую
фактографическую информацию содержит та или иная публикация и в какой  форме
представлена эта фактографическая информация.
     Данные обстоятельства  особенно   негативно   сказываются   на   работе
проблемно-ориентированных   информационно-библиотечных   центров  в  области
естественных наук.  Дело в том,  что фонды первоисточников в данных  центрах
относительно  невелики,  но  весьма  насыщены  информацией фактографического
характера (в особенности если данный центр  специализирован  в  определенной
области химии, биологии, физики).
     Как можно решить данную проблему?
     Возможно несколько вариантов решения данной  комплексной  проблемы.
     1. Изменение  системы индексирования документов в создаваемых каталогах
и  библиографических  базах  данных.  В  этом  случае  необходимо   создание
специальных   информационно-поисковых   языков   и   систем  индексирования.
Вероятно,  в ряде случаев будет необходимо введение  нормированной  лексики,
описывающей  фактографическое  содержание документов.  Индексирование должно
будет осуществляться либо только  проблемными  специалистами,  либо  при  их
существенном и непосредственном участии.
     2. Создание  полного  набора  фактографических  БД и их использование в
комплексе  с  библиографическими  БД  (см.,  например,   систему   CHEMBANK,
представляющую  собой  комплекс  фактографических  и  библиографических  баз
данных  по  токсическим  свойствам  химических   веществ)   и   электронными
каталогами.
     Эта серьезная и трудоемкая задача вряд ли  на  сегодняшний  день  может
быть  успешно  решена библиотечным персоналом даже с привлечением проблемных
специалистов.
     3. По-видимому,  весьма близким к идеалу был бы вариант,  когда имеется
полный   ретроспективный   каталог   библиотеки   и   соответствующая    ему
полнотекстовая   база   (базы)   данных,  включающая  все  первоисточники  и
обладающая развитыми средствами навигации и поиска.
     Но тогда это будет уже не обычная современная библиотека,  а библиотека
электронная со всеми вытекающими отсюда особенностями.
     4. С  различными вариациями набор перечисленных выше решений можно было
бы продолжить,  но и без этого видно,  что решение должно лежать в плоскости
реально    существующих    сегодня    условий,   в   которых   функционируют
научно-технические   библиотеки   академических   научных    учреждений    и
проблемно-ориентированные информационно-библиотечные центры.
     Решением, способным  поднять  такие  библиотеки  на  качественно  новый
уровень  уже  сегодня,  является  создание  системы  квазиполнотекстовых баз
данных в дополнение к полным электронным каталогам.
     Реализация такого   решения  базируется  на  использовании  современной
техники сканирования текстов и программного аппарата распознавания  образов,
позволяющего представить текст в виде стандартного ASCII - файла.
     Первая задача,  которая может быть решена таким образом - это  создание
полного ЭК путем сканирования существующего карточного каталога.
     Решение данной  задачи  включает  этап   предварительной   разметки   и
сортировки  (по уровню качества и виду библиографических описаний) карточек,
этап собственно сканирования,  этап преобразования графических изображений в
текстовый формат,  этап корректировки и дополнения записей,  конвертирование
текстовых файлов и формирование электронного каталога в  виде  базы  данных,
управляемой выбранной СУБД.
     Вторая задача  -  создание  квазиполнотекстовой  базы   данных,   также
распадается    на   несколько   этапов,   предваряемых   отбором   требуемых
первоисточников.
     Увеличение "библиографической информативности" ЭК может быть достигнуто
путем сканирования наиболее информативных составляющих в выбранных  изданиях
(например,   оглавления,   резюме   и  выводы  в  монографических  изданиях,
оглавления и рефераты (профильных для данного центра) статей, опубликованных
в периодических и продолжающихся изданиях, и т.п.).
     В рассматриваемом случае увеличение "фактографической"  информативности
ЭК   достигается   путем  сканирования  соответственным  образом  отобранных
диаграмм,  таблиц,  графиков,  рисунков и пр.,  причем в этом случае  задача
перевода  информации в текстовую форму (например,  путем оцифровки графиков)
не является обязательной.
     Заключение. Решение перечисленных задач предполагает реализацию мульти-
базовой концепции  и  обеспечение  возможности  комплексного   использования
собственно  электронных  каталогов  и  создаваемых  квазиполнотекстовых  баз
данных.  Это требует дальнейшей углубленной проработки,  как, впрочем, и ряд
других  вопросов,  например вопросов организационно-технологического порядка
применительно к условиям СО РАН.
     Однако проведенные  нами совместно с АО "Унискан" эксперименты показали
перспективность данного направления и его принципиальную реализуемость.
     Пользуясь случаем,  автор  выражает  благодарность начальнику отдела АО
"Унискан" С.М.  Крыцыну за инициативную помощь в проведении экспериментов на
оборудовании данного акционерного общества.