Л.В. Лавренко, А.В. Карначук, Л.К. Бобров
ГПНТБ СО РАН, г. Новосибирск

АЛГОРИТМЫ И РЕАЛИЗАЦИЯ СТАТИСТИЧЕСКОЙ И ЛОГИЧЕСКОЙ ОБРАБОТКИ ПРОБЛЕМНО ОРИЕНТИРОВАННЫХ БАЗ ДАННЫХ

     A. Реализация  статистической  обработки  ПОБД.  В   качестве   объекта
     исследования использована база данных ВИ-
НИТИ "Охрана природы и воспроизводство природных ресурсов" за  1987  -  1992
гг.,  в  которой  была  выделена  рубрика  873.53  "Отходы.  Малоотходные  и
безотходные технологии".
     Анализ информации    проводился    с    помощью    комплекса   программ
статистической обработки, функционирующего в среде CDS/ISIS-M.
     Основные результаты анализа заключаются в следующем.
     1. Начиная с 1988 г. наблюдается устойчивый рост как абсолютного, так и
относительного числа публикаций по отходам.
     2. Анализ    распределения    документопотока   по   видам   документов
свидетельствует о том, что наибольшую долю составляют работы в периодических
и сериальных изданиях,  значительное количество информации содержат сборники
(рис. 1).

             +--------------------------------------------------+
             ¦ Книги                               ¦     1.39%  ¦
             ¦ Патенты и изобретения               ¦     5.85%  ¦
             ¦ Продолжающиеся издания (сборники)   ¦    14.96%  ¦
             ¦ Периодические и сериальные издания  ¦    65.32%  ¦
             +--------------------------------------------------+

                                    Рис. 1

     3. Распределение документов по языкам оригинала.  Более 80%  всех работ
публикуется на английском, японском и русском языках.
     4. Распределение   документов   по   подрубрикам    рубрики    "Отходы.
Малоотходные и безотходные технологии".
     Среди подрубрик второго уровня  явно  доминирует  подрубрика  873.53.13
"Удаление,   сбор,  обезвреживание,  переработка  и  утилизация"  [отходов],
относительный  процент  публикаций  в  которой  за  рассматриваемый   период
составил 79,7%.
     Анализ же этой подрубрики,  в свою  очередь,  показал,  что  наибольшее
число  публикаций  содержат  следующие  "подрубрики"  (перечислены в порядке
уменьшения относительной доли публикаций):
     873.53.13.11 "Сточные воды и другие жидкие отходы",
     873.53.13.13 "Твердые отходы",
     873.53.13.17 "Радиоактивные и другие опасные отходы. Сбор, переработка,
                   удаление, захоронение",
     873.53.13.09 "Газообразные выбросы".
     Аналогичные распределения   документов   (по   языкам,  странам,  видам
документов и т.п.) были получены  для  каждой  из  подрубрик  общей  рубрики
"Отходы. Малоотходные и безотходные технологии".
     Проанализированы наборы ключевых слов,  используемых при индексировании
документов рассматриваемой рубрики и выделена ядерная зона ключевых слов.
     Проведенные исследования  позволили  выделить  ядерные  периодические и
продолжающиеся     издания     для     совершенствования      комплектования
специализированной  научной  библиотеки  СО  РАН  по  экологической  химии и
откорректировать перечень запросов к базам данных по проблеме "Отходы".

     B. Алгоритмы логической обработки ПОБД.  Вторым  шагом  в  анализе  баз
     данных стал комплекс аналитичес-
ких программ  ZAPP,  представляющий  собой  сервисную  оболочку  для   среды
CDS/ISIS/M,    позволяющую   реализовать   процедуры   обработки   проблемно
ориентированных баз данных по логической схеме "если-то".
     При разработке  программы  ставились  следующие задачи:  - максимальная
     простота в использовании и гибкость в
построении запросов;
     - ориентация на пользователя-непрограммиста;
     - работа в режиме диалога;
     - возможность   встраивания   комплекса   в  стандартное  меню  системы
CDS/ISIS/M; - независимость от структуры ПОБД под управлением CDS/ISIS/M;
     В настоящей версии программы, предназначенной для
составления и выполнения  пользовательских  запросов  реализованы  следующие
функции:
     - смена ПОБД в процессе работы;
     - возможность   сохранения   в   файле   и   загрузки  из  файла  часто
употребляемых запросов;
     - возможность редактирования списка запросов;
     - визуализация служебной информации по полям и  подполям  текущей  базы
данных;
     - возможность получения контекстно-ориентированной подсказки в процессе
работы.
     Комбинируя имеющиеся поисковые выражения или,  если  необходимо,  вводя
свои  собственные,  пользователь получает возможность легко,  и вместе с тем
гибко,  формулировать запрос по базе с использованием  логической  структуры
"если-то".
     Таким образом,   настоящая  версия  комплекса  позволяет  пользователю,
создав список наиболее употребимых запросов,  формулировать из них запрос  с
логическим условием "если-то",  что, безусловно сильно расширяет возможности
системы  CDS/ISIS/M,  и,  вместе  с  тем,   значительно   облегчает   работу
пользователя.