Г.А. Скарук, Л.К. Бобров
ГПНТБ СО РАН, г. Новосибирск

СРАВНИТЕЛЬНАЯ ОЦЕНКА КАЧЕСТВА ТЕМАТИЧЕСКОГО ПОИСКА В ЭЛЕКТРОННОМ КАТАЛОГЕ С ИСПОЛЬЗОВАНИЕМ ПОЛНОГО КОМПЛЕКСА ИПЯ

     ГПНТБ СО  РАН формирует следующие электронные каталоги:
     каталог книг и сборников;
     каталог авторефератов диссертаций;
     каталог литературы временного хранения;
     каталог отечественных периодических изданий;
     каталог иностранной периодики.
     Электронный каталог  книг  ведется с 1992 г.  и включает описания около
105  тыс.  документов.  Он  используется  как  для  адресных,  так   и   для
тематических поисков информации.
     Прямой поиск возможен полям:  ISBN и ISSN, автору, виду документа, году
и месту издания,  шифрам хранения и языку основного текста документа, сиглам
библиотек; словам из заглавия, предметных рубрик и ключевым словам, индексам
ББК и ГРНТИ. Остальные поля доступны для последовательного поиска.
     В докладе описываются результаты эксперимента,  направленного на анализ
тематического  поиска с использованием различных лингвистических средств,  и
включающего oценку?
     качества индексирования документов в ЭК средствами отдельных ИПЯ, в том
числе степень дублирования информации в различных поисковых полях;
     уникальных поисковых    возможностей   и   ограничений   каждого   ИПЯ;
     трудоемкости индексирования  запросов  на  каждом  языке.   Эксперимент
состоял  в  проведении  серии  поисков  по  реальным тематическим запросам с
определением  формальной  релевантности  выданных  системой  документов.   В
результате эксперимента была получена информация о:
     относительной полноте выдачи информации при поиске на различных ИПЯ для
различных   типов   запросов   (широко   и  узкотематических,  отраслевых  и
межотраслевых);
     точности поиска на каждом языке;  количественном распределении основных
причин потерь информации и информационного шума в каждом случае;
     количестве уникальных документов,  полученных при поиске на каждом ИПЯ;
степени совпадения лексики реальных  информационных  запросов  и  вербальных
ИПЯ. Кроме того была исследована степень дублирования в  ПОД  информации  на
языках:
     предметных рубрик и ключевых слов;
     предметных рубрик и слов из заглавия документа;
     предметных рубрик и ББК;
     ББК и рубрик ГРНТИ.
     На основе  экспериментальных данных представляется возможным выработать
рекомендации по  совершенствованию  методики  индексирования  документов  на
различных   ИПЯ  и  оптимизации  поисковых  стратегий  для  различных  типов
запросов.