В настоящее время в сети Интернет имеется немало страниц, содержащих коллекции ссылок на ресурсы математического содержания, однако большинство из них включает в себя информацию только на английском языке. Тем самым, несмотря на постоянный рост числа математических интернет-ресурсов на русском языке (страницы институтов математического профиля электронные версии журналов и т.п.), эти ресурсы оказываются вне поля пользователя сети Интернет (как российского, так и зарубежного).
Кроме того, информация о ресурсе, содержащаяся во многих коллекциях ссылок, ограничивается лишь названием ресурса и его url-адресом, что делает невозможным автоматический поиск ресурсов нужной тематики. Особенно остро эта проблема стоит для российских коллекций ссылок.
О состоянии дел с классификацией и поиском математической информации в российском секторе сети Интернет свидетельствует такой факт: система "Rambler" выдала всего 3 ссылки на "Классификатор математических сущностей" (Mathematics Subject Classification), используемый ведущими мировыми реферативными изданиями: "Mathematics Review" и "Zentralblatt MATH". При этом 2 ссылки были на электронные зеркала зарубежных изданий, в которых опубликована версия классификатора 1991 года (в настоящее время несколько устаревшая). Русскоязычной версии этого классификатора найти не удалось.
Таким образом, становится актуальной разработка и создание базы данных удаленного доступа, снабженной развитой поисковой системой (по классификатору и по ключевым словам, которая включала бы в себя сведения о математических ресурсах сети Интернет (в том числе и русскоязычных). В базу должны входить следующие основные типы ресурсов:
Система, размещение которой планируется на сервере Сибирского отделения Российской академии наук, будет снабжена русским и английским интерфейсом и оснащена развитой системой поиска, включающей в себя контекстный поиск и поиск по "Классификатору математических сущностей". Так как объем указанного классификатора составляет несколько десятков килобайтов информации, то создаваемая система поиска будет работать по технологии "клиент-сервер" (выбор подраздела будет осуществляться за два подзапроса), благодаря чему объем однократно передаваемой информации составит порядка двух килобайтов.
Заметим, что подобная система будет создана впервые в России, а создание русскоязычной версии классификатора (фактически являющегося глоссарием предметной области "математические науки") представляет собой важный шаг в информационном обеспечении математических исследований.
Еще одна особенность создаваемой системы заключается в том, что информация об интернет-ресурсах различных типов размещается в одной таблице (с указанием, к какому конкретно типу относится конкретный ресурс). Это позволит ускорить поиск ресурсов, относящихся к одной предметной области и придать ему комплексный характер.
Конечно, полноценное функционирование подобной информационной системы невозможно без постоянного ее пополнения информацией о новых ресурсах. Поэтому пользователям системы будет предоставлена возможность самостоятельно вносить соответствующую информацию. Для этого разработан удобный интерфейс пользователя, представляющий собой анкету вновь заносимого ресурса (название ресурса, url-адрес, предметная область, местоположения ресурса и пр.). После того, как пользователь заполнит анкету, она автоматически заносится в базу данных, и после проверки администратором системы правильности записи, информация о ресурсе становится доступной всем пользователям системы.
Наконец, важно отметить, что разрабатываемая система носит динамически развивающийся характер: имеется возможность расширения информации о ресурсах, уже занесенных в базу данных (разумеется, вновь заносимые ресурсы также будут сразу снабжаться подобной информацией). Введение новых полей анкеты ресурса не приведет к перестройке уже существующей системы, поскольку при ее создании реализована технология метаданных: каждое поле анкеты снабжено подробной характеристикой, содержащей его тип (текст, ссылка, таблица и т.п.) и правила обработки. Таким образом, программа, заносящая и выводящая информацию, работает не с полем информационной таблицы, а с его описанием, вследствие чего добавление нового информационного поля не сказывается на обработке уже имеющихся полей.
Прототип описываемой системы (содержащий минимальную информацию о ресурсах и не имеющий функции поиска) уже несколько лет функционирует на сервере Сибирского отделения Российской академии наук. Работа с ним позволила окончательно сформулировать приведенные выше требования к информационной системе такого рода. В настоящее время осуществляется замена старой системы на новую, уже частично отвечающую этим требованиям.
Дополнительные материалы: | HTML |
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] [СО РАН] |
© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск