VII Международная конференция по электронным публикациям "EL-Pub2002"

23-27 сентября 2002 г., г. Новосибирск, Академгородок,
(номер государственной регистрации 0320300063)

Тезисы докладов


Pазработка базы данных "Web-ресурсы математического содержания"

Барахнин В.Б. , Федотов А.М.

Институт вычислительных технологий СО РАН (Новосибирск)

В настоящее время в сети Интернет имеется немало страниц, содержащих коллекции ссылок на ресурсы математического содержания, однако большинство из них включает в себя информацию только на английском языке. Тем самым, несмотря на постоянный рост числа математических интернет-ресурсов на русском языке (страницы институтов математического профиля электронные версии журналов и т.п.), эти ресурсы оказываются вне поля пользователя сети Интернет (как российского, так и зарубежного).

Кроме того, информация о ресурсе, содержащаяся во многих коллекциях ссылок, ограничивается лишь названием ресурса и его url-адресом, что делает невозможным автоматический поиск ресурсов нужной тематики. Особенно остро эта проблема стоит для российских коллекций ссылок.

О состоянии дел с классификацией и поиском математической информации в российском секторе сети Интернет свидетельствует такой факт: система "Rambler" выдала всего 3 ссылки на "Классификатор математических сущностей" (Mathematics Subject Classification), используемый ведущими мировыми реферативными изданиями: "Mathematics Review" и "Zentralblatt MATH". При этом 2 ссылки были на электронные зеркала зарубежных изданий, в которых опубликована версия классификатора 1991 года (в настоящее время несколько устаревшая). Русскоязычной версии этого классификатора найти не удалось.

Таким образом, становится актуальной разработка и создание базы данных удаленного доступа, снабженной развитой поисковой системой (по классификатору и по ключевым словам, которая включала бы в себя сведения о математических ресурсах сети Интернет (в том числе и русскоязычных). В базу должны входить следующие основные типы ресурсов:

Система, размещение которой планируется на сервере Сибирского отделения Российской академии наук, будет снабжена русским и английским интерфейсом и оснащена развитой системой поиска, включающей в себя контекстный поиск и поиск по "Классификатору математических сущностей". Так как объем указанного классификатора составляет несколько десятков килобайтов информации, то создаваемая система поиска будет работать по технологии "клиент-сервер" (выбор подраздела будет осуществляться за два подзапроса), благодаря чему объем однократно передаваемой информации составит порядка двух килобайтов.

Заметим, что подобная система будет создана впервые в России, а создание русскоязычной версии классификатора (фактически являющегося глоссарием предметной области "математические науки") представляет собой важный шаг в информационном обеспечении математических исследований.

Еще одна особенность создаваемой системы заключается в том, что информация об интернет-ресурсах различных типов размещается в одной таблице (с указанием, к какому конкретно типу относится конкретный ресурс). Это позволит ускорить поиск ресурсов, относящихся к одной предметной области и придать ему комплексный характер.

Конечно, полноценное функционирование подобной информационной системы невозможно без постоянного ее пополнения информацией о новых ресурсах. Поэтому пользователям системы будет предоставлена возможность самостоятельно вносить соответствующую информацию. Для этого разработан удобный интерфейс пользователя, представляющий собой анкету вновь заносимого ресурса (название ресурса, url-адрес, предметная область, местоположения ресурса и пр.). После того, как пользователь заполнит анкету, она автоматически заносится в базу данных, и после проверки администратором системы правильности записи, информация о ресурсе становится доступной всем пользователям системы.

Наконец, важно отметить, что разрабатываемая система носит динамически развивающийся характер: имеется возможность расширения информации о ресурсах, уже занесенных в базу данных (разумеется, вновь заносимые ресурсы также будут сразу снабжаться подобной информацией). Введение новых полей анкеты ресурса не приведет к перестройке уже существующей системы, поскольку при ее создании реализована технология метаданных: каждое поле анкеты снабжено подробной характеристикой, содержащей его тип (текст, ссылка, таблица и т.п.) и правила обработки. Таким образом, программа, заносящая и выводящая информацию, работает не с полем информационной таблицы, а с его описанием, вследствие чего добавление нового информационного поля не сказывается на обработке уже имеющихся полей.

Прототип описываемой системы (содержащий минимальную информацию о ресурсах и не имеющий функции поиска) уже несколько лет функционирует на сервере Сибирского отделения Российской академии наук. Работа с ним позволила окончательно сформулировать приведенные выше требования к информационной системе такого рода. В настоящее время осуществляется замена старой системы на новую, уже частично отвечающую этим требованиям.

Дополнительные материалы: HTML
Примечание. Тезисы докладов публикуются в авторской редакции



|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
Обратная связь
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск