М.В.Булгаков
Центр информатизации Минобразования РФ, Москва
Тел.: (095) 952-07-69, факс: (095) 232-36-54, e-mail: bul@informika.ru
Публикация на Web-сервере в Internet или в корпоративной сети значительного количества HTML-файлов в составе одного или нескольких тематических наборов имеет много общего с созданием и сопровождением электронного архива документов. Основной задачей при этом является обеспечение возможности быстрого эффективного поиска необходимой информации. Использование Internet/Intranet-технологий для организации электронных архивов позволяет использовать гипертекстовую структуру документов, перекрестные ссылки и территориальную распределенность наборов данных.
В докладе рассматривается технология создания и сопровождения электронных архивов HTML- документов, использующая Web-интерфейс к SQL-серверу атрибутной и индексной базы данных.
Технология предполагает использование настраиваемой базы данных атрибутов документов для организации атрибутного поиска и базы данных индексов для организации контекстного полнотекстового поиска.
Инструментальным средством создания и сопровождения электронного архива HTML-документов является пакет программ, обеспечивающий эффективное формирование значений атрибутов документов (наименование, тип, дата создания, путь к файлу, значения рубрик тематического классификатора и т.п.), проверку корректности гипертекстовых ссылок, формирование индекса текста документа с учетом морфологии русского языка. Значения атрибутов HTML-документов первоначально формируются в форме тегов дополнительных заголовков файла , а затем с помощью соответствующих утилит заносятся в атрибутную базу данных (периодически или по мере надобности).
Системно-технологическими средствами функционирования электронного архива HTML-документов могут быть Web-серверы фирмы Microsoft (Internet Information Server, Personal Web Server для операционных систем Microsoft Windows NT 4.0 Server, Windows NT 4.0 Workstation, Windows 95), включающие Internet Database Connector (httpodbc.dll) для работы с системами управления базами данных через ODBC-драйверы. В качестве СУБД могут быть использованы Microsoft Access 97, Microsoft SQL Server 6.5 и другие, имеющие ODBC-драйверы.
Для работы с электронным архивом HTML-документов могут использоваться популярные Web-клиенты (Internet Explorer, Netscape Navigator и другие). При атрибутном или контекстном поиске в электронном архиве HTML-документов через заполняемую форму с помощью IDC формируется SQL-запрос к соответствующим таблицам базы данных и по результатам запроса динамически формируется HTML-страница, передаваемая на Web-клиент.
Данная технология использована при создании информационно-справочной системы нормативно-распорядительных документов Минобразования РФ.