Молородов Ю.И.
Федотов А.М..
Институт вычислительных технологий СО РАН, Новосибирск
Куценогий К.П.
Куценогий П.К.
Институт химической кинетики и горения СО РАН, Новосибирск
Современные информационные технологии и совместные усилия как профессионалов, занимающихся изучением аэрозолей, так и специалистов в области информационных технологий, позволят повысить эффективность использования всего объема экспериментальных данных. В этой связи особенно актуальным становится вопрос правильного хранения информации, ее обработки и приведение к некоторому стандарту. Эти вопросы могут быть решены, если доступ к информационным ресурсам организовать через Интернет с помощью специализированных информационных систем (ИС) с гибкими связями между данными разных пользователей [1]. Использование технологии распределённых вычислений, основанной на использовании метаданных, позволяет решить эту проблему.
Наиболее устойчивыми к росту объемов хранимой информации оказались системы, оперирующие строго структурированными данными, например, каталоги библиотек. Но даже в таких системах в границах одной предметной области может сложиться ситуация, когда данные, вводимые разными авторами, оказываются несовместимыми между собой из-за различий в используемой ими терминологии. Вследствие чего между этими данными трудно устанавливать связи. На текущий момент эта проблема наиболее полно решена в системах, оперирующих библиографической информацией [2]. Для них существует несколько стандартов представления библиографических записей, например, российский коммуникативный формат RUSMARC или любой формат из группы формат MARC. Наличие таких стандартов снимает большое количество проблем связанных с систематизацией, поиском, обработкой информации. Фактически такой подход представляет собой создание словаря объектов, которые будут использоваться для задания структуры хранимой информации.
Свойство атмосферных аэрозолей определяются спектром размеров, концентрацией, химическим составом и структурой частиц. Диапазон размеров АА охватывает 5 порядков величины, концентраций - более 10 порядков. Чрезвычайно сложен химический состав АА. Огромна пространственно-временная изменчивость характеристик АА.
К началу 90-х годов по результатам проекта "Арктическая дымка" получены оценки о значительном загрязнении Арктического бассейна техногенными выбросами из крупных промышленных центров бывшего СССР. Значительная часть АА техногенной природы образуется в Сибири. Это связано с тем, что Сибирь имеет огромную границу с Арктикой. В то же время в Сибири разнообразные природно-климатические зоны. Здесь интенсивно развивается промышленность и сельское хозяйство. Поэтому Сибирь является источником различных типов АА. Начиная с 1991 года, на территории Сибири начался комплексный проект "Аэрозоли Сибири", в котором объединились усилия нескольких институтов Новосибирского научного центра.
В настоящее время не существует единого метода измерения всей совокупности характеристик АА. Это создает большие трудности при сопоставлении результатов огромного экспериментального материала, доступного из публикаций в различных изданиях и системе Интернет.
Эта проблема может быть решена, если объединить усилия специалистов занимающимися аэрозолями, имеющих многолетний опыт по созданию методик и аппаратуры для измерения характеристик АА и специалистов в области современных информационных технологий.
Для этого необходимо собрать и проанализировать опубликованную в различных изданиях и в Интернете разнообразную информацию о характеристиках АА по единой методике, в основе которой лежат принципы решения некорректных задач.
Хотя первые идеи о создании информационной системы мировой базы данных по атмосферным аэрозолям появились 20 лет назад [7], до сих пор отсутствует единообразие в представлении материалов по физическим и химическим характеристикам атмосферного аэрозоля и в научных публикациях, и в результатах текущих исследований. Поэтому в процессе создания глобальной базы данных по атмосферным аэрозолям необходимо решить несколько задач. Во-первых, необходимо разработать и внедрить стандарты представления информации в числовом виде, для того чтобы добиться их определенной универсальности, с точки зрения дальнейшего использования этой информации, в том числе для климатических моделей. В этой связи, роль разрабатываемого интерфейса для ввода данных в базу аннотаторами печатного текста не сводится лишь к роли "переводчика" с профессионального языка специалистов по аэрозолям на язык математиков и программистов. К этой функции необходимо добавить функцию самонастраивающейся системы, которая бы сама дополняла бы структуру данных по мере работы над заполнением базы данных информацией.
По мере использования и наполнения базы данных в ее математический инструментарий будет необходимо включить, кроме процедур обработки данных в целях их дальнейшего представления потребителю, еще и программы, приводящие данные к единому представлению. В настоящее время наиболее перспективным является подход, который используется при решении обратных задач для аппаратной функции при вычислениях дифференциальных характеристик атмосферного аэрозоля по натурным измерениям ряда их интегральных характеристик. Целесообразность применения этого подхода объясняется тем фактом, что подход является достаточно общим и всегда базируется на поиске аналитических выражений, которые при применении в математических моделях приводили бы к наибольшему соответствию с наблюдаемыми параметрами. Распространение данного подхода на работу с различными данными возможно с помощью простой замены термина "наблюдаемые параметры" термином "параметры, имеющиеся в распоряжении", то есть в наполнении базы данных.
Для этого необходимо разработать информационные модели, структуру метаданных и обобщенный подход для формирования и заполнения файлов входных данных, включая их унификацию и связи. Это позволит привести к единому стандарту разнородные входные данные и, на основе современных информационных технологий, создать глобальную базу данных по АА.
Основная функция создаваемой Информационной системы "Атмосферные Аэрозоли Сибири" (в дальнейшем, просто Система) - это обеспечение решения поставленной задачи не только регионального масштаба, но и создание хороших перспектив решения проблем, стоящих перед всем международным сообществом. Система возьмет на себя львиную долю работы, повысит интерактивность Атласа и ее информативность. Последние два качества обеспечивает применение Интернет-технологий.
Любой объект при своем создании получает генерируемый системой уникальный идентификатор, который связан с объектом во все время его существования и не меняется при изменении состояния объекта. Каждый объект имеет состояние и поведение. Состояние объекта - набор значений его атрибутов. Поведение объекта - набор методов (программный код), оперирующих над состояниями объекта. Значение атрибута объекта - это тоже некоторый объект или множество объектов. Состояние и поведение объекта инкапсулированы в объекте. Взаимодействие между объектами производится на основе передачи сообщений и выполнении соответствующих методов.
Специфика применения объектно-ориентированного подхода для организации и управления информационными ресурсами потребовала уточненного толкования классических концепций и некоторого их расширения. Это определяется потребностями долговременного хранения объектов во внешней памяти, ассоциативного доступа к объектам, обеспечения согласованного состояния в условиях множественного доступа и тому подобных возможностей, свойственных базам данных. Исходя из объектной модели представления информации в основе нашей системы лежат "метаданные" - это структурированные сведения о ресурсе, представляющие его свойства (атрибуты). На основе метаданных осуществляется поиск ресурсов, вывод результатов поиска, управление ресурсами, взаимодействие с ними. В целом, конструируя технологию описания ресурсов, мы основывались на методике RDF, которая предлагается консорциумом W3C в качестве стандарта для определения и обработки метаданных Web-ресурсов. Специфика RDF состоит в том, что механизмы описания ресурсов, не делают никаких предположений относительно специфики предметной области и могут быть удобны для описания и обработки сведений о любой области. Примечательной стороной RDF является то, что он позволяет сделать утверждения не только о ресурсах, но и о самих утверждениях.
Разработанная технология предоставляет возможность объединить различные информационные ресурсы в концептуально одну информационную среду, а также оперативно управлять и актуализировать информацию, хранящуюся в разнородных и распределенных по сети базах данных, организовать гибкий поиск, что самое главное создать достаточно удобный интерфейс для ее наполнения.
Информационная система состоит из объектов - элементарных единиц документов, из документов - информационных единиц. Множество документов, содержащих фактографическую информацию, имеющих одинаковую физическую структуру и логическое, информативное назначение образуют
Все коллекции объединены единым словарем объектов. Это необходимо для приведения всех имеющихся терминов-объектов к существующим международным стандартам. Словарь характеризуется метаописанием своих объектов; категориями, по которым распределены объекты; типами данных, используемыми в объектах. В Атласе создана Страница управления объектами словаря с объектами словаря и металписаниями. Словарь содержит 38 объектов, отражающих параметры атмосферных аэрозолей. Среди них: Относительная доля неорганического и органического углерода, счетные концентрации, светорассеяние, географические широта и долгота, высота над уровнем моря, массы концентраций анионов и катионов, кислотность, суммарные счетная и массовая концентрации и др. При необходимости можно создать новый объект в словаре.
Значения этих параметров находятся в соответствующих коллекциях Data, Papers.
Для удобства пользования системой был использован модульно - функциональный принцип. Были выделены подсистемы управления главным словарем, метаописаниями коллекций, разграничения доступа и др. В свою очередь подсистема управления главным словарем системы включает в себя средства изменения метаописания объектов и поддержки их иерархии. Подсистема управления метаинформацией включает в себя средства изменения структуры коллекций, документов и полей документов, создаваемых на основе объектов главного словаря.
Содержательная часть коллекции состоит из последовательности информационных объектов, которые и определяют суть документа.
Вся информация о связи документов (только для связи данного типа) была вынесена из документов. Она хранится в отдельной таблице базы данных. В качестве родительского документа выступает документ с идентификатором word_id коллекции dict_id, а в качестве подчиненного документа - документ с идентификатором doc_id в коллекции table_id. Данный подход позволяет выстраивать достаточно сложные схемы документов и организовывать навигацию по связанным документам
Работа с сайтом начинается с авторизации доступа на странице http://web.ict.nsc.ru/aerosol.
На главной странице администратора представлено следующее меню:
К настоящему моменту система успешно функционирует в режиме удаленного доступа. На ее основе развивается "Электронный атлас <Атмосферные аэрозоли Сибири>".
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск