Conference Information System

Предлагается концепция построения информационно-вычислительных систем поддержки принятия решения о степени цунамиопасности защищаемого объекта на основе многопараметрического регрессионного анализа данных о проявления цунами на исследуемом участке побережья.

В докладе, на примере побережья Приморья, показывается, что совокупность исходных данных о цунамигенных землетрясениях и проявлениях цунами в Японском море (натурные, исторические, расчетные) позволяют построить регрессионную модель связи между поступающей информацией (сейсмической и гидрофизической) и оценкой степени цунамиопасности для защищаемого пункта, расположенного в береговой зоне.

Известно, что помимо научно-технических задач, допускающих достаточно строгое формальное описание и использование арсенала классических математических методов, существуют задачи, когда формального описания данного явления не существует, либо оно сложно для анализа. Так задачи управления кризисными ситуациями и задачи прогноза опасности цунами могут решаться с помощью экспертных систем, в которых закладываются знания специалистов-экспертов в соответствующей проблемной области. Подобные экспертные системы способны давать те или иные рекомендации и прогнозы разной степени достоверности. Однако заполнение экспертной системы знаниями весьма трудоемко, существуют также задачи, по отношению к которым исследователь еще не имеет эмпирического знания. Поэтому возникает проблема выявления новых закономерностей, если они вообще существуют, в наборах данных и часто весьма большого объема.

Применение традиционных статистических методов здесь не всегда результативно именно вследствие априорной неопределенности вида искомых закономерностей и относительно слабой развитости нелинейных методов и методов анализа статистических величин, распределенных по законам, отличным от нормального или от его предельных случаев.

Многомерный нелинейный регрессионный анализ данных позволяет проводить поиск закономерностей в больших массивах данных при произвольном статистическом распределении случайных величин. В этом случае, если закономерности выявлены, то регрессионная модель, использованная для анализа, может быть использована далее для прогноза и управления.

Рост интереса к многопараметрическому регрессионному моделированию, помимо вышеприведенных причин, обусловлен также все возрастающей потребностью упростить программную реализацию. Это связано с потребностью повышения производительности компьютеров, которая при наличии физических ограничений на скорость выполнения одной операции, может быть реализована распараллеливанием вычислительного процесса. Своеобразным воплощением этих тенденций являются регрессионное моделирование, отличающееся от традиционного в наличии гибкого параллельно-последовательного способа обработки информации, где пропорция параллельных и последовательных этапов зависит от задачи; в использовании процесса обучение вместо процесса программирования; в том компьютерная модель состоит из однородных, относительно простых элементов, причем структура связей между ними устанавливается в процессе обучения (в случае чисто программной реализации это соответствует использованию одного и того же простого вычислительного модуля в программах, ориентированных на решение различных задач); в задании функции, выполняемой регрессионной моделью, с помощью специального набора параметров, формируемых во время обучения; в том, что блок или программа обучения, система модификации связей входят в саму компьютерную программу, являясь ее неотъемлемой частью; в безусловной высокой устойчивости к отказам элементов или к повреждению массива параметров на носителе.

Реализующая изложенные выше соображения компьютерная программа “Модели” предназначена для оперативного синтеза по эмпирическим, табличным, данным аналитических моделей, с регулируемым уровнем сглаживания эмпирических данных. Синтезируемые аналитические модели приближенно воспроизводят характерные для исходного объекта причинно-следственные связи, в той мере в какой эти связи проявили себя при сборе эмпирических данных. Имея аналитическую модель, можно вместо экспериментов с исходным объектом прибегать к численным экспериментам с моделью.

Для удобства численных экспериментов программа размещена в среде "Excel". Программа осуществляет нелинейную многомерную регрессию с регулируемой гладкостью. В качестве интерполирующего используется один из вариантов многомерных представлений в виде интегралов Фурье, с заменой интегралов конечными суммами. В бимассиве модели хранятся параметры "оптимального" конечного Фурье – представления. Размер модели соответствует количеству гармоник. При оптимизации используется метод быстрого вычисления многомерных градиентов (или метод множителей Лагранжа) и метод сопряженных градиентов. Проблема плохой обусловленности многопараметрических статистик в рамках этой идеологии решается "внешним" образом - плохая обусловленность вполне может проявлять себя в неустойчивости параметров. Но эта неустойчивость регулируется так, что прогнозы и аппроксимации "в хороших случаях", когда "по смыслу" их неустойчивости не должно быть, действительно оказываются устойчивыми.

Примечание. Тезисы докладов публикуются в авторской редакции

Конференции ИВТ СО РАН

VI Международная конференция "Современные методы математического моделирования природных и антропогенных катастроф"

Тезисы докладов

Многопараметрическая нелинейная регрессионная модель прогноза цунамиопасности защищаемого обьекта

Шокин Ю.И., Чубаров Л.Б., Симонов К.В., Щемель А.А.