Предлагается концепция построения информационно-вычислительных систем
поддержки принятия решения о степени цунамиопасности защищаемого объекта на
основе многопараметрического регрессионного анализа данных о проявления цунами
на исследуемом участке побережья.
В докладе, на примере побережья Приморья, показывается, что
совокупность исходных данных о цунамигенных землетрясениях и проявлениях цунами
в Японском море (натурные, исторические, расчетные) позволяют построить
регрессионную модель связи между поступающей информацией (сейсмической и
гидрофизической) и оценкой степени цунамиопасности для защищаемого пункта,
расположенного в береговой зоне.
Известно, что помимо научно-технических задач, допускающих достаточно
строгое формальное описание и использование арсенала классических
математических методов, существуют задачи, когда формального описания данного
явления не существует, либо оно сложно для анализа. Так задачи управления
кризисными ситуациями и задачи прогноза опасности цунами могут решаться с
помощью экспертных систем, в которых закладываются знания специалистов-экспертов
в соответствующей проблемной области. Подобные экспертные системы способны
давать те или иные рекомендации и прогнозы разной степени достоверности. Однако
заполнение экспертной системы знаниями весьма трудоемко, существуют также задачи,
по отношению к которым исследователь еще не имеет эмпирического знания. Поэтому
возникает проблема выявления новых закономерностей, если они вообще существуют,
в наборах данных и часто весьма большого объема.
Применение традиционных статистических методов здесь
не всегда результативно именно вследствие априорной неопределенности вида
искомых закономерностей и относительно слабой развитости нелинейных методов и
методов анализа статистических величин, распределенных по законам, отличным от
нормального или от его предельных случаев.
Многомерный нелинейный регрессионный анализ данных позволяет проводить поиск
закономерностей в больших массивах данных при произвольном статистическом
распределении случайных величин. В этом случае, если закономерности выявлены,
то регрессионная модель, использованная для анализа, может быть использована
далее для прогноза и управления.
Рост интереса к
многопараметрическому регрессионному моделированию, помимо вышеприведенных
причин, обусловлен также все возрастающей потребностью упростить программную
реализацию. Это связано с потребностью повышения производительности компьютеров,
которая при наличии физических ограничений на скорость выполнения одной
операции, может быть реализована распараллеливанием вычислительного процесса. Своеобразным
воплощением этих тенденций являются регрессионное моделирование, отличающееся
от традиционного в наличии гибкого параллельно-последовательного способа
обработки информации, где пропорция параллельных и последовательных этапов
зависит от задачи; в использовании процесса обучение вместо процесса программирования;
в том компьютерная модель состоит из однородных, относительно простых
элементов, причем структура связей между ними устанавливается в процессе
обучения (в случае чисто программной реализации это соответствует использованию
одного и того же простого вычислительного модуля в программах, ориентированных
на решение различных задач); в задании функции,
выполняемой регрессионной моделью, с помощью специального набора параметров,
формируемых во время обучения; в том, что блок или программа обучения, система
модификации связей входят в саму компьютерную программу, являясь ее
неотъемлемой частью; в безусловной высокой устойчивости к отказам элементов или
к повреждению массива параметров на носителе.
Реализующая изложенные выше соображения компьютерная
программа “Модели” предназначена для оперативного синтеза по эмпирическим,
табличным, данным аналитических моделей, с регулируемым уровнем сглаживания
эмпирических данных. Синтезируемые аналитические модели приближенно
воспроизводят характерные для исходного объекта причинно-следственные связи, в
той мере в какой эти связи проявили себя при сборе эмпирических данных. Имея
аналитическую модель, можно вместо экспериментов с исходным объектом прибегать
к численным экспериментам с моделью.
Для удобства численных экспериментов программа
размещена в среде "Excel". Программа осуществляет нелинейную
многомерную регрессию с регулируемой гладкостью. В качестве интерполирующего
используется один из вариантов многомерных представлений в виде интегралов
Фурье, с заменой интегралов конечными суммами. В бимассиве модели хранятся
параметры "оптимального" конечного Фурье – представления. Размер
модели соответствует количеству гармоник. При оптимизации используется метод
быстрого вычисления многомерных градиентов (или метод множителей Лагранжа) и
метод сопряженных градиентов. Проблема плохой обусловленности
многопараметрических статистик в рамках этой идеологии решается
"внешним" образом - плохая обусловленность вполне может проявлять
себя в неустойчивости параметров. Но эта неустойчивость регулируется так, что
прогнозы и аппроксимации "в хороших случаях", когда "по
смыслу" их неустойчивости не должно быть, действительно оказываются
устойчивыми.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2001, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2001, Сибирское отделение Российской академии наук, Новосибирск