Для ряда вычислительных фрагментов решения сеточных аналогов задач математической физики при некоторых условиях обнаружено, а затем теоретически обосновано сверхлинейное ускорение вычислений на вычислительных кластерах, т.е. увеличение скорости вычислений на n процессорах более чем в n раз по сравнению с одним процессором, несмотря на дополнительные операции межпроцессорного обмена данными. Причиной сверхлинейного ускорения является увеличение в n раз суммарного объема кэша всех используемых процессоров и, как следствие, более интенсивный обмен данными с кэшем, а не с оперативной памятью, что в несколько раз медленнее. Прямым подтверждени ем этой гипотезы стало отсутствие эффекта сверхлинейного ускорения при отключении кэша у процессоров. Создана и экспериментально подтверждена модель вычислительного процесса с учетом n-кратного увеличения кэша, в явном виде указывающая условия достижения сверхлиней ного ускорения вычислений при различных соотношениях числа процессоров и скоростей вычислений и межпроцессорных обменов
|