Об организации Сибирского Центра Супервычислений

 

Ерохин Г.Н., Жижимов О.Л., Селезнев В.С.

 

Предпосылки организации Сибирского

Центра Супервычислений

 

Сетевые центры супервычислений функционируют на Западе уже свыше десяти лет. В США, например, в рамках национальной программы супервычислений и суперкоммуникаций (High Perfomance Computing and Communications - HРСС) организовано 13 таких суперцентров. Они составляют основу информационного обеспечения глобального национального проекта "Большого Вызова" (Grand Challenge), направленного на борьбу с раком, СПИД'ом, с загрязнением окружающей среды и оптимальным использованием природных ресурсов.

Более того, с 1992 года в США развивается и так называемый информационно-вычислительный Метацентр (NSFMetaCenter) - объединение мощностей пяти крупнейших суперцентров сети NSFnet : Cornell Theory Center, National Center for Atmospheric Research, National Center for Supercomputing Applications, Pitsburgh Supercomputing Center и San Diego Supercomputer Center, которое позволяет достичь нескольких сотен миллиардов операций в секунду (Гигафлопc) суммарной производительности на базе высокоскоростных каналов связи c пропускной способностью до 1 Гигабит/сек в решении широкого класса научных и практических задач.

Очевидно, появление таких центров супервычислений неизбежно и в России, если мы только сознательно не хотим потерять статус научной державы и уничтожить фундаментальную науку как таковую. Учитывая роль Сибирского региона в целом и Сибирской науки в структуре научно-образовательного комплекса России, мы предлагаем организовать Сибирский Центр Супервычислений в городе Новосибирске на базе Сибирского Отделения РАН, используя квалифицированные кадры и опыт работы Вычислительного Центра СО РАН в режиме сетевого центра коллективного пользования крупных ЭВМ.

 

Такое предложение основывается на двух важных обстоятельствах.

 

Во-первых, на существующей в настоящий момент потребности использования СуперЭВМ для решения крупных фундаментальных задач, стоящих перед учеными СО РАН. К этим задачам относятся прежде всего задачи газовой динамики, геофизики, квантовой химии, биологии и космического мониторинга природных ресурсов и явлений Сибири. По оценкам наших и зарубежных специалистов решение современных трехмерных задач магнитогидродинамики, лазерной оптики, физики атмосферы и наук о Земле за приемлимое время требует производительности суперЭВМ не Гигафлопc, а порядка десятков Терафлопc, то есть на 5-6 порядков выше, чем мы сегодня реально имеем в России. Центр СуперЭВМ в Новосибирске, со сравнимой производительностью, уже сейчас настоятельно необходим для развития и даже для сохранения фундаментальной науки в Сибири. В будущем он может служить основой внедрения еще более высокопроизводительных вычислительных систем.

 

Во-вторых, наше предложение о создании центра СуперЭВМ в ННЦ базируется на имеющемся в СО РАН крупном научно-техническом заделе и готовой сетевой межинститутской инфраструктуре. Речь идет об опыте создания и эксплуатации в 1975-1990 годах Вычислительного Центра Коллективного Пользования Новосибирского Научного Центра (проект ВЦКП ННЦ). В этом проекте ставились задачи создания на территории ННЦ действующих высокопроизводительных вычислительных и телекоммуникационных структур и разработки прикладных информационно-вычислительных систем. Одним из важных результатов этого проекта явилось построение на территории Академгородка специализированной кабельной сети повышенной пропускной способности, охватывающей практически все научные институты и управленческие организации. Была создана региональная вычислительная подсеть Сибирского отделения (РВПС "Сибирь"), объединявшая Красноярский, Иркутский, Омский, Томский и другие НЦ СО РАН, которая вошла в состав общегосударственной экспериментальной Академсети, а также были подготовлены квалифицированные кадры и накоплен опыт эксплуатации сетевых систем.

 

В настоящее время на базе проложенных при создании ВЦКП ННЦ линий связи в ННЦ развернута сеть ИНТЕРНЕТ ННЦ. Пропускная способность каналов связи между основными институтами до 2 Мбит/с.(эта информация имеется в сети ИНТЕРНЕТ по адресу http://www.nsc.ru). На базе сети ИНТЕРНЕТ в Новосибирске в настоящее время, по существу, возрождается и развивается технология центра коллективного пользования высокопроизводительными ЭВМ. Так Вычислительный Центр СО РАН в рамках инициативного проекта создания Сибирского Сетевого Центра Супервычислений в январе 1996 ввел в эксплуатацию сетевой вычислительный сервер POWER CHALLENGE M фирмы Silicon Graphics (однопроцессорный вариант), относящийся к классу новейших суперскалярных симметричных мультипроцессорных суперЭВМ (SMP-системы), с пиковой производительностью 300 миллионов операций с плавающей запятой в секунду ( информация на WWW-сервере по адресу http://www.sscc.ru). Услугами этого сервера пользуются в настоящее время 15 организаций Сибири, имеющих доступ в сеть ИНТЕРНЕТ, в том числе учебные организации : Новосибирский государственный технический университет, Новосибирский государственный университет и Алтайский государственный университет. На сервере POWER CHALLENGE M установлена 64-разрядная операционная система UNIX (IRIX 6.1), 64 разрядные трансляторы Power Fortran, Power C, C++, математические пакеты для научных исследований, а также сетевая СУБД Informix 7.0,, геоинформационные системы GRASS, ArcInfo 7.1, система сетевого доступа к GRASS-серверу - GRASSLinks и другое прикладное программное обеспечение.

Высокоскоростные сети доступа к ресурсам СЦС

 

Создание СЦС позволит интегрировать работы в области высокопроизводительных вычислений не только в масштабе города Новосибирска, но и в масштабе всего Сибирского региона. В этой связи важную роль приобретают вопросы дистанционного доступа к вычислительным ресурсам СЦС из других регионов Сибири и Алтая. Речь идет как о специализированных высокоскоростных каналах связи (155 Мегабот и выше), так и об информационных каналах сети ИНТЕРНЕТ. Создание высокоскоростных линий компьютерной связи представляет собой отдельную большую задачу и будет, очевидно, решаться в рамках развертывания широкополосных линий связи интегрального обслуживания (передача кабельного телевидения, компьютерных данных, радио, аудио-видеоконференций и пр.) на основе современных телекоммуникационных технологий класса АТМ. Что касается информационных каналов связи сети ИНТЕРНЕТ, то последние предполагается создавать в рамках различных проектов регионального уровня, в частности например, в рамках развертываемого в Сибири "Межрегионального системного проекта по созданию телекоммуникационной среды и компьютерных сетей для науки и высшей школы Западной Сибири" (проект 1.1.1 межведомственной программы " Создание национальной сети компьютерных телекоммуникаций для науки и высшей школы") . В рамках последнего уже созданы опорные узлы межвузовской сети RUNNet в Новосибирске, Томске и Красноярске. Заканчиваются работы по созданию опорных узлов в Барнауле, Иркутске, Хабаровске, Кемерове и Якутске.

 

Сибирский Сетевой Центр Супервычиcлений в Новосибирском Научном Центре можно рассматривать как необходимый элемент развития инфраструктуры Сибири и его организация послужит не только весомым вкладом в развитие информационно-вычислительной базы Сибирского региона, но и позволит накопить опыт для переоснащения других научных и учебных региональных центров Сибири.

Суть предлагаемой концепции Сибирского Центра Супервычислений

 

Сутью предлагаемой концепции является концентрация усилий в рамках СЦС на следующих пяти основополагающих направлениях:

 

 

 

Предполагаемая Структура Сибирского Центра Супервычислений

 

Основой Сибирского Сетевого центра СуперЭВМ, на наш взгляд, должен быть не просто “большой компьютер”, а неразрывное единство:

 

 

Задачи “Сибирского Вызова” и основные функции СЦС

 

Традиционно в мире, задачами “Большого Вызова”(Grand Challenge) считаются задачи структурной биологии, медицинской диагностики, прогноза погоды и задачи Наук о Земле. Нам представляется, что в Сибири таковыми должны являться задачи многодисциплинарных научных исследований в области

 

Основные функции СЦС

 

Создаваемый центр коллективного пользования суперЭВМ будет выполнять также следующие основные функции :

Технические средства

 

Анализа оснащения ведущих суперкомпьютерных центров США показал, что "каноническая" структура Суперкомпьютерного центра состоит из следующих основных компонент:

Выбор вычислительных платформы для организации Центра Супервычислений является сложной, многоаспектной задачей при решении которой принимаются во внимание как технические параметры рассматриваемых платформ, стоимость, так и:

С точки зрения производительности современных СуперЭВМ, а это однозначно суть - многопроцессорные комплексы, наиболее адекватное сравнение дают тесты Numerical Aerodynamic Simulation (NAS) Parallel Benchmarks (http://www.nas.nasa.gov/NAS

/NPB/), основанные на решении восьми реальных задач вычислительной аэродинамики.

Сравнительные оценки производительностей многопроцессорных комплексов ведущих мировых фирм -

DEC Alpha Server 8400 5/440,

Fujitsu VPP Series (VX, VPP300, and VPP700),

HP/Convex Exemplar SPP2000,

IBM RS/6000 SP P2SC node (120 MHz)

NEC SX-4/32,

SGI/CRAY T3E,

SGI Origin200,

SGI Origin2000

на тестах NAS Parallel Benchmarks показали, что наиболее эффективной с точки зрения соотношения производительности на один миллион долларов стоимости является платформа фирм Cray Research и Silicon Graphics - Origin2000 :

 

Computer # Memory Ratio List Price Performance

System Proc to Million per Million

C90/1 Dollars Dollars

 

 

CRAY T3E 128 64 MB/PE 15.2 5.0 3.05

DEC Alpha Server 8400

5/440 (437 MHz) 8 2 GB 1.66 0.58 2.86

Fujitsu VX 3 2 GB /PE 3.25 1.11 2.93

Fujitsu VPP300 6 512 MB /PE 5.76 1.54 3.74

Fujitsu VPP700 17 512 MB/PE 12.24 5.17 2.37

IBM RS/6000 SP 64 128 MB/PE 10.48 3.52 2.98

P2SC node (120 MHz)

NEC SX-4/32 32 4 GB 21.50 10.7 2.0

SGI Origin2000 26 2 GB 5.01 0.96 5.21

(195 MHz)

 

Учитывая тот факт, что ННЦ уже обладает опытом эксплуатации новейшей суперскалярной ЭВМ класса POWER CHALLENGE фирмы Silicon Graphics, и, более чем четырехлетним опытом работы с прикладными системами работающими под операционной системой IRIX - базовой для компьютеров SGI и консорциума производителей ЭВМ на базе процессоров фирмы MIPS Technologies, Inc. - MIPS Applicacation Binary Interface (http://www.mipsabi.org) , проектом создания СЦС предусматривается развить в СО РАН линию современных многопроцессорных систем класса CRAY Origin2000 (http://www.sgi.com), а именно: оснастить первую очередь Центра Супервычислений 65-процессорным вариантом CRAY Origin2000 производительностью 25 Гигафлопc и с общей оперативной памятью 16 Гигабайт.

Ориентация на CRAY Origin2000 фирмы Silicon Graphics отнюдь не означает пренебрежение техническими решениями других фирм и направлений (например использование векторно-параллельных СуперЭВМ и мультитранспьютерных систем) - поскольку для практически любой многопроцессорной архитектуры, будь-то массово-параллельная, либо векторно-параллельная можно найти вычислительную задачу которая будет наиболее эффективно решаться на данной конкретной машине. Выбор платформы CRAY Origin2000 преследует цель минимизировать затраты на создание первой очереди СЦС и организацию технологических служб по эксплуатации СЦС при возможно большем удовлетворении запросов пользователей в вычислительной мощности, прикладном и системном обеспечении, в сервисных услугах, средствах визуализации и хранении данных.

 

Программно-технологическое обеспечение

 

Программно-технологическое обеспечение СЦС, на наш взгляд, должно включать в себя :

 

Организационно-финансовое обеспечение

 

Для успешного решения поставленных перед СЦС задач целесообразно организовать самостоятельную структуру - Сибирский Федеральный Центр Супервычислений. Кроме бюджетного финансирования необходимо предусмотреть механизмы самофинансирования на основе осуществления СЦС коммерческой деятельности. Примером таких способов организационно-финансового обеспечение Суперцентров в США могут служить Pitsburgh Supercomputing Center и San Diego Supercomputer Center ( http://www.psc.edu, www.msc.edu, www.osc.edu и др.). В России примером подобной структуры может служить Институт Высокопроизводительных Вычислений и Баз Данных в г. Санкт-Петербург (http://www.csa.ru).

Коммерческая деятельность СЦС может быть связана, в частности, с: