Студенты МИЭМ НИУ ВШЭ смогут принять участие в работе над синхронизацией суперкомпьютеров
В рамках магистерской программы МИЭМ НИУ ВШЭ «Суперкомпьютерное моделирование в науке и инженерии» планируются уникальные исследования на стыке наук. Решать актуальные задачи высокопроизводительных вычислений и интеллектуальной обработки данных большого объема студенты будут при помощи знаний математики, физики, материаловедения, социальных наук, геномики, информатики. Что дает такой междисциплинарный подход, разберем на примере недавнего исследования аспирантки Лилии Зигануровой и профессора Льва Щура — руководителя магистерской программы.
Цель работы, описанной в статье Synchronization of Conservative Parallel Discrete Event Simulations on a Small-World Network, — решение проблемы синхронизации сотен миллионов узлов суперкомпьютеров будущего с помощью использования знаний из статистической физики. Исследование поддержано грантом РНФ 14-21-00158, в ближайшее время будет опубликовано в высоко цитируемом научном журнале Physical Review E. Препринт статьи доступен в архиве библиотеки Корнелльского университета.
Проблема синхронизации параллельных вычислений исследована в рамках метода параллельного моделирования дискретных событий (ПМДС). Этот метод применяется для моделирования различных задач, от классической задачи диспетчеризации полетов до задач моделирования новых материалов. Применимость метода исследована при моделировании с использованием миллионов узлов суперкомпьютера BlueGene.
В исследовании Льва Щура и Лилии Зигануровой используется аналогия эволюции профиля локальных времен процессорных узлов с задачей роста поверхности при пучково-молекулярной эпитаксии (РППМЭ). Физиками получено существенное понимание механизмов роста.
При организации параллельных вычислений особо важными элементами, влияющими на эффективность вычислений, являются:
- обмен данными между памятью различных узлов;
- синхронизация узлов;
- процент загрузки узлов;
- масштабируемость этих параметров, то есть их зависимость от числа узлов.
Метод ПМДС свободен от проблемы обмена большим объемом данных между памятью узлов. В нем синхронизация обеспечивается за счет посылки сообщений с информацией об изменении статуса узла. Каждое сообщение имеет штамп времени наступления события (отсюда и происходит название — дискретных событий, изменения происходят не непрерывно во времени). Такие времена образуют профиль локальных времен. Исследуя модель эволюции времен, можно показать, что консервативный алгоритм метода ПМДС не имеет мертвых состояний — скорость эволюции профиля времен строго положительная величина. Однако, выявлен недостаток применения такого алгоритма — растет средняя ширина профиля времен, то есть растет степень десинхронизации узлов как во времени, так и от числа узлов. Поэтому такая реализация ПМДС не является полностью масштабируемой.
Исследована модификация консервативного алгоритма, при которой обмен сообщениями между узлами можно отнести к сетям малого мира. На языке физики, дополнительно к локальному взаимодействию вводится случайное и редкое дальнодействие. В результате степенной рост десинхронизации с числом элементов заменяется на логарифмический выходит на константу. Такая модификация является полностью масштабируемой.
Авторы планируют проведение дополнительных исследований с целью более детального соотнесения результатов, полученных с помощью их модели, с результатами практических исследований конкретных применений алгоритма. Это даст возможность получить точные предсказания по эффективности конкретных применений.
Если вас заинтересовали направления исследований, подробнее ознакомиться с магистерской программой можно по ссылке.