![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
RefNUMA – библиотека для организации виртуальной общей памяти в программах, использующих MPI.А. О. Лацис
Приложение 2. Быстродействие разных вариантов модельного приложения.Быстродействие гибридных вариантов модельного приложения характеризует не столько систему RefNUMA, сколько свойства используемого сопроцессора. Для изучения свойств системы RefNUMA интересно сравнить быстродействие чисто процессорных вариантов модельного приложения как друг с другом, так и с реализацией того же приложения с помощью MPI. Для максимального учета вклада коммуникаций в быстродействие, тестовые расчеты выполнялись в режиме «один процесс на один вычислительный узел». Все расчеты проводились на суперкомпьютере К-100, для расчетной сетки размером 1000 на 1000, при 10000 итераций. Сравнивались между собой реализация на базе MPI и две разновидности реализации на базе RefNUMA: с использованием простых и векторизованных разделяемых массивов. Каждая из разновидностей реализации на базе RefNUMA запускалась дважды: с использованием и без использования оптимизации барьеров при помощи системной переменной remoteROM (см. Пример 7). Указанная серия измерений проводилась для единственной реализации MPI (OpenMPI на базе Qlogic Infiniband) и для нескольких реализаций RefNUMA:
Результаты измерений приводятся ниже. Приведенные в таблицах значения – это времена выполнения программы в секундах.
|
![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Тел. +7(499)220-79-72; E-mail: inform@kiam.ru |