Исследования › RefNUMA – библиотека для организации виртуальной общей памяти в программах, использующих MPI.

RefNUMA – библиотека для организации виртуальной общей памяти в программах, использующих MPI.

А. О. Лацис

Приложение 2. Быстродействие разных вариантов модельного приложения.

Быстродействие гибридных вариантов модельного приложения характеризует не столько систему RefNUMA, сколько свойства используемого сопроцессора. Для изучения свойств системы RefNUMA интересно сравнить быстродействие чисто процессорных вариантов модельного приложения как друг с другом, так и с реализацией того же приложения с помощью MPI. Для максимального учета вклада коммуникаций в быстродействие, тестовые расчеты выполнялись в режиме «один процесс на один вычислительный узел». Все расчеты проводились на суперкомпьютере К-100, для расчетной сетки размером 1000 на 1000, при 10000 итераций. Сравнивались между собой реализация на базе MPI и две разновидности реализации на базе RefNUMA: с использованием простых и векторизованных разделяемых массивов. Каждая из разновидностей реализации на базе RefNUMA запускалась дважды: с использованием и без использования оптимизации барьеров при помощи системной переменной remoteROM (см. Пример 7).

Указанная серия измерений проводилась для единственной реализации MPI (OpenMPI на базе Qlogic Infiniband) и для нескольких реализаций RefNUMA:

на базе Qlogic shmem,
на базе Shmem-Экспресс,
на базе microshmem, реализованной на базе указанной выше реализации MPI.

Результаты измерений приводятся ниже. Приведенные в таблицах значения – это времена выполнения программы в секундах.

Число ядер:		1	4	8	16
MPI		24	5	2.9	1.4
RefNUMA-microshmem	Shared array	44	11	6.2	4
	Vectored array	36	9	5.2	3.6
	Shared array, remoteROM == 1	44	11	5.9	3.6
	Vectored array, remoteROM == 1	36	9	5	3.2
RefNUMA-QLogicshmem	Shared array	44	11	5.7	3.5
	Vectored array	36	9	4.8	3
	Shared array, remoteROM == 1	44	11	5.6	3.3
	Vectored array, remoteROM == 1	36	9	4.7	2.6
RefNUMA-Shmem-Express	Shared array	44	11	5.9	3.6
	Vectored array	36	9	4.9	3.4
	Shared array, remoteROM == 1	44	10.7	5.7	3.5
	Vectored array, remoteROM == 1	36	9	4.8	3.2

◄ Приложение 1 Приложение 3 ►

Тел. +7(499)220-79-72; E-mail: inform@kiam.ru

▲