Часто Задаваемые Вопросы.

  1. Почему у меня в сессии вместо русских букв какие-то крокозябры?
  2. Как мне принудительно завершить мою задачу?
      Смотри команду   mterm
  3. Как удалить задачу из очереди?
      Смотри команду mqdel
  4. Как мне завершить выполнение очередного кванта задачи, не выбрасывая ее из очереди?
      Смотри команду   mkill
  5. Я хочу написать shell script, в котором какие-то действия выполняются по завершении программы. Как это сделать?

    Воспользуйтесь ключом -wait команды mpirun.

  6.  
  7. Возможно ли на К-100 использовать заданное число процессоров на одном узле? У меня есть задача, которая требует большого объема оперативный памяти и я хочу запустить её на одном узле на одном процессоре, при этом, чтобы она использовала весь объем оперативной памяти, приходящейся на узел.

    Никаких ограничений на использование суммарного объема оперативной памяти всеми процессами Вашей задачи, попавшими на данный вычислительный узел, не накладывается.

    Для управления размещением MPI-процессов на вычислительных узлах при запуске приложения следует использовать опцию команды mpirun "-ppn N" (сколько процессов выполнять на одном узле), например:

    mpirun  -np 20 -ppn 4 ...
    - запустить 20 процессов на 5-ти узлах, упаковав их по 4 процесса на узел. Всего процессоров (на самом деле ядер) при этом доступно 10 (на некоторых узлах - 11), но можно задать любое значение -ppn, как больше, так и меньше.

  8.  
  9. Как на К-100 одновременно использовать технологию MPI и OpenMP, то есть каким образом задавать количество threads на одно процессорное ядро при запуске задачи?

    Задавать количество threads - как всегда в OpenMP. Вот 3 способа:

    1. set-переменной.
    2. Прямо в тексте директивы parallel.
    3. Вызовом стандартной функции OpenMP.

    Это все имеет отношение к OpenMP, но никак не к К-100 и его особенностям.

    К особенностям К-100 относится то, что инициализировать OpenMP надо раньше, чем MPI, а то все треды будут исполняться одним процессорным ядром. Другими словами стандартную функцию OpenMP, задающую число тредов, надо вызвать до обращения к MPI_Init.

    Если на вычислительном узле запускается только один mpi-процесс распределение тредов по процессорным ядрам будет происходить автоматически и выполнять какие то специальные действия для распределения тредов по процессорным ядрам нет необходимости.

  10. Как на К-100 запустить nVidia Visual Profiler?
    1. Установить На Ваш компьютер X-Windows сервер, например, Xming Скачать Xming можно по адресу: http://sourceforge.net/projects/xming/ Помимо Xming можно использовать X-Windows сервер, например, из пакета cygwin.
    2. Запустить X-Windows сервер.
    3. В сессии putty для К-100 выполнить шаг 9, а для SecureCRT шаг 6.
    4. Зайти с помощью putty на К-100
    5. Запустить nVidia Visual Profiler командой:
      mpirun -np 1 -maxtime 20 /common/cuda/bin/nvvp
      параметр -maxtime можно установить в другое значение по Вашему усмотрению.

      Через небольшое время появится окно nVidia Visual Profiler, в котором Вы можете работать, как обычно.

     
  11. Как запустить программу так, чтобы она не закрывалась при закрытии терминала?

    Можно воспользоваться командой nohup my_program, при этом по умолчанию стандартный вывод перенаправляется в файл nohup.out

    Можно также воспользоваться командой screen

  12.  
  13. Если есть не распараллеленная программа и большое количество независимых входных параметров или файлов для обработки, как можно распределить их обработку?

    Можно воспользоваться утилитой распределенного запуска последовательных задач pqrun.

    pqrun [параметры]
    Параметры команды pqrun следующие:
    -f <файл_комманд>
    Файл где перечислены по одной в строке необходимые команды, например:
    # комментарий
    prog1 params1
    prog1 params2
    prog2 params
    По умолчанию команды берутся из файла commands в текущей директории. Рекомендуется команды требующие большего времени счета ставить раньше в очереди для более равномерной загрузки.
    -o <папка_для_вывода>
    Директория в которой создаются файлы в которые перенаправляется стандартный вывод. По умолчанию - pq_out. Перед началом счета папка очищается.
    -np <np>
    Количество одновременно запускаемых команд, по умолчанию 12.
    -ppn <ppn>
    Количество одновременно запускаемых процессов на одном узле. Если программа использует CUDA следует установить -ppn 3. По умолчанию 12.
    -maxtime <maxtime>
    Максимальное время счета. От этого времени зависит положение задачи в очереди. После истечения этого времени задача принудительно завершается и выводится список незавершенных команд.
    -s
    Команды по умолчанию выполняются без запуска shell, поэтому если нужно использовать команды или метасимволы shell (например >> | *) следует указать ключ -s.

    Если выделенное время закончится раньше чем были выполнены все команды, то будет выведен список незавершенных команд.

 
1...9 10...19 20...29 30...
 
 
 
 
 
 
 
 
  Тел. +7(499)220-79-72; E-mail: inform@kiam.ru