Описание тега slurm

1 ответ

Конфигурация SLURM: cons_res с CR_Core либо не могут выделить ресурс, либо задания оказываются в состоянии CG

Я новичок в SLURM. Я пытаюсь настроить slurm в новом кластере. У меня есть 4 узла, каждый имеет 14 ядер. Я хотел разделить узлы таким образом, чтобы каждое ядро ​​могло работать независимо (т. Е. Узел 01 может иметь одновременно 14 независимых после…
04 мар '17 в 18:19
1 ответ

Границы раздела Slurm на аккаунт

Я тестирую некоторые конфигурации slurm. Мне удалось настроить логин раздела с помощью плагина job_submit.lua: [root@controller ~]# sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST tiny* up 5-00:00:00 3 idle cn[1-40] # 1 core medium up 5-00:00:0…
06 май '19 в 21:54
1 ответ

slurm позволяет аутентификацию без выделения

Я использую грязь с Munge. За исключением одного узла все остальные работают нормально. Но на одном узле можно подключиться к нему по ssh, даже без какого-либо допустимого выделения. Я проверил файл sshd и system-auth. Они абсолютно одинаковы на все…
26 окт '17 в 15:29
0 ответов

Состояние задания = причина сбоя = ненулевой код выхода, SLURM

Я новичок в Slurm, я пытался выполнить простую работу. Я запускаю Slurm поверх виртуальной машины. Вот мой slurm.conf: SlurmctldHost=master #SlurmctldHost= # #DisableRootJobs=NO #EnforcePartLimits=NO #Epilog= #EpilogSlurmctld= #FirstJobId=1 #MaxJobI…
04 май '19 в 17:33
0 ответов

Настройка ANSYS RSM для использования с SLURM

Я пытаюсь запустить ANSYS RSM с ​​настройкой, чтобы он мог работать с планировщиком заданий SLURM в моей университетской HPC. Я нашел некоторую документацию, но я не мог понять это ясно. Я также нашел подобный вопрос здесь ( Ansys Remote Solver с кл…
19 фев '19 в 21:36
1 ответ

Как использовать запрос slurm только для одного ядра вместо узла или сокета?

Я написал сценарии Perl для анализа моих данных моделирования. Это не параллельная программа. В кластере восемь узлов. Каждый из узлов имеет 2 сокета, который обладает 10 ядрами. Я хочу отправить свою работу с помощью Slurm и запросить только одно я…
12 фев '19 в 03:17
0 ответов

Как правильно использовать SLURM's --dependency=expand:<jobid>

У меня есть 1 незавершенное задание из 5, которое выполняется 19 часов, и я обеспокоен тем, что оно настанет до наступления рабочего дня. Я не администратор, и сейчас выходные, поэтому я хотел бы попробовать использовать эту функцию, которую я обнар…
03 ноя '18 в 12:32
1 ответ

Ansys Remote Solver с кластером SLURM

Я пытаюсь подключить Ansys, работающий на CentOS 7, к нашему кластеру HPC, который использует SLURM в качестве планировщика. Я просмотрел все файлы конфигурации, которые мог придумать. Я даже написал свой обычай hps_commands_SLURM.xml файл я получаю…
28 фев '18 в 16:19
2 ответа

Завершение работы зомби SLURM

Я столкнулся со следующей проблемой во время первого жесткого отключения кластера отдела, за который я отвечаю. Система работает под управлением SLURM 17.11 и использует MariaDB/SQL для хранения учетных данных. Чтобы выполнить обновление памяти, мне…
19 ноя '18 в 11:27
1 ответ

Сбой инициализации слёрма

Я пытаюсь настроить Slurm в кластере малины с Raspbian 9.4. Я могу запустить slurmctld, но когда я пытаюсь запустить slurmd, я получаю следующий вывод: pi@node1:~ $ slurmd -Dvvvc slurmd: debug: Log file re-opened slurmd: error: Domain socket directo…
16 июл '18 в 11:30
0 ответов

Параллельное задание Ansys в кластере Slurm застряло без сообщения об ошибке или выходе

Я работаю над кластером Slurm, выполняя задания Ansys (V18.2) параллельно. Большие задания (то есть большие файлы решателя) часто зависают без сообщения об ошибке или сообщения о выходе, задания продолжают выполняться до истечения времени ожидания. …
10 апр '19 в 06:39