Описание тега slurm
1
ответ
Конфигурация SLURM: cons_res с CR_Core либо не могут выделить ресурс, либо задания оказываются в состоянии CG
Я новичок в SLURM. Я пытаюсь настроить slurm в новом кластере. У меня есть 4 узла, каждый имеет 14 ядер. Я хотел разделить узлы таким образом, чтобы каждое ядро могло работать независимо (т. Е. Узел 01 может иметь одновременно 14 независимых после…
04 мар '17 в 18:19
1
ответ
Границы раздела Slurm на аккаунт
Я тестирую некоторые конфигурации slurm. Мне удалось настроить логин раздела с помощью плагина job_submit.lua: [root@controller ~]# sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST tiny* up 5-00:00:00 3 idle cn[1-40] # 1 core medium up 5-00:00:0…
06 май '19 в 21:54
1
ответ
slurm позволяет аутентификацию без выделения
Я использую грязь с Munge. За исключением одного узла все остальные работают нормально. Но на одном узле можно подключиться к нему по ssh, даже без какого-либо допустимого выделения. Я проверил файл sshd и system-auth. Они абсолютно одинаковы на все…
26 окт '17 в 15:29
0
ответов
Состояние задания = причина сбоя = ненулевой код выхода, SLURM
Я новичок в Slurm, я пытался выполнить простую работу. Я запускаю Slurm поверх виртуальной машины. Вот мой slurm.conf: SlurmctldHost=master #SlurmctldHost= # #DisableRootJobs=NO #EnforcePartLimits=NO #Epilog= #EpilogSlurmctld= #FirstJobId=1 #MaxJobI…
04 май '19 в 17:33
0
ответов
Настройка ANSYS RSM для использования с SLURM
Я пытаюсь запустить ANSYS RSM с настройкой, чтобы он мог работать с планировщиком заданий SLURM в моей университетской HPC. Я нашел некоторую документацию, но я не мог понять это ясно. Я также нашел подобный вопрос здесь ( Ansys Remote Solver с кл…
19 фев '19 в 21:36
1
ответ
Как использовать запрос slurm только для одного ядра вместо узла или сокета?
Я написал сценарии Perl для анализа моих данных моделирования. Это не параллельная программа. В кластере восемь узлов. Каждый из узлов имеет 2 сокета, который обладает 10 ядрами. Я хочу отправить свою работу с помощью Slurm и запросить только одно я…
12 фев '19 в 03:17
0
ответов
Как правильно использовать SLURM's --dependency=expand:<jobid>
У меня есть 1 незавершенное задание из 5, которое выполняется 19 часов, и я обеспокоен тем, что оно настанет до наступления рабочего дня. Я не администратор, и сейчас выходные, поэтому я хотел бы попробовать использовать эту функцию, которую я обнар…
03 ноя '18 в 12:32
1
ответ
Ansys Remote Solver с кластером SLURM
Я пытаюсь подключить Ansys, работающий на CentOS 7, к нашему кластеру HPC, который использует SLURM в качестве планировщика. Я просмотрел все файлы конфигурации, которые мог придумать. Я даже написал свой обычай hps_commands_SLURM.xml файл я получаю…
28 фев '18 в 16:19
2
ответа
Завершение работы зомби SLURM
Я столкнулся со следующей проблемой во время первого жесткого отключения кластера отдела, за который я отвечаю. Система работает под управлением SLURM 17.11 и использует MariaDB/SQL для хранения учетных данных. Чтобы выполнить обновление памяти, мне…
19 ноя '18 в 11:27
1
ответ
Сбой инициализации слёрма
Я пытаюсь настроить Slurm в кластере малины с Raspbian 9.4. Я могу запустить slurmctld, но когда я пытаюсь запустить slurmd, я получаю следующий вывод: pi@node1:~ $ slurmd -Dvvvc slurmd: debug: Log file re-opened slurmd: error: Domain socket directo…
16 июл '18 в 11:30
0
ответов
Параллельное задание Ansys в кластере Slurm застряло без сообщения об ошибке или выходе
Я работаю над кластером Slurm, выполняя задания Ansys (V18.2) параллельно. Большие задания (то есть большие файлы решателя) часто зависают без сообщения об ошибке или сообщения о выходе, задания продолжают выполняться до истечения времени ожидания. …
10 апр '19 в 06:39