Пакетные задания PBS - команда qalter
У меня гигантские вычисления на кластере Scientific Linux. В настоящее время у меня более 600 заданий, припаркованных в очереди, ожидающих процессорного времени, в то время как некоторые из них выполняются.
Я пытаюсь использовать команду qalter на некоторых незанятых, но запланированных работах. Я хотел бы запланировать их на более позднее время, чтобы другие пользователи могли переходить часть очереди, что-то вроде акта вежливости. Это выполнимо?
Например, JOBNAME 292399
в настоящее время простаивает, планируется запускать каждый раз, когда в очереди появляется место.
Но если я бегу qalter -a 10051000 292398
с последующим qrerun 292398
я получил qrerun: Request invalid for state of job 292398.euler
,
Из документации qalter я подумал, что 10051000 относится к завтрашнему дню (5 октября, 10 утра), но, возможно, я что-то неправильно понимаю?
Если я пойду неправильно, пожалуйста, дайте мне знать. Главное, что я ищу, это команда, которая легко скриптируется, так что я могу изменить ее, когда мои задачи в очереди запускаются. qalter кажется хорошим для этих целей, если я смогу заставить его работать. Я предпочел бы избегать запуска qdel и повторной подстановки вычислений, так как существует проблема с бухгалтерией, какие задачи нужно перезапускать (а какие нет). Я хочу избежать такой бухгалтерии.
Из поисков в поисках я заметил, что некоторые команды qalter имеют довольно разные форматы даты, но вышеприведенное выглядит правильным, насколько я могу судить из man docs.
Любая помощь будет оценена.
1 ответ
Использование qhold
чтобы удержать на работе. Когда вы будете готовы запустить его, используйте qrls
освободить работу. Вы можете легко создать cron-скрипт для этой цели.
См. Руководство пользователя PBS Professional и Руководство администратора TORQUE (TORQUE в основном совместим с PBS) для получения дополнительной информации.
Изменить: вы можете использовать qalter -a
как хорошо, но не пользуйтесь qrerun
: задание не выполняется и не может быть выполнено до истечения даты и времени, указанных в qalter -a
команда, так qrerun
возвращает ошибку.