Пакетные задания PBS - команда qalter

У меня гигантские вычисления на кластере Scientific Linux. В настоящее время у меня более 600 заданий, припаркованных в очереди, ожидающих процессорного времени, в то время как некоторые из них выполняются.

Я пытаюсь использовать команду qalter на некоторых незанятых, но запланированных работах. Я хотел бы запланировать их на более позднее время, чтобы другие пользователи могли переходить часть очереди, что-то вроде акта вежливости. Это выполнимо?

Например, JOBNAME 292399 в настоящее время простаивает, планируется запускать каждый раз, когда в очереди появляется место.

Но если я бегу qalter -a 10051000 292398 с последующим qrerun 292398 я получил qrerun: Request invalid for state of job 292398.euler,

Из документации qalter я подумал, что 10051000 относится к завтрашнему дню (5 октября, 10 утра), но, возможно, я что-то неправильно понимаю?

Если я пойду неправильно, пожалуйста, дайте мне знать. Главное, что я ищу, это команда, которая легко скриптируется, так что я могу изменить ее, когда мои задачи в очереди запускаются. qalter кажется хорошим для этих целей, если я смогу заставить его работать. Я предпочел бы избегать запуска qdel и повторной подстановки вычислений, так как существует проблема с бухгалтерией, какие задачи нужно перезапускать (а какие нет). Я хочу избежать такой бухгалтерии.

Из поисков в поисках я заметил, что некоторые команды qalter имеют довольно разные форматы даты, но вышеприведенное выглядит правильным, насколько я могу судить из man docs.

Любая помощь будет оценена.

1 ответ

Решение

Использование qhold чтобы удержать на работе. Когда вы будете готовы запустить его, используйте qrls освободить работу. Вы можете легко создать cron-скрипт для этой цели.

См. Руководство пользователя PBS Professional и Руководство администратора TORQUE (TORQUE в основном совместим с PBS) для получения дополнительной информации.

Изменить: вы можете использовать qalter -a как хорошо, но не пользуйтесь qrerun: задание не выполняется и не может быть выполнено до истечения даты и времени, указанных в qalter -a команда, так qrerun возвращает ошибку.

Другие вопросы по тегам