SLURM on DEXCS2017 for OpenFOAM(R)

DEXCS for OpenFOAM(R) では、SLURMというリソースマネージャについて、DEXCS2013での試用記事を足掛かりにDEXCS2014より、この記事に記したのと同様の方法で搭載してきましたが、DEXCS2017からはインストール方法を変更し、それに伴い使用前の設定が必要になったので、ここに記しておきます。



DEXCSインストール直後の状態
⇒ジョブを投入してもペンディングになる場合があります

もっともシンプルに動作確認するには、コマンド端末にて、

srun -l sleep 60 &

(60秒間何もしないで待つの意味)

と打ち込んでジョブを投入、

squeue

にてジョブの状況を確認できます。

しかし、残念ながら上のような結果が返ってくることがあります。

とりあえず動かすには。。。

以下の2行を打ち込めばOKのはず

sudo systemctl restart slurmctld.service
sudo scontrol update NodeName=localhost State=Resume

入力が終わると、ペンディング状態だった先のジョブがR(Running)となり、しばらくしてから再度確認すれば終了している。

引き続き動作確認

6つのジョブを続けて投入すると。。。

直後では、最初に投入した4つのジョブ(JOBID:4-7)が実行中、残りの2つ(JOBID:8,9)がペンディングとなります。つまり、デフォルトの設定では、4コアのマシンを想定しているということ。

設定を変更するには

/usr/local/etc/slurm.conf(変更例)

上記変更での実施例

となれば、メデタシメデタシ・・・となるのですが、マルチCPUマシンの場合など、一筋縄でいかない場合もあります。

そもそもこのデフォルト設定パラメタは、とりあえず動けば良いというレベルで作成したもので、ちゃんと考えて作成したものではありません。

SLURMのインストールがそもそもパッケージマネージャからだと、従来の設定方法のようにはやれなくなって、参考サイトの情報を頼りに見真似で作成したものです。詳細を知りたい人は、そちらをご覧ください。

 

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です