用户工具

站点工具

本页面的其他翻译:
  • zh

adf:pbsorlsf

集群、超算:通过PBS、LSF或SLURM脚本提交任务、设定任务核数

注意:

一、LSF系统

1,脚本样本

将本地的*run文件上传到集群(如果是使用SSH Secure Shell,可以在Edit-Setting-File Transfer中ASCII extension中将某个不常用的后缀,例如html改为run,可以避免Windows/Linux文件格式不兼容的问题。),同时从管理员得到标准的pbs脚本或lsf脚本,在理解含义的前提下,类似如下地修改: LSF脚本范本:

#!/bin/sh
APP_NAME=intelg_small
NP=16
NP_PER_NODE=4
RUN="RAW"
source /home-gg/users/nscc1143/ADF/ams2020.101/amsbashrc.sh
export OMP_NUM_THREADS=1   !如果是ReaxFF作业建议增加这一行
 
JOBNAME=
 
dos2*unix ./${JOBNAME}.run
chmod 700 ./${JOBNAME}.run
mkdir ${JOBNAME}
mv ./${JOBNAME}.run ${JOBNAME}
cd ${JOBNAME}
mkdir /tmp/${JOBNAME}
export SCM_TMPDIR=/tmp/${JOBNAME}
./${JOBNAME}.run >${JOBNAME}.out
rm -rf $SCM_TMPDIR
mv ams.results ${JOBNAME}.results 
mv logfile ${JOBNAME}.logfile
mv * ../
cd ..
rm -rf ${JOBNAME}

用户将该脚本和run文件与脚本文件放到同一个文件夹内,并在上述脚本文件中

JOBNAME=

填写上具体的名字即可提交,例如上传的文件是123.run,则JOBNAME=123。

2,如果集群可以使用GUI

AMSJobs → Queue → New → LSF即可设置。参考:

二、PBS系统

1,脚本样本

#!/bin/bash
#PBS -N cc 
#PBS -l nodes=1:ppn=20
#PBS -q long
#PBS -j oe
#PBS -l walltime=168:00:00
NPROCS=`wc -l < $PBS_NODEFILE`
cd $PBS_O_WORKDIR
source /home-gg/users/nscc1143/ADF/ams2020.101/amsbashrc.sh
export OMP_NUM_THREADS=1  !如果是ReaxFF作业建议增加这一行
 
JOBNAME=
 
dos2*unix ./${JOBNAME}.run
chmod 700 ./${JOBNAME}.run
mkdir ${JOBNAME}
mv ./${JOBNAME}.run ${JOBNAME}
cd ${JOBNAME}
mkdir /tmp/${JOBNAME}
export SCM_TMPDIR=/tmp/${JOBNAME}
./${JOBNAME}.run >${JOBNAME}.out
rm -rf $SCM_TMPDIR
mv ams.results ${JOBNAME}.results 
mv logfile ${JOBNAME}.logfile
mv * ../
cd ..
rm -rf ${JOBNAME}

用户将该脚本和run文件与脚本文件放到同一个文件夹内,并在上述脚本文件中

JOBNAME=

填写上具体的名字即可提交,例如上传的文件是123.run,则JOBNAME=123。

如果是进行片度分析,那么参考:Linux系统中,片段分析如何使用run文件提交任务

2,如果集群使用PBS提交作业,而且允许用户可以使用GUI

在登录节点或管理节点打开AMSJobs → Queue → New → PBS,上面脚本内容,对应的设置参考:

三、SLURM系统

1,通过脚本在管理节点提交作业

AMS的Linux版,有IntelMPI和OpenMPI两个版本,建议使用IntelMPI版,且使用AMS自带MPI。 提交作业一般采用如下命令:

yhbatch -p A -N B -n C ./*.run

其中

  1. yhbatch为提交作业命令,不同集群该命令不一样,请咨询管理员或参考其他软件提交时采用的命令,例如有的集群用sbatch
  2. A为队列名,是计算中心管理员为您提供的,一般为一串字母
  3. B本次计算使用几个节点
  4. C本次使用多少核

例如yhbatch -p PKU -N 2 -n 8 ./CH4.run,表示用户的队列名为PKU,本次计算使用2个节点共8核,任务的run文件在当前目录,为CH4.run

注意

  • 如果提交作业无法并行计算,只能单线程计算,可以将ams202*.*/bin/start中这一行,
    if test "$slurmver" != "" -a "$slurmver" -ge 15 ; then

    的ge改为le,然后重新提交测试。

  • 旧版有可能需要修改程序(详见链接

2,如果管理节点可以使用GUI,也可以在AMSJobs中提交作业

配置Queue,参考:

如果运行有问题,可以咨询ams@fermitech.com.cn。

adf/pbsorlsf.txt · 最后更改: 2024/10/12 12:02 由 liu.jun

© 2014-2022 费米科技(京ICP备14023855号