用户工具

站点工具

本页面的其他翻译:
  • zh

adf:clusterfloating_root

Linux集群浮动许可(推荐):安装、获取机器码、申请license、安装license

AMS软件本身并不区分正式版、试用版。对于试用版和正式版的区分,是在license文件,以及法律意义的授权协议上面。因此无论是试用版还是正式版,安装过程都是按照如下步骤(以2022.103版为例,其他版本类似)。

第一步,解压软件

将安装包上传到到被共享的目标文件夹(例如/public/software/AMS),并解压AMS安装包:

cd /public/software/AMS
tar zxf ./ams2022.103.pc64_linux.intelmpi.bin.tgz (当然不同的版本,这个文件名也不同)

这样会生成文件夹/public/software/AMS/ams2022.103。然后执行命令:

chmod 755 -R /public/software/AMS/ams20*.*

从而赋予程序适当权限:普通用户可以运行程序,但不能修改程序文件。

第二步,设置环境变量

在解压生成的AMS2022.103目录内,有一个文件,名为amsbashrc.sh,里面包含了AMS所需的环境变量。用户需要酌情考虑是否将临时文件夹从默认的/tmp更改为其他路径,例如作业当前目录,如果需要则在amsbashrc.sh最后添加一行(或在pbs脚本中source语句后,添加一行):

export SCM_TMPDIR=$PWD
  • SCM_TMPDIR所指向的这个目录,要注意经常清理,避免大量垃圾堆积;
  • 该目录最好是在高速读写硬盘中,如果用户不清楚,可以使用默认值(/tmp一般就在高速硬盘中);
  • 这个目录对AMS用户需要有读写权限,当然一般/tmp对所有用户都有读写权限;
  • (购买软件无限核license的用户忽略此条)。购买软件核数较少的用户,可以酌情增加一行环境变量:
    export SCM_WAIT_LICENSE=9999999999

    如果用户提交的作业,所需核数大于购买的核数,那么AMS程序就会等待前面任务完成,再自动运行后面等待的任务,但这个等待时间默认只有600秒,之后就会杀死这个等待的任务。为了与PBS、LSF系统更好的配合,可以将这个等待时间提高到很大,这样只要PBS、LSF没有杀死它,它就一直等待,从而更方便。

如果是ReaxFF用户,还建议增加一行:

export OMP_NUM_THREADS=1

这个变量是控制OpenMP并行,这个变量用的好,可以提高效率,但是用的不好则会降低效率。如果不想用,则需要在环境变量中将其设置为1。对于高级用户,如果您想使用该变量,请参阅:OMP_NUM_THREADS的运用

第三步,创建浮动目录,获取浮动信息

mkdir /public/software/AMS/AMSFloat  (注意,浮动目录可以在用户可以读写执行的任何位置,例如:
cd /public/software/AMS/AMSFloat
mkdir FloatADF       (如果没有购买ADF模块,就不需要创建FloatADF)
mkdir FloatBAND      (如果没有购买BAND模块,就不需要创建FloatBAND)
mkdir FloatReaxFF    (如果没有购买ReaxFF模块,就不需要创建FloatReaxFF)
mkdir FloatDFTB      (如果没有购买DFTB模块,就不需要创建FloatDFTB)
mkdir FloatMLPot     (如果没有购买MLPot模块,就不需要创建FloatMLPot)
chmod 1777 Float*
ls -lid $PWD/Float*   (注意:$PWD不要省略!否则无法输出完整路径)

将产生的一行或几行信息的文本收集起来。

关于浮动目录的位置

Float*目录创建之后,不能改动,删除之后原位置重建也不可以。因此,Float*目录没有放在/public/software/AMS/ams2022.103下面,而是放在与ams202*.*同级别的位置下面。如此,升级新版时,只需要继续将新版软件解压到/public/software/AMS/,不需要再提交机器码,新的license可以直接使用。

第四步,获取机器码,用于申请license

节点信息

在主节点(提交作业时所在的节点),以及几个代表性计算节点(代表性节点指节点名字是一系列的,比如一个集群有100个计算节点,分三类命名,其中20个节点叫做node*,30个节点叫做cn*,50个节点叫做compute*,那么需要取的机器码就是主节点,以及三类计算节点分别任取两台)运行:

source /public/software/AMS/ams20*.*/amsbashrc.sh
dirac info

将这些节点上dirac info命令产生的输出内容,与第三步中产生的信息一起保存为文本文件,作为机器码

第五步,提交机器码

提交机器码:由注册人邮箱将机器码发送给费米科技(ams@fermitech.com.cn或相关人员),用于license的申请。邮件内容中请说明:单位、注册人、申请正式许可还是试用许可。如果不是注册人本人提交,需要抄送给注册人邮箱一般提交机器码之后,1~3工作日内会把license发给您,如果3天仍然没有收到,您可以联系我们查询一下进度。

第六步,安装license

用户收到license.txt文件之后,将该文件放置在AMS安装文件夹(如ams2022.103)中,之后即可正常使用。安装过程中有任何问题,可以发邮件到ams@fermitech.com.cn,说明尽量全面的报错的信息,我们将提供有效的协助。

第七步:如何提交作业、设置核心数

PBS/LSF提交作业的时候,source /public/software/AMS/ams2022.103/amsbashrc.sh将会添加到PBS/LSF脚本中。如果是SLURM系统,用户可以把source /public/software/AMS/ams2022.103/amsbashrc.sh写到/etc/profile文件最后一行,之后source /etc/profile即可提交作业。

具体参考:集群、超算:通过PBS、LSF或SLURM脚本提交任务、设定任务核数

adf/clusterfloating_root.txt · 最后更改: 2024/07/01 19:35 由 liu.jun

© 2014-2022 费米科技(京ICP备14023855号