BAND大体系计算,进程状态出现D
在命令行输入top命令回车,可以检测进程,S一列是进程的状态。如下图所示,是在一台128核工作站上,提交了一个大体系的128核并行计算任务,出现了大量D状态,即停工的状态。
作者建议如下:
D表示BAND不再进行大规模的I/O,而I/O里面最主要的是密度矩阵的读写,20次迭代后由于DIIS算法的关系,密度矩阵读写会更多。这种情况下,建议将DIIS的nvctrx参数降低。
另外,如果使用多节点多核,而非单节点多核,该问题可能会减轻。另外,内存不足时,试图声明更多内存时,也会如此。