差别

这里会显示出您选择的修订版和当前版本之间的差别。

--- atk:解决quantumatk运行性能和内存消耗问题 [2023/06/04 09:07] – [特定于器件构型] fermi
+++ atk:解决quantumatk运行性能和内存消耗问题 [2023/06/04 09:36] – [想要运行更快？] fermi
@@ 行 1: / 行 1: @@
 ====== 解决QuantumATK运行性能和内存消耗问题 ======
-在本教程中，您将学习用于提高各种系统 **ATK** 性能而需要调整的主要参数。为了获得尽可能高的计算性能，**ATK** 提供了一系列不同的算法，并利用 MPI 和共享内存线程进行并行。正如技术说明 [[https://docs.quantumatk.com/technicalnotes/parallelization/parallelization.html#parallelization|Parallelization of QuantumATK calculations]] 中已经提到的，MPI 并行通常会提供最佳的计算加速，而进程的线程化通常可以减少内存占用。
+===== 问题概述 =====
-要获得任何高性能软件的绝对最佳性能，需要对所涉及的计算和使用的硬件有一定的深入了解。因此，对于使用的硬件和并行方法，优化您的 QuantumATK 模拟非常重要。然而，下面章节给出了一些关于 QuantumATK 算法和选项的提示，也可能有助于解决内存或速度问题。
+衡量 QuantumATK 计算运行性能的指标是正确运行计算得到结果的时间长短。计算性能的限制因素主要来自于：
-===== 内存不足？ =====
+  * CPU主频、并行、缓存。这是直接决定计算速度的因素；
+  * 内存大小。计算中，特别是DFT计算中有许多大型的中间数据，这些数据在内存中保存可以大大提高计算速度，但是会造成内存过度占用甚至溢出；
+  * 操作系统与作业队列系统对计算资源的调度。
+  * 程序本身的代码和编译质量。由于 QuantumATK 提供给用户的预编译好的二进制代码，因此程序本身的问题只能等待开发组在未来版本中解决。
+一般情况下，我们总是优先选择将中间结果保存在内存中，这也是计算设置的默认选项。在发生问题时，存在两种情况，一种是 QuantumATK 给出内存溢出错误：
+对于明确的内存溢出错误信息，可以考虑：
+  * 增加硬件内存；
+  * 更改控制参数，不保存中间数据，以节约内存，使计算得以完成。
+另一种是 QuantumATK 未给出错误，但发生异常终止，log文件没有错误信息或者有如下类似的错误信息：
+此时，意外终止的原因并不清楚，可能的原因包括：
+  * 内存读写错误，可能是计算节点大量的内存泄漏（解决：重启节点）
+  * MPI与硬件存在不兼容（解决：自行安装测试使用其他版本的 Intel MPI 或 MPICH）
+  * 内存不足（解决：参考下文降低内存需求）
+===== 软件层面影响计算速度和内存占用的主要因素 =====
+==== 算法与模型 ====
+不同的算法、不同的模型、不同的分析等计算性能相差很大：
+  * 普通列表项目有些计算是单纯的 DFT 自洽，可以通过简单的Calculator参数控制计算的性能；
+  * 有些计算包含多个 DFT 自洽过程，例如声子动力学矩阵、IVCharacteristics曲线等，此时要综合考虑并行的效果；
+  * 有些计算还会改变DFT自洽计算的实际模型，例如声子动力学矩阵在实际计算时，采用的是对超胞进行自洽的方法。
+==== 并行计算 ====
+要获得任何高性能软件的最佳性能，需要对所涉及的计算和使用的硬件有一定的深入了解。因此，对于使用的硬件和并行方法，优化您的 QuantumATK 模拟非常重要。然而，下面章节给出了一些关于 QuantumATK 算法和选项的提示，也可能有助于解决内存或速度问题。
+===== 减少内存消耗 =====
@@ 行 27: / 行 64: @@
-===== 想要运行更快？ =====
+===== 提升运行速度 =====
@@ 行 35: / 行 72: @@
   * 设置 **AlgorithmParameters** 中的 **store_basis_on_grid** 为 **True**。这将使计算运行更快，并具有适度但分布式的内存开销。
-==== 特定于分子和块体构型 ====
+==== 对于分子和块体构型 ====
 在 **ATK 2015** 中为 **AlgorithmParameters** 中的 **density_matrix_method** 引入了两个新增参数：**processes_per_kpoint** 和 **bands_above_fermi_level**。
@@ 行 76: / 行 113: @@
 </WRAP>
-==== 特定于器件构型 ====
+==== 对于器件构型 ====
 实际上，您可以调整许多参数获得器件构型的最佳性能，有些取决于您正在研究的体系和所使用的方法。

费米维基

用户工具

站点工具

差别

页面工具