1) 中国科大还是不错 2) 1 动机 在校内乃至全球范围内,VASP 应用占用了很大一部分超算资源,所以对其计算速度与计算有效性的改进非常重要,可以 显著提升超算资源的使用效率与用户体验。本文将从应用并行参数方面来展示VASP 的优化运行测试,希望不仅能给用户的 VASP 使用提供计算指导,还计划能以测试经验为基础,在VASP 作业运行前,自动化的检测分析用户设定的各种系统与应用 的并行参数问题,在不影响计算结果的前提下,给出优化设置建议。本文档简明总结了一些早期的相对丰富的探索,先行提供给 用户参考,并期望得到足够反馈,以便进一步改进与完善,得到更加可靠有用的经验基础。 2) 2 问题 首先,引用一段话来表明,在VASP 计算中,具体问题具体测试的必要性: 事实上,已有的测试已经有迹象表明,不同并行进程数的计算具有一组通用的较合适的参数空间[1],只是与VASP 的标准 指导手册并不相同,当前的诸多测试报告(包括引文)并没有注意到这一点。这一点的重要之处在于,它可以显著的缩小待测参 数空间,使我们有机会通过不多的几次测试便可将作业优化到接近最优的参数点,使得对VASP 计算进行自动化封装成为可能, 本文将努力为读者展示这种可行性,以便自动化的优化VASP 的运行。 3) 3 计算对象 本次测试的计算对象为六方晶胞结构的ZrNCl 体系。选择这个体系源于其具有多个特征,如晶胞非立方,结构接近分层,同 时轻重元素种类丰富,在只测一个材料的情况下,其具有较多的非平凡代表性,期望后期在用户的反馈下,可以对更多有代表性 的体系做测试。本文中,为了全面的测试,我们不仅测试原胞与中等单胞下的多KPOINTs 计算,也测试中等单胞与超胞下的 Gamma 点计算。 4) 我们取五个代表算例,分别为: 1. 原胞,18 Atoms (Zr6N6Cl6),272 irreducible k-points 2. 超胞221,71 Atoms (Zr24N24Cl23),36 irreducible k-points 3. 超胞221,71 Atoms (Zr24N24Cl23),Gamma point 4. 超胞441,284 Atoms (Zr96N96Cl92),Gamma point 5. 超胞661,630 Atoms (Zr96N96Cl92),Gamma point 以下分别简记为A18K272,A71K36,A71K1,A284K1,A630K1。前两者因为计算多K-points,计算程序选用标准的vasp_std。 后三者我们只做Gamma 点计算,因为在很大的超胞下,达到同样的计算精度,并不需要很多的kpoints,此时,计算选用VASP 特别为Gamma 点计算优化的版本vasp_gam。 5) 本文主要讨论最重要的运行核心数与KPAR、NPAR/NCORE 并行参数的关系,KPAR 指代有多少KPOINT 被并行的处 理,NCORE 指代一个BAND 在多少CPU 核中进行计算,NPAR 指代总计有多少个BAND 并行处理,NCORE 与NPAR 只 能指定一个有效。一般而言,假设总运行核心数为32,KPAR=4,NCORE=4, 那么意味着,有并行计算4 个KPOINTs,每 个KPOINT 使用8 个核心,同时每个KPOINT 内部,4 个CPU 核共同做一个BAND,总计有2 个BAND 在并行。所以 KPOINT 并行属于外层的并行,BAND 并行属于较内层的并行。当人VASP 内的并行过程还很多,测试工作量也很大,所以当 前VASP 应用的运行时并行效率优化还会有较大的提升空间。本测试仍有NSIM、ECUT 等其他较重要的参数使用默认值或常 用值,并未测试他们对结果的影响等等,这将是今后需要继续完善之处。 6) |
说点什么...