首页
/ HamGNN项目最佳实践教程

HamGNN项目最佳实践教程

2025-05-21 12:05:15作者:郦嵘贵Just

1、项目介绍

HamGNN是一个基于E(3)等变图神经网络,旨在为分子和固体材料预测从头算紧束缚(Tight-Binding, TB)哈密顿矩阵的项目。它支持与依赖数值原子轨道的常用从头算DFT软件(如OpenMX、Siesta和ABACUS)协同使用,并能够预测具有自旋轨道耦合效应的SU(2)等变哈密顿矩阵。HamGNN提供了一个高保真度近似DFT结果,并能够在不同材料结构间实现可迁移的预测,使其成为大规模系统电子结构计算加速的理想选择。

2、项目快速启动

安装环境

推荐使用Python 3.9。HamGNN所需的Python库包括:

  • numpy == 1.21.2
  • PyTorch == 1.11.0
  • PyTorch Geometric == 2.0.4
  • pytorch_lightning == 1.5.10
  • e3nn == 0.5.0
  • pymatgen == 2022.3.7
  • tensorboard == 2.8.0
  • tqdm
  • scipy == 1.7.3
  • yaml

安装环境有两种方法:

  1. 使用environment.yaml

    conda env create -f environment.yaml
    

    注意:使用当前environment.yaml创建的环境可能在训练SOC哈密顿矩阵时出现错误。

  2. 使用预构建的Conda环境:

    从Zenodo下载预构建的HamGNN Conda环境(ML.tar.gz文件),解压到conda/envs目录中。

安装HamGNN

git clone https://github.com/QuantumLab-ZY/HamGNN.git
cd HamGNN
python setup.py install

如果从旧版本升级,先卸载旧版本:

pip uninstall HamGNN

确保删除site-packages目录中的残留文件(如HamGNN-x.x.x-py3.9.egg/HamGNN)后再安装新版本。

使用HamGNN

准备哈密顿矩阵训练数据

  1. 生成结构文件(如POSCAR或CIF)。
  2. 将结构转换为OpenMX格式(.dat)。
  3. 在结构文件上运行OpenMX,生成包含哈密顿矩阵和重叠矩阵信息的.scfout二进制文件。
  4. 使用openmx_postprocess处理.scfout文件,生成.overlap.scfout文件。

准备哈密顿矩阵评估数据

如果已有训练好的模型,准备评估数据的方法与训练数据类似,区别在于:

  1. 跳过OpenMX计算,直接将openmx_postprocess生成的.overlap.scfout文件当作OpenMX生成的.scfout文件使用。

图数据转换

  1. graph_data_gen.yaml文件中设置路径。

  2. 运行以下命令,将结构和哈密顿矩阵数据转换为HamGNN网络的输入文件:

    graph_data_gen --config graph_data_gen.yaml
    

    生成graph_data.npz文件,用于HamGNN的输入。

HamGNN网络训练和预测

  1. 配置网络:在config.yaml文件中设置网络和训练参数。

  2. 训练HamGNN:运行以下命令,启动训练过程:

    HamGNN2.0/HamGNN1.0 --config config.yaml
    
  3. 监控训练:使用TensorBoard跟踪训练进度。

  4. 预测:训练完成后,将待预测的结构转换为graph_data.npz,设置config.yaml中的checkpoint_path为训练模型路径和stagetest,然后运行:

    HamGNN2.0 --config config.yaml
    

3、应用案例和最佳实践

HamGNN适用于高吞吐量的电子结构计算,特别是在处理大规模系统时。最佳实践包括:

  1. 确保使用的Python和库版本符合HamGNN要求。
  2. 在训练模型前,确保准备好的数据质量和完整性。
  3. 根据实际情况调整config.yaml中的参数,优化模型性能。
  4. 使用TensorBoard监控训练过程,及时调整模型和参数。

4、典型生态项目

HamGNN与其他开源项目协同工作,例如:

  1. OpenMX:用于生成紧束缚哈密顿矩阵。
  2. Siesta:用于计算电子结构。
  3. ABACUS:用于研究电子结构、力学和热力学性质。
  4. PyTorch Geometric:用于构建图神经网络。

通过遵循以上最佳实践和利用HamGNN及其生态项目的强大功能,可以有效地进行高吞吐量的电子结构计算。

登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
168
2.05 K
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
92
599
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
199
279
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
954
563
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
78
71
Git4ResearchGit4Research
Git4Research旨在构建一个开放、包容、协作的研究社区,让更多人能够参与到开放研究中,共同推动知识的进步。
HTML
25
4
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
60
17
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
0