快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊
大家好,我们又见面了啊~本文《快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊》的内容中将会涉及到等等。如果你正在学习科技周边相关知识,欢迎关注我,以后会给大家带来更多科技周边相关文章,希望我们能一起进步!下面就开始本文的正式内容~
编辑 | KX
两年前,清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH,可极大加速电子结构计算。
近日,该团队开发了一种准确而有效的实空间重构方法(real-space reconstruction),将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组,使得 DeepH 方法可与所有密度泛函理论(DFT)程序兼容。而且,该重构方法比传统的基于投影的方法快几个数量级。
这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力,并打通了其利用电子结构大数据作深度学习的通道。
相关研究以「Generalizing deep learning electronic structure calculation to the plane-wave basis」为题,于 10 月 3 日发布在《Nature Computational Science》上。
DeepH 成功与局限性
近年来,从头计算与 AI 相结合取得了显著进展。这大大扩展了理论和计算材料研究的范围,达到了前所未有的精度和效率。
深度学习方法 DeepH 取得了巨大的成功,在比传统 DFT 方法快多个数量级的速度下仍能保持亚毫电子伏的精度。
然而,此类方法只支持局域原子轨道 (AO) 基组下的 DFT 程序,而完全不兼容使用平面波 (PW)基组的 DFT 程序。事实上,平面波基组相对原子轨道基组有其独特的优势,如容易收敛、精度高、应用更广泛等,因此将 DeepH 方法推广至平面波基组对深度学习电子结构计算的未来发展具有重要的意义。
比传统方法快几个数量级
为了解决以上问题,清华研究团队提出了一种基于 PW DFT 结果的实空间重构方法来重构 AO 哈密顿量。该方法比直接投影 PW 哈密顿量或波函数的传统方法快几个数量级。
此外,研究表明,使用该方法生成的 AO 哈密顿量不仅可以很好地再现 PW 电子结构,而且非常容易被神经网络模型学习。因此,解决了 PW 基下的深度学习 DFT 哈密顿量的关键问题。新方法的高精度和高效性有利于构建更通用、更准确的深度学习电子结构计算方法,这不仅使它们能够为更广泛的科学界所使用,而且极大地提高了它们在一般应用中的适用性。
将 PW 汉密尔顿量转换为 AO 基组的三种方法
该方法的实际工作流程为:一组小型非扭曲结构的 PW DFT 结果用于在 AO 基下重构汉密尔顿量。然后可以推广在这些重构汉密尔顿量上训练的神经网络来预测大型扭曲结构的汉密尔顿量。
PW 汉密尔顿量和 AO 汉密尔顿量实际上是在不同基组下表达的相同物理量。原则上,一旦有了 PW 汉密尔顿量,就可以通过改变基组来获得相应的 AO 汉密尔顿量
,然后当前的 AO 汉密尔顿量神经网络可以灵活地学习该 AO 汉密尔顿量。
在此,研究人员简要讨论了将 PW 汉密尔顿量转换为 AO 基组的三种方法。
投影(projectio)方法被广泛用于弥合 PW 和 AO 之间的差距。其最初是为了评估 AO 基组的质量而开发的,投影方法可以修改为直接将哈密顿量从 PW 基转换为 AO 基:
这里,PW 基在 Born–von Kármán (BvK) 超晶胞中被归一化:,其中,k 是第一布里渊区中的波矢,G 是倒格矢,N 是形成 BvK 超晶胞的原始晶胞数,Ω 是原始晶胞的体积。AO 基函数 |ϕiα〉 以原子 i 为中心。可能有多个基函数(标记为 n)共享相同的角动量量子数 l 和磁量子数 m。指标 α 是 n、l、m 的缩写。
方程 (1) 被称为 Hk(G, G′) 投影法。
如果得到了 PW 哈密顿量的特征值 εnk 和波函数 |ψnk〉,则方程 (1) 可以进一步写成:
方程 (2) 被称为 ψnk(G) 投影法。
虽然方程 (1) 和 (2) 是将 PW 哈密顿量转换为 AO 基的直接方法,但它们的计算效率较低。此外,它们都相对于系统中的原子数量以立方比例缩放,这限制了它们的应用范围。
事实上,可以利用实空间中的局部性来大大加快计算速度。原子单位下的实空间中的哈密顿量为:
其中,各个项分别对应于动能、Hartree 势、交换关联势以及伪势的局部和非局部部分。本研究仅考虑交换和关联的半局部函数。方括号中的三个项称为总有效局部势:,它在单位晶胞上是周期性的。一旦有了 H(r, r′),就可以直接在实空间中计算 AO 哈密顿量,如下所示:
该方法称为实空间重构方法。
尽管它们在理论上是等效的,并且在收敛时会产生相同的结果,但所提出的实空间重构方法比前两种基于投影的方法效率高得多。
两个研究案例
应用于扭曲双层石墨烯
深度学习 DFT 汉密尔顿量方法最显著的能力是神经网络模型可以在小结构上进行训练,并推广到预测更大结构的汉密尔顿量。
在双层石墨烯的研究中,训练集由 300 个 4 × 4 双层石墨烯超晶胞组成,这些超晶胞具有不同的堆叠和每个原子位置的随机扰动。研究人员在根据 PW DFT 结果重建的 AO 汉密尔顿量训练神经网络模型后,可以使用该模型系统地研究具有任意扭曲角度的莫尔扭曲超结构。
首先,在训练集的一个结构上对重建的哈密顿量进行基准测试,将其能带结构与使用 PW 计算的能带结构绘制在一起。如图 1c 所示,两个能带结构非常吻合。
在训练神经网络模型后,用它来研究众所周知的「魔角」扭曲双层石墨烯,θ = 1.08°,莫尔超晶胞中有 11,164 个原子。有了深度学习 DFT 哈密顿量方法,计算成本可以大大降低。如图 1d 所示,与 PW DFT 基准相比,在重建的 AO 哈密顿量上训练的神经网络能够给出非常准确的预测,误差仅为几毫电子伏。
此外,当使用从 PW DFT 输出重建的 AO 汉密尔顿量训练神经网络时,预测的能带结构(图 1d 中的 PW-NN)与 Lucignano 等人的 PW DFT 结果相比,与使用 AO DFT 计算的汉密尔顿量(图 1d 中的 AO-NN)训练神经网络的情况相比,具有更好的一致性。
这表明与 PW DFT 接口的深度学习汉密尔顿量确实可以给出更高精度的结果。这种高精度与 PW 方法的灵活性和广泛适用性相结合,将大大增强深度学习从头计算的能力,并将对未来的研究大有裨益。
应用于双层 MoS2
接下来,在双层 MoS2 系统研究中比较了三种方法。首先,研究人员在由六个原子组成的 AB 堆叠双层晶胞上测试了重构方法,从重构的 AO 哈密顿量获得的能带结构与 PW DFT 结果非常吻合。然后,绘制了三种不同方法给出的能带结构,它们几乎相同,只是 ψnk(G) 投影方法给出的能带结构与其他两种方法略有不同,因为在方程 (2) 时仅使用了有限数量的能带。
然后,进一步比较了三种方法的计算时间。正如预期的那样,两种基于投影的方法显示出大致的立方缩放。它们甚至比完全自洽场计算更耗时。相反,由于 AO 基的局部性,实空间重建方法实现了线性缩放,并且可以比投影方法快几个数量级。
研究人员表示:「我们工作的一个直接影响是,使深度学习电子结构方法适用于那些已经熟悉 PW 方法但在 AO DFT 方面经验较少的人。另一个有前途的未来应用是,建立通用的深度学习模型,可以处理不同类型的材料并准确预测它们的电子结构。」
到这里,我们也就讲完了《快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于深度学习,理论,材料学,电子结构,DFT的知识点!

- 上一篇
- 为什么 MySQL SQL 语句中会使用 1=1 ?

- 下一篇
- 解决电脑故障的神奇一键修复工具
-
- 科技周边 · 人工智能 | 3小时前 |
- 通灵义码新手速成!3步教你玩转基础用法
- 215浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 即梦AI字幕翻译导出全攻略,多语言字幕设置超详细教程
- 301浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 通灵义码5个超强技巧教学,助你快速上分变大佬!
- 167浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 朋友圈必备!豆包AI创意库强势来袭
- 122浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 拼多多商家看过来!DeepSeek自动营销话术轻松生成教程
- 194浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- TENVAD:低延迟轻量化高精度AI语音检测系统
- 273浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 61次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 84次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 90次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 83次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 85次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览