新的「AI科学家」结合理论和数据来发现科学方程
在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是科技周边学习者,那么本文《新的「AI科学家」结合理论和数据来发现科学方程》就很适合你!本篇内容主要包括##content_title##,希望对大家的知识积累有所帮助,助力实战开发!
科学家们的目标是发现能够准确描述实验数据的有意义的公式。自然现象的数学模型可以根据领域知识手动创建,或者也可以使用机器学习算法从大型数据集自动创建。学界已经研究了表示相关先验知识与相关函数模型合并的问题,认为寻找与一般逻辑公理先验知识一致的模型,是一个悬而未决的问题。
IBM 研究团队以及三星 AI 团队的研究人员开发了一种方法「AI-Descartes」,通过将逻辑推理与符号回归相结合,能够从公理知识和实验数据中对自然现象模型进行原则性推导。
该研究以「Combining data and theory for derivable scientific discovery with AI-Descartes」为题,于 2023 年 4 月 12 日发布在《Nature Communications》。
人工神经网络 (NN) 和统计回归通常用于自动发现数据中的模式和关系。NN 返回「黑盒」模型,其中底层函数通常仅用于预测。在标准回归中,函数形式是预先确定的,因此模型发现相当于参数拟合。在符号回归(SR)中,函数形式不是预先确定的,而是由给定列表中的运算符(例如,+、-、× 和 ÷)组成,并根据数据计算得出。
SR 模型通常比 NN 模型更「可解释」,并且需要的数据更少。因此,为了从实验数据中以符号形式发现自然法则,SR 可能比 NN 或固定形式回归更有效;NN 与 SR 的集成一直是神经符号 AI 近期研究的主题。SR 的一个主要挑战是从许多适合数据的模型中识别出具有科学意义的模型。科学家将有意义的函数定义为平衡准确性和复杂性的函数。然而,对于给定的数据集存在许多这样的表达式,并且并非所有表达式都与已知的背景理论一致。
另一种方法是从已知的背景理论开始,但目前还没有实用的推理工具可以从一组已知的公理中生成与实验数据一致的定理。自动定理证明器(ATP)是使用最广泛的推理工具,它可以为给定逻辑理论证明猜想。计算复杂性是 ATP 面临的主要挑战;对于某些类型的逻辑,证明猜想是不可判定的。
此外,当涉及算术和微积分运算符时,使用形式推理工具从逻辑理论推导模型尤其困难。机器学习技术已被用于提高 ATP 的性能,例如,通过使用强化学习来指导搜索过程。
可推导的模型不仅要在经验上准确,而且它们应该是可预测的、有洞察力的。
IBM 研究团队以及三星 AI 团队的研究人员,试图通过将一种新颖的基于数学优化的 SR 方法与推理系统相结合,来获得此类模型。这产生了一个端到端的发现系统「AI-Descartes」,它通过 SR 从数据中提取公式,然后从一组公理中提供公式的可推导性的证明,或提供不一致的证明。当模型可证明不可推导时,研究人员提出了表明公式与可推导公式的接近程度的新度量,并且使用他们的推理系统计算这些度量的值。
图示:系统概述。(来源:论文)
在早期将机器学习与推理相结合的工作中,科学家使用基于逻辑的描述来约束生成图像的 GAN 神经架构的输出。也有团队结合机器学习工具和推理引擎,来搜索满足预先指定约束的函数形式。这是用新点扩充初始数据集,从而提高学习方法的效率和最终模型的准确性。也有团队还利用先验知识来创建额外的数据点。然而,这些研究仅考虑对要学习的函数形式的约束,并没有包含一般背景理论公理(描述现象中涉及的其他定律和未测量变量的逻辑约束)。
该论文的第一作者,三星 AI 的研究科学家 Cristina Cornelio 表示,AI-Descartes 提供了一些优于其他系统的优势,但它最显著的特点是它的逻辑推理能力。如果有多个候选方程可以很好地拟合数据,系统会识别哪些方程最适合背景科学理论。推理能力也使该系统有别于 ChatGPT 等「生成式 AI」程序,后者的大型语言模型逻辑能力有限,有时还会搞乱基础数学。
「在我们的工作中,我们正在将第一性原理方法与机器学习时代更常见的数据驱动方法相结合,这种方法几个世纪以来一直被科学家用来从现有背景理论中推导出新公式。」Cornelio 说, 「这种结合使我们能够利用这两种方法,并为广泛的应用创建更准确和有意义的模型。」
AI-Descartes 这个名字是对 17 世纪数学家和哲学家 René Descartes 的致敬,他认为自然世界可以用一些基本的物理定律来描述,逻辑推论在科学发现中发挥了关键作用。
图示:对系统实施的科学方法的解释。(来源:论文)
该团队的研究人员已经证明,将逻辑推理与符号回归相结合,在获得有意义的物理现象符号模型方面有重要价值;因为它们与背景理论一致,并且在明显大于实验数据的领域中具有很好的概括性。回归和推理的综合产生了比单独通过 SR 或逻辑推理更好的模型。
单个系统组件的改进或替换以及新模块的引入,例如溯因推理或实验设计将扩展整个系统的功能。推理和回归的更深入集成可以帮助合成数据驱动和基于第一性原理的模型,并导致科学发现过程的革命。发现与先验知识一致的模型将加速科学发现,并超越现有的发现范式。
该团队使用模型对开普勒行星运动第三定律、爱因斯坦相对论时间膨胀定律和朗缪尔吸附理论进行了推导;研究表明,当使用逻辑推理来区分在数据上具有相似误差的候选公式时,模型可以从少量数据点中发现支配规律。
图示:相关集合及其距离的可视化。(来源:论文)
「在这项工作中,我们需要人类专家以正式的、计算机可读的方式写下背景理论的公理是什么,如果人类遗漏了任何或弄错了其中的任何一个,系统将无法工作。」UMBC 化学、生物化学和环境工程助理教授 Tyler Josephson 说,「在未来,我们也希望将这部分工作自动化,这样我们就可以探索更多的科学和工程领域。」
最终,该团队希望他们的 AI-Descartes 能够像真人科学家一样激发一种富有成效的新科学方法。「我们工作中最令人兴奋的方面之一是更够在科学研究方面获得重大进展的潜力。」Cornelio 说。
论文链接:https://www.nature.com/articles/s41467-023-37236-y
相关报道:https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html
终于介绍完啦!小伙伴们,这篇关于《新的「AI科学家」结合理论和数据来发现科学方程》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

- 上一篇
- 小编教你固态硬盘如何安装系统

- 下一篇
- 电脑为什么不能关机?教你解决无法正常关机!
-
- 科技周边 · 人工智能 | 2分钟前 |
- DeepSeek+钉钉五分钟部署指南
- 347浏览 收藏
-
- 科技周边 · 人工智能 | 4分钟前 |
- 线下照相馆vsAI证件照哪个更优?
- 137浏览 收藏
-
- 科技周边 · 人工智能 | 8分钟前 |
- Nanonets-OCR-s模型发布与功能解析
- 394浏览 收藏
-
- 科技周边 · 人工智能 | 8分钟前 |
- 小米联手丰田,日系巨头真的醒悟了?
- 121浏览 收藏
-
- 科技周边 · 人工智能 | 12分钟前 |
- 五分钟掌握DeepSeek小红书爆款文案技巧
- 168浏览 收藏
-
- 科技周边 · 人工智能 | 15分钟前 |
- 豆包AI编程教程与代码实战指南
- 120浏览 收藏
-
- 科技周边 · 人工智能 | 30分钟前 |
- PerplexityAI怎么用?功能详解
- 211浏览 收藏
-
- 科技周边 · 人工智能 | 34分钟前 |
- 豆包AI新手必学!三步制作高赞吐槽图
- 263浏览 收藏
-
- 科技周边 · 人工智能 | 41分钟前 |
- DeepSeek联飞书,智能协作新方案
- 258浏览 收藏
-
- 科技周边 · 人工智能 | 47分钟前 |
- 线下照相馆vsAI证件照,哪个更清晰?
- 419浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 免费AI认证证书
- 科大讯飞AI大学堂推出免费大模型工程师认证,助力您掌握AI技能,提升职场竞争力。体系化学习,实战项目,权威认证,助您成为企业级大模型应用人才。
- 13次使用
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 157次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 188次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 174次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 162次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览