当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

来源:机器之心 2024-07-26 14:18:53 0浏览 收藏

有志者,事竟成!如果你在学习科技周边,那么本文《谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~

对于 AI 来说,奥数不再是问题了。

本周四,谷歌 DeepMind 的人工智能完成了一项壮举:用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,并且距拿金牌仅一步之遥。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

上周刚刚结束的 IMO 竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合 AI 系统做对了四道,获得 28 分,达到了银牌水平。

本月初,UCLA 终身教授陶哲轩刚刚宣传了百万美元奖金的 AI 数学奥林匹克竞赛(AIMO 进步奖),没想到 7 月还没过,AI 的做题水平就进步到了这种水平。

IMO 上同步做题,做对了最难题

IMO 是历史最悠久、规模最大、最负盛名的青年数学家竞赛,自 1959 年以来每年举办一次。近来,IMO 竞赛也被广泛认为是机器学习领域的一项重大挑战,成为衡量人工智能系统高级数学推理能力的理想基准。

在今年的 IMO 竞赛上,由 DeepMind 团队研发的 AlphaProof 和 AlphaGeometry 2 共同实现了里程碑式的突破。

其中,AlphaProof 是一种用于形式化数学推理的强化学习系统,而 AlphaGeometry 2 是 DeepMind 几何求解系统 AlphaGeometry 的改进版本。

这一突破表明具有先进数学推理能力的通用人工智能 (AGI) 有潜力开启科学技术新领域。

那么,DeepMind 的 AI 系统是如何参加 IMO 竞赛的?

简单来说,首先这些数学问题被手动翻译成形式化的数学语言,以便 AI 系统理解。在正式比赛中,人类参赛选手分两节(两天)提交答案,每节限时 4.5 小时。AlphaProof+AlphaGeometry 2 组合成的 AI 系统在几分钟内就解决了一个问题,但花了三天时间来解决其他问题。虽然如果严格按照规则来说的话,DeepMind 的系统超时了。有人推测,这里面可能涉及大量的暴力破解。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

谷歌表示,AlphaProof 通过确定答案并证明其正确性解决了两道代数问题和一道数论问题。其中包括本次竞赛中最难的问题,在今年的 IMO 上只有五名参赛者解决了。而 AlphaGeometry 2 证明了一道几何问题。

AI 给出的解:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/index.html

IMO 金牌得主、菲尔兹奖得主 Timothy Gowers 和两届 IMO 金牌得主、IMO 2024 问题选择委员会主席 Joseph Myers 博士根据 IMO 评分规则,对该组合系统给出的解决方案进行了评分。

六个问题中的每一个问题满分 7 分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分——相当于银牌类别的最高分。今年的金牌门槛为 29 分,正式比赛的 609 名选手中有 58 人获得了金牌。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

该图显示了谷歌 DeepMind 的人工智能系统在 IMO 2024 上相对于人类竞争对手的表现。在总分为 42 分的情况下,该系统获得了 28 分,达到了与比赛银牌获得者相同的水平。另外,今年 29 分是能拿金牌的。

AlphaProof:一种形式化推理方法


在谷歌使用的混合 AI 系统中,AlphaProof 是一个以形式语言 Lean 来证明数学陈述的自训练系统。它结合了预训练语言模型与 AlphaZero 强化学习算法。

其中,形式语言为形式化地验证数学推理证明的正确性,提供了重要优势。在此之前,这在机器学习中的使用一直受限,因为人工编写数据数量非常有限。

相比之下,基于自然语言的方法尽管可以访问更多量级的数据,但会产生看似合理而不正确的中间推理步骤与解法。

谷歌 DeepMind 通过微调 Gemini 模型自动将自然语言问题陈述翻译为形式陈述,在这两个互补领域之间建立了一座桥梁,从而创建了一个包含不同难度形式问题的大型库。

给到数学问题,AlphaProof 会生成候选解题方案,然后通过搜索 Lean 中可能的证明步骤来证明它们。找到并验证的每个证明方案,都用来强化 AlphaProof 的语言模型,增强其解决后续更具挑战性问题的能力。

为训练 AlphaProof,谷歌 DeepMind 在 IMO 比赛前几周内证明或反证明了涵盖广泛难度与主题的数百万个数学问题。比赛期间还应用了训练 loop,以强化自生成竞赛题变体的证明,直到找到完整的解决方案。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so backAlphaProof 强化学习训练 loop 过程信息图:约一百万个非形式化数学问题被形式化网络翻译成形式化数学语言。然后,求解器网络搜索问题的证明或反证,通过 AlphaZero 算法逐步训练自己解决更具挑战性的问题。

更具竞争力的 AlphaGeometry 2

AlphaGeometry 2 是今年登上《自然》杂志的数学 AI AlphaGeometry 的重大改进版本。它是一个神经 - 符号混合系统,其中的语言模型基于 Gemini,并在比其前身多一个数量级的合成数据上从头开始训练。这有助于该模型解决更具挑战性的几何问题,包括有关物体运动以及角度、比例或距离方程的问题。

AlphaGeometry 2 采用的符号引擎比上一代产品快两个数量级。当遇到新问题时,新颖的知识共享机制可实现不同搜索树的高级组合,以解决更复杂的问题。

在今年的比赛之前,AlphaGeometry 2 可以解决过去 25 年中所有 IMO 几何历史问题的 83%,而其前身的解决率仅为 53%。在 IMO 2024 中,AlphaGeometry 2 在收到问题 4 的形式化后 19 秒内就解决了它。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

问题 4 的示例,要求证明∠KIL 与∠XPY 的和等于 180°。AlphaGeometry 2 提议在直线 BI 上构造点 E,使得∠AEB = 90°。点 E 有助于赋予线段 AB 中点 L 以意义,从而创建许多对相似三角形,如 ABE ~ YBI 和 ALE ~ IPC,以证明结论。

谷歌 DeepMind 还报告说,作为 IMO 工作的一部分,研究人员还试验了一种基于 Gemini 和一种最新的自然语言推理系统,希望实现高级的问题解决能力。该系统不需要将问题翻译成正式语言,并且可以与其他 AI 系统相结合。在今年的 IMO 赛题的测试中「显示出了巨大的潜力」。

谷歌正在继续探索推进数学推理的 AI 方法,并计划很快发布有关 AlphaProof 的更多技术细节。

我们对未来充满期待,数学家们将使用 AI 工具探索假设,尝试大胆的新方法来解决长期存在的问题,并快速完成耗时的证明元素——而像 Gemini 这样的 AI 系统将在数学和更广泛的推理方面变得更加强大。

研究团队

谷歌表示,新研究得到了国际数学奥林匹克组织的支持,此外:

AlphaProof 的开发由 Thomas Hubert、Rishi Mehta 和 Laurent Sartran 领导;主要贡献者包括 Hussain Masoom、Aja Huang、Miklós Z. Horváth、Tom Zahavy、Vivek Veeriah、Eric Wieser、Jessica Yung、Lei Yu、Yannick Schroecker、Julian Schrittwieser、Ottavia Bertolli、Borja Ibarz、Edward Lockhart、Edward Hughes、Mark Rowland 和 Grace Margand。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

其中,Aja Huang、Julian Schrittwieser、Yannick Schroecker 等成员也是 8 年前(2016 年)AlphaGo 论文的核心成员。8 年前,他们基于强化学习打造的 AlphaGo 声名大噪。8 年后,强化学习在 AlphaProof 中再次大放异彩。有人在朋友圈感叹说:RL is so back!

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

AlphaGeometry 2 和自然语言推理工作由 Thang Luong 领导。AlphaGeometry 2 的开发由 Trieu Trinh 和 Yuri Chervonyi 领导,Mirek Olšák、Xiaomeng Yang、Hoang Nguyen、Junehyuk Jung、Dawsen Hwang 和 Marcelo Menegali 做出了重要贡献。

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

此外,David Silver、Quoc Le、哈萨比斯和 Pushmeet Kohli 负责协调和管理整个项目。

参考内容:

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
上一篇
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
php框架在物联网中的应用
下一篇
php框架在物联网中的应用
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    14次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    14次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    27次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    26次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    53次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码