当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

来源:机器之心 2024-11-24 11:40:58 0浏览 收藏

一分耕耘,一分收获!既然都打开这篇《首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist》,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新科技周边相关的内容,希望对大家都有所帮助!

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

编辑 | ScienceAI

一年前,谷歌最后一位 Transformer 论文作者 Llion Jones 离职创业,与前谷歌研究人员 David Ha共同创立人工智能公司 Sakana AI。Sakana AI 声称将创建一种基于自然启发智能的新型基础模型!

现在,Sakana AI 交上了自己的答卷。

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

Sakana AI 宣布推出 AI Scientist,这是世界上第一个用于自动化科学研究和开放式发现的 AI 系统!

从构思、编写代码、运行实验和总结结果,到撰写整篇论文和进行同行评审,AI Scientist 开启了 AI 驱动的科学研究和加速发现的新时代。

原则上,它可以不断重复科学研究过程,以开放式的方式迭代开发想法,就像人类科学家一样。

研究人员通过将其应用于机器学习的三个不同子领域来展示它的多功能性:扩散建模、基于 Transformer 的语言建模和学习动力学。

每个想法都会被实施并发展成一篇完整的论文,每篇论文的成本不到 15 美元。为了评估生成的论文,研究人员设计并验证了一个自动审阅器,它在评估论文分数方面的表现接近人类。

AI Scientist 可以撰写出超过顶级机器学习会议接受门槛的论文。

AI Scientist 的推出标志着朝着充分发挥人工智能在科学研究中的潜力迈出了重要一步。通过自动化发现过程并整合人工智能驱动的审查系统,为最具挑战性的科学技术领域的创新和解决问题打开了无限可能之门。

相关研究以「The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery」为题,于 8 月 12 日发布在预印平台 arXiv 上。

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

论文链接:https://arxiv.org/abs/2408.06292

人工智能面临的一大挑战是开发能够进行科学研究和发现新知识的智能体。虽然前沿模型已被用作人类科学家的辅助工具,例如集思广益、编写代码或执行预测任务,但它们仍然只完成了科学过程的一小部分。

在最新的研究中,Sakana AI 的科学家提出了第一个全自动科学发现的综合框架,使前沿大型语言模型能够独立进行研究并传达其研究结果。

AI Scientist 可以产生新颖的研究想法、编写代码、执行实验、可视化结果、通过撰写完整的科学论文描述其研究结果,然后运行模拟审查流程进行评估。

关于AI Scientist

AI Scientist 有三个主要阶段:(1)创意生成,(2)实验迭代,(3)论文撰写。撰写完成后,研究人员会引入并验证 LLM 生成的评论,以评估所生成论文的质量。

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

图示:端到端 LLM 驱动的科学发现过程 AI Scientist 的概念说明。(来源:论文)

研究人员为 AI Scientist 提供了一个起始代码模板,该模板可重现流行模型或基准的轻量级基线训练运行。例如,这可能是针对莎士比亚作品训练小型 transformer 的代码,这是自然语言处理中的经典概念验证训练运行,可在几分钟内完成。

然后,AI Scientist 就可以自由探索任何可能的研究方向。该模板还包括一个 LaTeX 文件夹,其中包含样式文件和节标题以及简单的绘图代码。一般来说,每次运行都是从与主题领域相关的代表性小规模实验开始的。

研究人员解释道:「专注于小规模实验并不是我们方法的根本限制,而只是出于计算效率的因素,以及我们这边设备的计算限制。」

为什么写论文很重要?

鉴于科学家的总体目标是实现科学发现的自动化,为什么研究人员要让 AI Scientist 像人类科学家一样写论文呢?例如,以前的人工智能系统(如 FunSearch 和 GNoME)曾经在受限领域产生了令人印象深刻的科学发现,但它们并不能撰写论文。

该团队认为,AI Scientist 撰写科学论文来传播其发现至关重要,原因如下:首先,撰写论文为人类提供了一种高度可解释的方法,使人类能够从所学知识中受益;其次,在现有的机器学习会议框架内审查书面论文使科学家能够标准化评估;第三,自现代科学诞生以来,科学论文一直是传播研究成果的主要媒介。

由于论文可以使用自然语言,并包含情节和代码,因此它可以灵活地描述任何类型的科学研究和发现。几乎任何其他可以想到的格式都被锁定在某种数据或科学类型中。在出现更优的替代方案(或可能由人工智能发明)之前,该团队相信训练 AI Scientist 撰写科学论文对于其融入更广泛的科学界至关重要。

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

图示:由 AI Scientist 完全自主生成的《Adaptive Dual-Scale Denoising》论文预览。(来源:论文)

关于成本

这里的框架非常灵活,可以有效地开展机器学习各个子领域的研究,包括基于 transformer 的语言建模、神经网络学习动态和扩散建模。该系统的成本效益很高,每篇论文的成本约为 15 美元,可生成与会议类相关的论文,凸显了其使研究民主化(提高其可及性)和加速科学进步的能力。

例如,研究人员对 AI Scientist 的初步定性分析表明,生成的论文可以提供广泛的信息和新颖性,或者至少包含值得未来研究的想法。

按照当下的标准,该团队为 AI Scientist 进行实验分配的实际计算量也非常小。值得注意的是,研究人员在一周内生成数百篇论文的实验大部分仅使用单个 8×NVIDIA H100 节点运行。如果大规模扩大搜索和过滤范围,可能会产生质量更高的论文。

在这个项目中,运行 AI Scientist 的大部分成本与 LLM API 编码和论文写作的成本相关。相比之下,由于该团队为降低总体成本而施加的限制,运行 LLM 审阅器相关的成本以及进行实验的计算费用可以忽略不计。

当然,如果 AI Scientist 被应用到其他科学领域或用于更大规模的计算实验,这种成本分摊在未来可能会发生变化。

开放与封闭模型

为了定量评估和优化生成的论文,研究人员首先创建并验证了自动论文审阅器。结果表明,虽然还有很大的优化空间,但 LLM 能够产生相当准确的评论,并在各个指标上取得与人类相当的结果。

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

图示:Violin 图显示了 AI Scientist 审阅者在三个领域和四个基础模型中为人工智能生成的论文的评分分布。(来源:论文)

将这个审阅器应用于 AI Scientist 生成的论文,使科学家能够将论文评估范围扩大到人工检查之外。研究人员发现 Sonnet 3.5 始终能生成最好的论文,其中一些论文的分数甚至超过了自动论文审阅器在标准机器学习会议上的接受门槛。

但是,该团队没有理由期望 AI Scientist 像 Sonnet 3.5 这样的单一模型能够保持领先地位。研究人员认为所有前沿 LLM(包括开放模型)都将继续优化改进。LLM 之间的竞争会使它们的商品化和能力都大幅增强。

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

图示:使用 GPT-4o 对 ICLR 2022 OpenReview 数据上的 AI Scientist 的论文审查流程进行评估。(来源:论文)

在这个项目中,研究人员研究了各种专有的 LLM,包括 GPT-4o 和 Sonnet,但也探索了使用 DeepSeek 和 Llama-3 等开放模型。发现开放模型具有显著的优势,例如成本更低、可用性有保证、透明度更高、灵活性更高,尽管质量略差。

未来,研究人员的目标是利用所提出的发现过程,在使用开放模型的闭环系统中产生自我改进的人工智能。

未来方向

对 AI Scientist 的直接改进可能包括集成视觉功能以更好地处理图表和图形,结合人类反馈和交互来改进人工智能的输出,并使 AI Scientist 能够通过从互联网上提取新数据和模型来自动扩大其实验范围,前提是这样做是安全的。

此外,AI Scientist 可以跟进其最佳想法,甚至可以以自参考的方式直接对自己的代码进行研究。事实上,该项目的大部分代码都是由 Aider 编写的。将框架扩展到其他科学领域可以进一步扩大其影响力,为自动化科学发现的新时代铺平道路。

至关重要的是,未来的工作应该解决可靠性和幻觉问题,可能通过对报告的结果进行更深入的自动验证来实现。这可以通过直接链接代码和实验来实现,或者通过查看自动验证器是否可以独立重现结果来实现。

结语

AI Scientist 标志着机器学习科学发现新时代的开始:将 AI 智能体的变革性优势带入 AI 本身的整个研究过程,并让科学家更接近一个可以释放无限且经济实惠的创造力和创新,来解决世界上最具挑战性的问题的世界。

最终,「我们设想一个完全由人工智能驱动的科学生态系统,不仅包括人工智能驱动的研究人员,还包括审稿人、领域主席和整个会议。然而,我们并不认为人类科学家的作用会减弱。随着我们适应新技术并向食物链上游移动,科学家的作用将发生变化。」研究人员在论文里表示。

虽然 AI Scientist 的当前迭代展示了在成熟理念(如扩散建模或 Transformers)之上进行创新的强大能力,但此类系统最终是否能够提出真正颠覆范式的理念仍是一个悬而未决的问题。

未来版本的 AI Scientist 是否能够提出像扩散建模一样具有影响力的想法,或者提出下一个 Transformer 架构?机器最终是否能够发明像人工神经网络或信息理论一样基本的概念?

「我们相信 AI Scientist 将成为人类科学家的绝佳伙伴,但只有时间才能告诉我们。」

GitHub 开源地址:http://github.com/SakanaAI/AI-Scientist

论文链接:https://arxiv.org/abs/2408.06292

参考内容:

http://sakana.ai/ai-scientist/

https://x.com/SakanaAILabs/status/1823178623513239992 

https://mp.weixin.qq.com/s/-jjXBJAkdMEyl2JhRgwdaA


到这里,我们也就讲完了《首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于人工智能,理论的知识点!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
Answer开源项目常见问题解答:支持LDAP和Webhook吗?Answer开源项目常见问题解答:支持LDAP和Webhook吗?
上一篇
Answer开源项目常见问题解答:支持LDAP和Webhook吗?
无线手柄连电脑?
下一篇
无线手柄连电脑?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    28次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    42次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    39次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    51次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    42次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码