可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT
“纵有疾风来,人生不言弃”,这句话送给正在学习科技周边的朋友们,也希望在阅读本文《可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT》后,能够真的帮助到大家。我也会在后续的文章中,陆续更新科技周边相关的技术文章,有好的建议欢迎大家在评论留言,非常感谢!
编辑 | 萝卜皮
在过去的几个世纪中,研究人员一直在寻找将不同领域知识联系起来的方法。随着人工智能的出现,我们现在有机会去探索跨领域(例如力学和生物学)或不同领域(例如失效力学和艺术)之间的关系
为了达到这个目标,麻省理工学院(MIT)原子与分子力学实验室(Laboratory for Atomistic and Molecular Mechanics,LAMM)的研究人员利用经过微调的大型语言模型(LLM)来获得多尺度材料失效的相关知识子集
这种方法的步骤是先使用通用的LLM从原始来源中提取问答对,然后对LLM进行微调。利用这个微调后的MechGPT LLM基础模型进行一系列计算实验,以探索其在知识检索、各种语言任务、假设生成以及跨不同领域连接知识方面的能力
尽管该模型具有一定的能力来回忆训练中的知识,但研究人员发现 LLM 对于通过本体知识图提取结构见解更加有意义。这些可解释的图形结构提供了解释性见解、新研究问题的框架以及知识的视觉表示,这些知识也可用于检索增强生成。
该研究以「MechGPT, a Language-Based Strategy for Mechanics and Materials Modeling That Connects Knowledge Across Scales, Disciplines and Modalities」为题,于 2023 年 10 月 19 日发布在《Applied Mechanics Reviews》。
对物理、生物和形而上学概念进行建模一直是许多学科研究人员关注的焦点。早期的科学家和工程师往往深深扎根于从科学到哲学、物理到数学以及艺术的多个领域(例如伽利略·伽利莱、列奥纳多·达·芬奇、约翰·沃尔夫冈·冯·歌德),但是随着科学的发展,专业化在如今已经占据主导地位。部分原因是跨领域积累了大量知识,这需要人类花大量的精力去研究实践。
现如今,大型语言模型(LLM)的出现对科学研究的范式提出了挑战。它不仅带来了基于人工智能/机器学习的新建模策略,还为跨领域连接知识、想法和概念提供了机会。这些模型可以补充传统的多尺度建模,用于分析和设计分层材料以及力学中的许多其他应用
图:工作流程示意图。(来源:论文)
在这里,LAMM 的研究人员以最近提出的 LLM 在力学和材料研究和开发中的用途为基础,并且基于 Llama-2 based OpenOrca-Platypus2-13B 的通用 LLM,开发了一个经过微调的 MechGPT 模型,该模型专注于模型材料失效、多尺度建模以及相关学科。
选择 OpenOrca-Platypus2-13B 模型的原因是因为它在推理、逻辑、数学/科学和其他学科等关键任务上表现出色,能够以适中的模型大小提供丰富的、可应用于多学科的知识和通用概念,并且具备高效的计算能力
LLM 在科学领域有着强大的应用。除了能够分析大量数据和复杂系统之外,在力学和材料科学领域,LLM 用于模拟和预测材料在不同条件下的行为,例如机械应力、温度和化学相互作用等。正如早期工作所示,通过在分子动力学模拟的大型数据集上训练 LLM,研究人员可以开发能够预测新情况下材料行为的模型,从而加速发现过程并减少实验测试的需要。
此类模型对于分析书籍和出版物等科学文本也非常有效,使研究人员能够从大量数据中快速提取关键信息和见解。这可以帮助科学家识别趋势、模式以及不同概念和想法之间的关系,并为进一步研究产生新的假设和想法。
请查看下图,这是用于构建MechGPT的自回归解码器transformer架构概述。 (来源:论文)
在这里,该团队将重点放在后者的开发上,并探索 MechGPT 的使用,这是基于 Transformer 的 LLM 系列中的一种生成人工智能工具,专门针对材料失效和相关的多尺度方法进行了训练,从而评估这些策略的潜力。
该研究提出的策略包括几个步骤。首先是蒸馏步骤,研究人员使用LLM从原始数据块中提取的文本(例如一个或多个PDF文件)生成问答对。接下来,在第二步中利用这些数据来微调模型。这项研究还专门训练了初始的MechGPT模型,在材料失效的原子建模领域展示了其在知识检索、通用语言任务和假设生成等方面的有用性
图:所使用的建模策略概述。(来源:论文)
这篇论文介绍了一个总体的建模策略,研究人员采用特定的语言建模策略来生成数据集,以从源中提取知识,并利用新颖的力学和材料数据集对模型进行训练。研究人员对MechGPT的三个版本进行了分析和讨论,这些版本的参数大小从130亿到700亿不等,上下文长度超过10,000个token
在对模型、提示以及训练方式进行一些一般性评论之后,研究人员应用该模型并在各种设置中测试其性能,包括使用 LLM 进行本体图生成和开发有关跨学科复杂主题的见解,以及代理建模,其中多个 LLM 以协作或对抗的方式交互,以产生对主题领域或问题回答的更深入的见解。
图:开发本体知识图表示,以在超音速断裂和蛋白质展开机制的背景下关联超弹性。(来源:论文)
同时,该团队进一步提供了不同抽象级别的语言模型和多粒子系统之间的概念比较,并解释了如何将新框架视为提取管理复杂系统的普遍关系的手段。
重写内容:上图展示了LLM和多粒子模拟之间的概念类比。(图源:论文)
总体而言,该研究提出的工作有助于开发更强大、更通用的人工智能模型,这些模型可以帮助推进科学研究并解决特定应用领域的复杂问题,从而可以深入评估模型的性能。与所有模型一样,它们必须经过仔细验证,它们的有用性存在于所提出的问题的背景、其优点和缺点以及帮助科学家推进科学和工程的更广泛的工具中。
而且,人工智能工具作为科学探究的工具,必须被视为理解、建模和设计我们周围世界的工具集合。随着人工智能工具的快速发展,它们在科学背景下的应用才刚刚开始带来新的机遇
论文链接:https://arxiv.org/ftp/arxiv/papers/2310/2310.10445.pdf
相关报道:https://twitter.com/llama_index/status/1723379654550245719
理论要掌握,实操不能落!以上关于《可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

- 上一篇
- 英雄联盟游戏皮肤(英雄联盟游戏皮肤盒子)

- 下一篇
- 荣耀畅玩50Plus设置静音方法介绍?荣耀畅玩50Plus怎么设置静音
-
- 科技周边 · 人工智能 | 11小时前 |
- 搭建DeepSeek应用,腾讯云HAI+ChatBoxAI
- 438浏览 收藏
-
- 科技周边 · 人工智能 | 13小时前 |
- 智己L6全系800V平台发布起售20.49万
- 325浏览 收藏
-
- 科技周边 · 人工智能 | 14小时前 |
- Qwen2.5-Omni-3B:阿里Qwen团队的轻量级多模态AI新作
- 304浏览 收藏
-
- 科技周边 · 人工智能 | 14小时前 |
- 3步入门通灵义码基础使用教程
- 245浏览 收藏
-
- 科技周边 · 人工智能 | 14小时前 |
- HuggingFace推出免费云端AI工具—OpenComputerAgent
- 444浏览 收藏
-
- 科技周边 · 人工智能 | 15小时前 |
- 即梦ai导出4K视频攻略超清分辨率设置教程
- 173浏览 收藏
-
- 科技周边 · 人工智能 | 15小时前 |
- 新手必看:快速掌握通灵义码使用技巧
- 231浏览 收藏
-
- 科技周边 · 人工智能 | 16小时前 |
- 豆包AI创意库,朋友圈神图评论互动率飙升
- 124浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 魔匠AI
- SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
- 9次使用
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 25次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 25次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 34次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 35次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览