当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

来源:51CTO.COM 2023-04-29 06:21:41 0浏览 收藏

一分耕耘,一分收获!既然都打开这篇《AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下》,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新科技周边相关的内容,希望对大家都有所帮助!

AI搜索引擎再度进化?!

给这个AI一个主题,分分钟给你甩出一篇论文综述,而且还会自己提供论文引文。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

又或者输入一个科学类的名词,AI也能迅速生成这个名词专属的维基百科。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

这个AI名叫Galactica (简称:GAL),是最新开源的一个科学语言大模型,把AI转化为科学生产力。

并且还实现了学科“大一统”,数学、物理、计算机…这个AI都能用。

模型刚一放出,就迅速引发网友热议,目前相关推文已有近15万浏览,累计点赞、转发、引用也已破五千。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

Facebook前技术官也出来为它来站台。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

还有网友亲自体验了一把,写出来的文献综述“看起来相当不错”,甚至直呼:

下一步它是不是就能产生新想法了。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

其实写文献综述和生产维基百科还只是GAL功能的一部分,除去这些,它还能回答一些专业问题、编写科学代码、注释分子和蛋白质……

具体效果如何,一起来看看吧~

可以作为科学生产的工具

提到科学生产力,就肯定离不开论文的查找,这不,GAL帮你解决了。

它涵盖了五种科学学科:机器学习、数学、计算机科学、生物以及物理。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

选择好学科,然后在左边框输入想要找的论文主题,右边GAL便会推荐最合适的论文以供阅读。

除了推荐论文之外,GAL还有一个更加实用的功能:生成讲稿。

比如说要做个关于密度泛函理论(DFT)的pre,又懒得写讲稿,直接GAL一下,分分钟搞定(手动狗头)。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

GAL还能够用来注释分子和蛋白质,如下就是GAL生成的RDKit(可生成用于机器学习的分子描述符)操作手册。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

在一些细节问题上,GAL也狠狠拿捏了!

就比如说你看不懂一些复杂的数学公式和代码,没关系交给GAL来解决,它能直接给你翻译成大白话。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

不仅如此,它还能实现数学公式和代码之间的相互转换,或者不同类型代码之间的转换。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

更重要的是,他还有简化公式和查错功能。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

怎么做到的?

GAL能实现这么复杂的功能,就不得不提到它的训练数据集。

据官方消息,GAL是在一个名为NatureBook的新型高质量科学数据集上进行训练的,这使模型能够使用科学术语、数学和化学公式以及源代码。

其中包括超过4800万篇论文、教科书和课堂讲稿,还有数百万计的化合物和蛋白质、科学网站以及百科全书等等。

除此之外,为了查找论文并规范化引用,GAL的数据集中包含超过3.6亿条上下文引用和超过5000万条跨不同来源规范化的独特参考。

有了这么庞大的数据集之后,那接下来便面临两个问题。

第一个问题是如何管理这些高质量的数据集,实现这点,GAL用了两步:

所有数据都以一种通用的标记格式进行处理,打通各种来源数据之间的壁垒。

预训练中包含用于特定任务的数据集,这就能保证在处理特定任务时能够更加专业。

还有一个问题是:如何设计界面交互?

首先就像上文提到的那样,GAL能够支持不同类型的任务。

因此在设计界面交互时便对各种任务进行分类,不同的分类会支持不同的类型的数据。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

既然GAL拥有高度管理和高质量的科学数据集,那和其他模型相比效果如何?

直接上数据!

推理方面,GAL的优势脱颖而出,在数学MMLU(大规模多任务语言理解)上,表现要优于Chinchilla,数学方面,表现也优于PalM 540B和GPT-3 175B。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

尽管,GAL并没有经过一般数据集的训练,但它在BIG-bench上的表现仍旧优于BLOOM和OPT-175B。

AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下

看完之后是不是也心痒痒了,先码住再说!

传送门:https://galactica.org/

参考链接:[1]https://twitter.com/paperswithcode/status/1592546933679476736[2]https://github.com/paperswithcode/galai[3]https://galactica.org/static/paper.pdf

文中关于AI,模型,科学语言的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《AI科学语言大模型火了,数学生物计算机样样行,编代码写综述也不在话下》文章吧,也可关注golang学习网公众号了解相关技术文章。

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
适用于 Windows 11 的录音机刚刚进行了改进适用于 Windows 11 的录音机刚刚进行了改进
上一篇
适用于 Windows 11 的录音机刚刚进行了改进
iOS 15.3.1 正式发布修正点字显示器问题
下一篇
iOS 15.3.1 正式发布修正点字显示器问题
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 茅茅虫AIGC检测:精准识别AI生成内容,保障学术诚信
    茅茅虫AIGC检测
    茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
    141次使用
  • 赛林匹克平台:科技赛事聚合,赋能AI、算力、量子计算创新
    赛林匹克平台(Challympics)
    探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
    167次使用
  • SEO  笔格AIPPT:AI智能PPT制作,免费生成,高效演示
    笔格AIPPT
    SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
    157次使用
  • 稿定PPT:在线AI演示设计,高效PPT制作工具
    稿定PPT
    告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
    141次使用
  • Suno苏诺中文版:AI音乐创作平台,人人都是音乐家
    Suno苏诺中文版
    探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
    165次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码