当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

来源:51CTO.COM 2024-05-07 14:18:42 0浏览 收藏

从现在开始,努力学习吧!本文《挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队》主要讲解了等等相关知识点,我会在golang学习网中持续更新相关的系列文章,欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧,希望能帮到你!

不需要OpenAI,微软或许也会成为AI领头羊!

外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

这恰好是,纳德拉带领团队证明自己的时候到了。

在向OpenAI投资100多亿美元之后,微软才获得了GPT-3.5/GPT-4先进模型的使用权,但终究不是长久之计。

甚至,此前有传言称,微软已经沦落为OpenAI的一个IT部门。

在过去的一年,每个人熟知的,微软在LLM方面的研究,主要集中在小体量phi的更新,比如Phi-3的开源。

而在大模型的专攻上,除了图灵系列,微软内部还未透露半点风声。

就在今天,微软首席技术官Kevin Scott证实,MAI大模型确实正在开发中。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

显然,微软秘密筹备大模型的计划,是为了能够开发出一款全新LLM,能够与OpenAI、谷歌、Anthropic顶尖模型竞争。

毕竟,纳德拉曾说过,「如果OpenAI明天消失了,也无关紧要」。

「我们有的是人才、有的是算力、有的是数据,我们什么都不缺。我们在他们之下,在他们之上,在他们周围」。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

看来,微软的底气,就是自己。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

自研5000亿MAI-1大模型

据介绍,MAI-1大模型由前谷歌DeepMind负责人Mustafa Suleyman,负责监督。

值得一提的是,Suleyman在加入微软之前,还是AI初创Inflection AI创始人兼CEO。

创办于2022年,一年的时间,他带领团队推出了大模型Inflection(目前已更新到了2.5版本),以及日活破百万的高情商AI助手Pi。

不过因为无法找到正确的商业模式,Suleyman和另一位联创,以及大部分员工,在3月份共同加入微软。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

也就是说,Suleyman和团队负责这个新项目MAI-1,会为此带来更多的前沿大模型的经验。

还是要提一句,MAI-1模型是微软自研发的,并非从Inflection模型继承而来。

据两位微软员工称,「MAI-1与Inflection之前发布的模型不同」。不过,训练过程可能会用到其训练数据和技术。

拥有5000亿参数,MAI-1的参数规模将远远超出,微软以往训练的任何小规模开源模型。

这也意味着,它将需要更多的算力、数据,训练成本也是高昂的。

为了训练这款新模型,微软已经预留了一大批配备英伟达GPU的服务器,并一直在编制训练数据以优化模型。

其中,包括来自GPT-4生成的文本,以及外部来源(互联网公共数据)的各种数据集。

大小模型,我都要

相比之下,GPT-4曾被曝出有1.8万亿参数,Meta、Mistral等AI公司发布较小开源模型,则有700亿参数。

当然,微软采取的是多管齐下的策略,即大小模型一起研发。

其中,最经典的便是Phi-3了——一个能够塞进手机的小模型,而且最小尺寸3.8B性能碾压GPT-3.5。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

Phi-3 mini在量化到4bit的情况下,仅占用大约1.8GB的内存,用iPhone14每秒可生成12个token。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

在网友抛出「应该用更低成本训练AI,不是更好吗」的问题后,Kevin Scott回复到:

这并不是一个非此即彼的关系。在许多AI应用中,我们结合使用大型前沿模型和更小、更有针对性的模型。我们做了大量工作,确保SLM在设备上和云中都能很好地运作。我们在训练SLM方面积累了大量经验,甚至还将其中一些工作开源,供他人研究和使用。我认为,在可预见的未来,这种大与小的结合还将继续下去。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

这表明,微软既要开发成本低廉、可集成到应用中,并能在移动设备上运行的SLM,也要开发更大、更先进的AI模型。

目前,微软自称是一家「Copilot公司」。得到AI加持的Copilot聊天机器人,可以完成撰写电子邮件、快速总结文件等任务。

而未来,下一步的机会在哪?

大小模型兼顾,正体现了充满创新活力的微软,更愿意探索AI的新路径。

不给OpenAI当「IT」了?

话又说回来,自研MAI-1,并不意味着微软将会抛弃OpenAI。

首席技术官Kevin Scott在今早的帖子中首先,肯定了微软与OpenAI合作五年的坚固「友谊」。

我们一直在为合作伙伴OpenAI建造大型超算,来训练前沿的AI模型。然后,两家都会将模型,应用到自家的产品和服务中,让更多的人受益。

而且,每一代新的超算都将比上一代,更加强大,因此OpenAI训出的每个前沿模型,都要比上一个更加先进。

我们将继续沿着这条路走下去——不断构建更强大的超算,让OpenAI能够训练出引领整个行业的模型。我们的合作将会产生越来越大的影响力。

前段时间,外媒曝出了,微软和OpenAI联手打造AI超算「星际之门」,将斥资高达1150亿美元。

据称,最快将在2028年推出超算,并在2030年之前进一步扩展。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

包括此前,微软工程师向创业者Kyle Corbitt爆料称,微软正在紧锣密鼓地建设10万个H100,以供OpenAI训练GPT-6。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

种种迹象表明,微软与OpenAI之间合作,只会更加牢固。

此外,Scott还表示,「除了与OpenAI的合作,微软多年来一直都在让MSR和各产品团队开发AI模型」。

AI模型几乎深入到了,微软的所有产品、服务和运营过程中。团队们有时也需要进行定制化工作,不论是从零开始训模型,还是对现有模型进行微调。

未来,还会有更多类似的这样的情况。

这些模型中,一些被命名为Turing、MAI等,还有的命名为Phi,我们并将其开源。

虽然我的表达可能没有那么引人注目,但这是现实。对于我们这些极客来说,鉴于这一切在实践中的复杂性,这是一个非常令人兴奋的现实。

解密「图灵」模型

除了MAI、Phi系列模型,代号「Turing」是微软在2017年在内部开启的计划,旨在打造一款大模型,并应用到所有产品线中。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

经过3年研发,他们在2020年首次发布170亿参数的T-NLG模型,创当时有史以来最大参数规模的LLM记录。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

到了2021年,微软联手英伟达发布了5300亿参数的Megatron-Turing(MT-NLP),在一系列广泛的自然语言任务中表现出了「无与伦比」的准确性。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

同年,视觉语言模型Turing Bletchley首次面世。

去年8月,该多模态模型已经迭代到了V3版本,而且已经整合进Bing等相关产品中,以提供更出色的图像搜索体验。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

此外,微软还在2021年和2022年发布了「图灵通用语言表示模型」——T-ULRv5和T-ULRv6两个版本。

目前,「图灵」模型已经用在了,Word中的智能查询(SmartFind),Xbox中的问题匹配(Question Matching)上。

还有团队研发的图像超分辨率模型Turing Image Super-Resolution(T-ISR),已在必应地图中得到应用,可以为全球用户提高航空图像的质量。

挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

目前,MAI-1新模型具体会在哪得到应用,还未确定,将取决于其性能表现。

顺便提一句,关于MAI-1更多的信息,可能会在5月21日-23日微软Build开发者大会上首次展示。

接下来,就是坐等MAI-1发布了。

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一
上一篇
全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一
用于时间序列概率预测的分位数回归
下一篇
用于时间序列概率预测的分位数回归
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    18次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    29次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    27次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    30次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    32次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码