当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

来源:机器之心 2024-07-24 17:15:27 0浏览 收藏
推广推荐
免费电影APP ➜
支持 PC / 移动端,安全直达

在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是科技周边学习者,那么本文《最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代》就很适合你!本篇内容主要包括##content_title##,希望对大家的知识积累有所帮助,助力实战开发!

刚刚,大家期待已久的 Llama 3.1 官方正式发布了!

Meta 官方发出了「开源引领新时代」的声音。
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
在官方博客中,Meta 表示:「直到今天,开源大语言模型在功能和性能方面大多落后于封闭模型。现在,我们正在迎来一个开源引领的新时代。我们公开发布 Meta Llama 3.1 405B,我们认为这是世界上最大、功能最强大的开源基础模型。迄今为止,所有 Llama 版本的总下载量已超过 3 亿次,我们才刚刚开始。」

Meta 创始人、CEO 扎克伯格也亲自写了篇长文《Open Source AI Is the Path Forward》,阐述为什么开源对所有开发者、对 Meta、对世界都是好事。
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
此次发布的要点包括:

  • 最新的系列模型将上下文长度扩展到了 128K、增加了对八种语言的支持,并包括顶级开源模型 Llama 3.1 405B;
  • Llama 3.1 405B 独树一帜,Meta 官方称其可与最好的闭源模型相媲美;
  • 此次发布还提供了更多与模型配合使用的组件(包括参考系统)来将 Llama 打造为一个系统;
  • 用户通过 WhatsApp 和 meta.ai 就可以体验 Llama 3.1 405B 了。
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
地址:https://llama.meta.com/

各位网友可以下载尝鲜了。

Llama 3.1 介绍

Llama 3.1 405B 是首个公开可用的模型,在常识、可操纵性、数学、工具使用和多语言翻译等方面可与顶级 AI 模型相媲美。

Meta 表示最新一代的 Llama 将激发新的应用程序和建模范式,包括利用合成数据生成来提升和训练更小的模型,以及模型蒸馏 —— 这是一种在开源领域从未达到的能力。

与此同时,Meta 还推出了 8B 和 70B 模型的升级版本,支持多种语言,上下文长度达到 128K,推理能力也更强。最新模型支持高级用例,例如长篇文本摘要、多语言对话智能体和编码助手。

举例来说,Llama 3.1 可以将故事翻译成西班牙语:

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

当用户提问「有 3 件衬衫、5 条短裤和 1 条连衣裙,假如要旅行 10 天。准备的衣服够不够?」模型能够快速的进行推理。

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

长上下文:对于上传的文档,Llama 3.1 能够分析和总结最多 8k token 的大型文档。

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

编码助手,对于用户要求,可以快速编写代码:

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

此外,Llama 3.1 405B 的开发者还发推文「剧透」,表示开发 GPT-4o 一样集成语音和视觉能力的模型还在开发中。
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
Meta 还对开源协议进行了更改,允许开发人员使用 Llama 模型(包括 405B)的输出来改进其他模型。此外,为了兑现开源承诺,从今天开始,Meta 将这些模型提供给社区,用户可以在 llama.meta.com 和 Hugging Face 上下载。

下载地址:

  • https://huggingface.co/meta-llama
  • https://llama.meta.com/

模型评估

Meta 在超过 150 个基准数据集上进行了评估,此外,他们还进行了广泛的人类评估。

实验结果表明,旗舰模型 Llama 3.1 405B 在一系列任务中与领先的基础模型包括 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 具有竞争力。此外,8B 和 70B 小型模型与具有相似数量参数的闭源和开源模型具有竞争力。
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
模型架构

作为 Meta 迄今为止最大的模型,使用超过 15 万亿个 token 训练 Llama 3.1 405B 是一项重大挑战。为了实现这种规模的训练,Meta 优化了整个训练堆栈,并在超过 16,000 个 H100 GPU 上训练,使该模型成为第一个在此规模上训练的 Llama 模型。
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
为了解决这个问题,Meta 在设计上做出了以下一些选择,重点保持模型开发过程的可扩展性和简单性。

  • 选择了仅进行少量调整的标准解码器 Transformer 模型架构,而不是混合专家模型,以最大限度地提高训练稳定性。
  • 采用迭代后训练程序,每轮都使用监督微调和直接偏好优化。这使 Meta 能够为每轮创建最高质量的合成数据,并提高每项功能的性能。

与之前版本的 Llama 相比,Meta 提高了用于预训练和后训练的数据数量和质量,如为预训练数据开发更仔细的预处理和管理管道,为后训练数据开发更严格的质量保证与过滤方法。

正如语言模型 scaling laws 所预期的那样,Meta 新旗舰模型优于使用相同程序训练的较小模型。Meta 还使用 405B 参数模型来提高较小模型的后训练质量。

为了支持 405B 模型的大规模推理产出,Meta 将模型从 16 比特 (BF16) 量化为 8 比特 (FP8) ,有效降低了所需的计算要求,并允许模型在单个服务器节点运行。

指令和聊天微调

Llama 3.1 405B 努力提高模型响应用户指令的实用性、质量和详细指令遵循能力,同时确保高水平的安全性。

在后训练阶段,研究团队通过在预训练模型的基础上进行几轮对齐来构建最终的聊天模型。每轮都涉及监督微调(SFT)、拒绝采样(RS)和直接偏好优化(DPO)。

研究团队使用合成数据生成来产生绝大多数 SFT 示例,并多次迭代以在所有功能上生成越来越高质量的合成数据。此外,研究团队还采用了多种数据处理技术,以过滤这些合成数据,达到最高质量,并可以跨功能扩展微调数据量。

Llama 系统

Llama 模型一直是作为 AI 系统的一部分而存在的,可以协调多个组件,包括调用外部工具。Meta 旨在超越基础模型,让开发人员能够灵活地设计和创建符合其愿景的定制产品。

为了在模型层之外负责任地开发人工智能,Meta 发布了一个完整的参考系统,其中包括多个示例应用程序以及新组件,例如 Llama Guard 3(一种多语言安全模型)和 Prompt Guard(一个 prompt 注入过滤器)。这些示例应用程序是开源的,可以由开源社区构建。

为了与行业、初创公司和开源社区进行更广泛的合作,帮助更好地定义组件的接口,Meta 在 GitHub 上发布了针对「Llama Stack」的评论请求。Llama Stack 是一组标准化接口,用于构建规范的工具链组件(微调、合成数据生成)和智能体应用程序。这有助于更轻松地实现互操作性。最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
与封闭模型不同,Llama 模型权重可供下载。开发人员可以根据自己的需求和应用程序完全定制模型,在新数据集上进行训练,并进行额外的微调。

使用 Llama 3.1 405B 进行开发

对于普通开发者来说,部署 405B 这样大规模的模型无疑是一项挑战,它需要大量的计算资源和专业技能。在与开发者社区的交流中,Meta 意识到,生成式 AI 的开发不仅仅是给模型输入 prompt。他们期望所有开发者都能在以下领域充分开发 Llama 3.1 405B 的潜力:

  • 实时和批量推理
  • 监督式微调
  • 测试和评估模型在特定应用中的性能
  • 持续预训练
  • 检索增强生成(RAG)
  • 函数调用
  • 合成数据生成

发布即日起,Llama 3.1 405B 模型的所有高级功能都将开放,开发者们可以即刻上手。开发者们还可以探索更高阶的工作流,例如基于模型蒸馏的合成数据生成。这次升级,Meta 还无缝集成了合作伙伴 AWS、NVIDIA 和 Databricks 提供的解决方案,以实现更高效的检索增强生成(RAG)。此外,Groq 已经为在云端部署模型进行了低延迟推理的优化,也对本地系统进行了类似的性能提升。 

Meta 这次还为 Llama 3.1 405B 内置了「工具大礼包」,内含 vLLM、TensorRT 和 PyTorch 等关键项目,从模型开发到部署「开箱即用」,一步到位。

参考链接:https://ai.meta.com/blog/meta-llama-3-1/

今天关于《最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
性能强11倍,佐治亚理工、清华团队用AI辅助发现储能新材料,登Nature子刊性能强11倍,佐治亚理工、清华团队用AI辅助发现储能新材料,登Nature子刊
上一篇
性能强11倍,佐治亚理工、清华团队用AI辅助发现储能新材料,登Nature子刊
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
下一篇
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3212次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3425次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3455次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4564次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3832次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码