当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 盘古大模型5.5发布,华为AI全面升级

盘古大模型5.5发布,华为AI全面升级

2025-06-26 20:50:59 0浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《盘古大模型5.5发布,华为AI再升级》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

盘古大模型5.5是华为在HDC 2025开发者大会上推出的新一代人工智能大模型,主打“不作诗,只做事”的理念,专注于解决实际产业问题,助力千行百业智能化升级。该模型涵盖五大基础模型,分别面向自然语言处理(NLP)、多模态、预测、科学计算和计算机视觉(CV)领域。

盘古Ultra MoE是一个拥有7180亿参数的深度思考模型,基于昇腾全栈软硬件协同打造,具备高效长序列处理、低幻觉、深度研究等核心能力。盘古Pro MoE则是72B A16B的模型,在智能体任务上表现优异,可与6710亿参数的DeepSeek-R1相媲美。盘古大模型5.5引入了自适应快慢思考合一技术,提升推理效率,并通过多模态世界模型支持智能驾驶和具身智能机器人训练。

盘古大模型 5.5— 华为推出的新一代AI大模型盘古大模型5.5的主要功能

  • 自然语言处理(NLP)
    • 高效长序列处理:采用Adaptive SWA和ESA技术,轻松应对100万token长度的上下文。
    • 低幻觉:通过知识边界判定和结构化思考验证等创新方案,提高模型推理准确度。
    • 快慢思考融合:自适应快慢思考合一技术可根据问题难易自动切换模式,简单问题快速回复,复杂问题深度分析,推理效率提升8倍。
    • 深度研究能力:盘古DeepDiver借助长链难题合成和渐进式奖励机制,在网页搜索、常识性问答等方面表现出色,可在5分钟内完成超过10跳的复杂问答,并生成万字以上专业调研报告。
  • 多模态
    • 世界模型:为智能驾驶、具身智能机器人训练构建数字物理空间,实现持续优化迭代。例如在智能驾驶领域,可生成大量训练数据,无需依赖高成本路采。
  • 预测
    • triplet transformer架构:将不同行业的数据进行统一的三元组编码和预训练,提升预测精度和跨行业、跨场景的泛化性。
  • 科学计算
    • AI集合预报:如深圳气象局基于盘古大模型升级的“智霁”大模型,首次实现AI集合预报,更直观反映天气系统演变可能性。
  • 计算机视觉(CV)
    • 300亿参数视觉大模型:支持多维度泛视觉感知、分析和决策,构建工业场景稀缺的泛视觉故障样本库,提升业务识别种类与精度。

盘古大模型5.5的模型介绍

  • 盘古 Ultra MoE
    • 超大规模与稀疏激活:拥有7180亿参数,采用256个路由专家,每个token激活8个专家,激活量为39亿,具有超大规模和高稀疏比特性。
    • 先进架构设计:引入MLA注意力机制,压缩KV Cache空间,缓解内存带宽瓶颈;采用MTP多头扩展,实现多Token投机推理,加速推理过程。
    • 稳定训练技术:提出DSSN稳定架构和TinyInit小初始化方法,解决超大规模MoE模型训练稳定性问题,实现超过18TB数据的长期稳定训练。
    • 高效负载优化:采用EP group loss负载优化方法,确保专家间负载均衡,提升专家领域特化能力。
    • 训练策略优化:使用Dropless训练策略,避免Drop&Pad训推不一致问题,提升数据效率。结合GRPO算法优化训练,增强推理性能。
  • 盘古 Pro MoE
    • 分组混合专家架构:提出MoGE模型,在专家选择阶段对专家分组并约束token在每组内激活等量专家,实现负载均衡,显著提升昇腾平台部署效率。
    • 高效推理性能:在昇腾300I Duo平台上,单卡吞吐量可达201 tokens/s,通过MTP解码和多token优化可提升至321 tokens/s。在昇腾800I A2平台上,低并发响应毫秒级,高并发条件下单卡吞吐量达1148 tokens/s,优化后可达1528 tokens/s。
    • 卓越推理能力:在跨语言多领域基准测试中表现出色,涵盖英语通用推理、阅读理解、常识推理、逻辑推理中的代码生成和中英双语数学问题,以及中文知识问答和阅读理解等。
    • 硬件亲和优化:针对昇腾300I Duo和800I A2平台系统优化,深度融合昇腾硬件加速架构的并行计算特性与算子级编译优化技术,实现从算法设计到系统落地的全栈创新。
  • 盘古 Embedding
    • 快慢思考融合:采用双系统认知架构,集成“快思考”与“慢思考”双推理模式。通过两阶段训练框架,第一阶段通过迭代蒸馏和MARS构建基础推理器;第二阶段赋予模型快慢思考能力,根据任务难度自动切换模式,平衡推理效率与深度。
    • 高效训练策略:提出Model-aware Iterative Distillation的SFT方案,动态选择匹配当前模型能力的数据样本训练,并保留早期知识,持续提升性能。
    • 行业垂域能力拓展:引入特定领域长思考数据继续训练,显著提升专业任务能力。如法律领域经训练后,在LawBench基准测试中平均准确率达54.59%。
    • 自适应模式切换:根据任务复杂程度自动调整推理深度,简单问题快速输出答案,复杂问题深入分析,确保准确性。
  • 盘古 DeepDiver
    • 复杂任务处理:适用于科学助手、个性化教育及复杂行业报告调研,能完成超过10跳的复杂问答,并生成万字以上专业调研报告。
    • 高效信息获取:构建大量合成交互数据,采用渐进式奖励策略强化学习训练,在开放域信息获取中表现出色,5分钟内完成复杂任务,生成高质量报告。
    • 高阶能力增强:显著提升自主规划、探索、反思等高阶能力,复杂任务处理更出色。
  • 盘古预测大模型:采用triplet transformer统一预训练架构,对不同行业数据进行三元组编码,在同一框架内高效处理和预训练,提升精度与泛化性。
  • 盘古科学计算大模型:华为云持续拓展其与更多科学应用领域的结合。如深圳气象局升级“智霁”大模型,实现AI集合预报,减少误差。
  • 盘古计算机视觉CV大模型:发布全新MoE架构的300亿参数视觉大模型,全面支持图像、红外、激光点云、光谱、雷达等多维泛视觉感知、分析与决策。通过跨维度生成模型,构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,提升识别种类与精度。
  • 盘古多模态大模型:发布基于世界模型的多模态大模型,可用于智能驾驶、具身智能机器人训练,构建所需数字物理空间,实现持续优化迭代。

盘古大模型5.5的项目地址

盘古大模型5.5的应用场景

  • 智能驾驶:盘古多模态大模型可为智能驾驶生成大量训练数据,无需依赖高成本的路采。
  • 具身智能机器人:盘古世界模型可为具身智能机器人的训练构建所需数字物理空间,实现持续优化迭代。
  • 气象预报:深圳气象局基于盘古科学计算大模型升级的“智霁”大模型,实现AI集合预报,更直观反映天气系统演变可能性,减少误差。
  • 工业场景:盘古CV大模型通过跨维度生成模型,构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,极大提升业务识别种类与精度。

本篇关于《盘古大模型5.5发布,华为AI全面升级》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

JS实现波浪动画的3种数学方法JS实现波浪动画的3种数学方法
上一篇
JS实现波浪动画的3种数学方法
PyCharm写代码到运行全流程教程
下一篇
PyCharm写代码到运行全流程教程
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 茅茅虫AIGC检测:精准识别AI生成内容,保障学术诚信
    茅茅虫AIGC检测
    茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
    127次使用
  • 赛林匹克平台:科技赛事聚合,赋能AI、算力、量子计算创新
    赛林匹克平台(Challympics)
    探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
    147次使用
  • SEO  笔格AIPPT:AI智能PPT制作,免费生成,高效演示
    笔格AIPPT
    SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
    145次使用
  • 稿定PPT:在线AI演示设计,高效PPT制作工具
    稿定PPT
    告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
    133次使用
  • Suno苏诺中文版:AI音乐创作平台,人人都是音乐家
    Suno苏诺中文版
    探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
    148次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码