当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 阶跃发布Step3基模,多模态推理领跑WAIC2025

阶跃发布Step3基模,多模态推理领跑WAIC2025

2025-08-19 12:09:28 0浏览 收藏

哈喽!大家好,很高兴又见面了,我是golang学习网的一名作者,今天由我给大家带来一篇《WAIC 2025|阶跃发布Step 3基模,多模态推理领先行业》,本文主要会讲到等等知识点,希望大家一起学习进步,也欢迎大家关注、点赞、收藏、转发! 下面就一起来看看吧!

在2025世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰今天在上海正式发布了新一代基础大模型——Step 3。

作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型。

同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。

此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。

作为一家以实现通用人工智能(AGI)为目标的基础大模型公司,阶跃星辰始终专注于基础大模型的研发,持续推进模型的技术迭代。阶跃星辰创始人、CEO姜大昕表示:

“从Step 1到Step 2两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代Step 3基础模型的出发点。”

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先


新一代基模 Step 3:推理时代最适合应用的模型

随着大模型技术迈向推理时代,阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。这四个维度缺一不可,因为单点能力强,无法满足用户对于模型的综合需求。唯有模型全面发展,才能让模型真正用起来。基于这样的研发理念,阶跃星辰打造了新一代基模Step 3,专为追求性能与成本极致均衡的企业和开发者设计:

不妥协的性能:原生多模态,性能达到开源SOTA

Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与Scale Up。Step 3采用 MoE 架构,总参数量 321B,激活参数量 38B。

Step 3拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的SOTA成绩。

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

极致成本效益:系统架构创新,推理效率行业领先

在确保性能的前提下,阶跃星辰持续推进模型成本优化。在推理时代,模型性能随思维链的增长而提升,解码效率因此成为降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

Step 3旨在通过系统性的技术创新,实现模型降本增效的目标。在架构设计阶段,Step 3便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3实现了行业领先的推理解码效率。

根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。

这些结果充分验证了 Step 3具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

目前,Step 3已授权国内多家芯片公司,并完成了芯片适配。同时,Step 3将于7月31日正式面向全球企业和开发者开源,为开源世界贡献最强的多模态推理模型。Step 3已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。(Step 3 Tech report地址:https://github.com/stepfun-ai/Step3)

“1+N” 模型矩阵:全方位满足用户需求

成立两年多以来,阶跃星辰构建起“1+N”的Step系列大模型矩阵。“1”是指Step 3基础大模型;“N”则为Step系列的多模态大模型矩阵,广泛覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。

本次WAIC期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型Step 3o Vision,第二代端到端语音大模型Step-Audio 2。目前,所有这些模型都可以在“阶跃AI”官网(stepfun.com)和 “阶跃AI” App(应用商店搜索下载)进行体验。


全产业链联合创新,让大模型真正用起来

要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新。

阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。PHP中文网

该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。其它联盟厂商的适配工作正在开展。

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

发布会还宣布了上海国有资本投资有限公司与上海阶跃星辰智能科技有限公司的深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

阶跃星辰战略性聚焦智能终端Agent的方向,重点布局汽车、手机、IoT设备等关键应用场景,目前头部客户效应显著:已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent体验;联合吉利推出AI智能座舱,成功实现行业内端到端语音大模型首次量产上车。

另一方面,阶跃星辰积极拓展垂直行业的应用,与金融财经、内容创作、零售等领域的行业头部公司深度合作,共同打造面向 C 端的场景化应用体验。PHP中文网(公众号:PHP中文网)

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

好了,本文到此结束,带大家了解了《阶跃发布Step3基模,多模态推理领跑WAIC2025》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

GitHub集成Storybook组件详解GitHub集成Storybook组件详解
上一篇
GitHub集成Storybook组件详解
WasmEdge运行Golang,WebAssembly配置教程
下一篇
WasmEdge运行Golang,WebAssembly配置教程
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    204次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    208次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    205次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    212次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    229次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码