马斯克xAI发布Grok4重大升级
2025-08-01 20:45:31
0浏览
收藏
**马斯克xAI重磅发布Grok 4:推理能力提升10倍,多模态功能强大!** xAI最新发布的人工智能大模型Grok 4,凭借其卓越的推理能力和多模态理解能力,引发广泛关注。Grok 4在SAT、GRE等高难度考试中表现接近满分,并在多个基准测试中超越顶尖模型。它不仅能理解主观概念、生成代码和可视化内容,还在语音交互方面进行了重大升级。Grok 4分为单代理和多代理两个版本,其中SuperGrok Heavy版本支持最多四个智能体同时运行,上下文窗口高达256k tokens。Grok 4在教育、科研、商业金融、创意内容制作等领域拥有广阔的应用前景,其强大的性能和合理的价格体系,预示着人工智能领域新一轮的创新浪潮。
Grok 4简介
Grok 4 是由 xAI 发布的最新人工智能大模型,其推理能力较上一代提升了 10 倍。该模型拥有出色的推理表现,在 SAT、GRE 等高难度考试中接近满分,并在多个基准测试中超越其他顶尖模型。Grok 4 支持多模态功能,可理解主观概念、生成代码和可视化内容,并在语音交互方面进行了重大升级。它分为两个版本:Grok 4 为单代理(single agent)版本,而 Grok 4 Heavy 是多代理(multi agents)版本,支持最多四个代理同时运行,上下文窗口最高可达 256k tokens。
Grok 4的核心特性
- 超强推理能力:在 SAT、GRE 等高难度考试中接近满分,展现出远超人类水平的逻辑推理能力。
- 多模态理解能力:能理解抽象概念,并具备图片搜索与分析能力。
- 信息整合与提炼:能够从社交媒体等渠道收集信息,提取关键事件并按时间线排序。
- 代码与图形生成:根据科学提示生成复杂动画,例如模拟黑洞碰撞过程。
- 语音交互优化:新增五种语音选项,对话更自然流畅,情感表达更丰富。
- 处理复杂任务:在模拟经营类任务中表现出色,具备优秀的战略规划与执行能力。
- 智能体协同运作:SuperGrok Heavy 版本支持多个智能体并行工作,提升问题解决效率。
Grok 4的性能测试结果
- 官方测试数据:
- Humanity’s Last Exam:包含 2500 个跨学科专家级问题。Grok 4 Heavy 在调用工具的情况下得分达 44.4%,优化后可提升至 50.7%。
- AIME25(数学竞赛):Grok 4 Heavy 获得满分 100%,大幅领先其他模型。
- GPQA(研究生级别问答):Grok 4 Heavy 得分 88.9%,超过 Gemini 2.5 Pro(86.4%)和 Claude 4 Opus(79.6%)。
- HMMT25(高中数学竞赛):Grok 4 Heavy 得分 96.7%,远高于 Gemini 2.5 Pro 的 82.5%。
- USAMO25(美国数学奥林匹克):Grok 4 Heavy 得分 61.9%,显著优于 Gemini DeepThink(49.4%)和 Gemini 2.5 Pro(34.5%)。
- ARC-AGI(抽象推理):Grok 4 得分 15.9%,几乎是此前商业 SOTA 模型的两倍。
- Vending-Bench(模拟经营):Grok 4 净收益 $4694,远超 Claude Opus 4($2077)和人类玩家($844)。
- 第三方评测结果(基于Artificial Analysis平台):
- 人工智能综合指数:Grok 4 得分 73,高于 OpenAI o3(70)、谷歌 Gemini 2.5 Pro(70)、Anthropic Claude 4 Opus(64)及 DeepSeek R1 0528(68)。
- 编码与数学专项指数:Grok 4 均位列第一。
- GPQA Diamond 分数:创纪录达到 88%,超过 Gemini 2.5 Pro 的 84%。
- Humanity’s Last Exam 成绩:刷新记录至 24%,领先于 Gemini 2.5 Pro 的 21%。
- 响应速度:Grok 4 达到 75 token/秒,虽低于 o3(188 token/秒)和 Gemini 2.5 Pro(142 token/秒),但优于 Claude 4 Opus Thinking(66 token/秒)。
Grok 4的价格体系
- 订阅服务定价:
- SuperGrok:年费 300 美元,月费 30 美元。
- SuperGrok Heavy:年费 3000 美元,月费 300 美元。
- API 调用费用:
- 输入内容:3 美元 / 百万 token。
- 输出内容:15 美元 / 百万 token。
Grok 4的官方网站
- 官网链接:Grok
Grok 4的实际应用领域
- 教育辅导:提供个性化学习计划,解答学术难题,帮助学生深入掌握知识。
- 科研辅助:分析大量实验数据,预测科学趋势,推动新理论与技术的发现。
- 商业金融:进行市场分析与预测,为企业制定战略决策提供数据支持,提升运营效率。
- 创意内容制作:协助广告、影视、游戏等行业完成剧本创作与动画制作,提高创作效率。
- 智能助手:作为语音助手处理多模态信息,协助用户完成日常事务,提升生活便捷度。
以上就是《马斯克xAI发布Grok4重大升级》的详细内容,更多关于的资料请关注golang学习网公众号!
豆包AI设计数据库的实用技巧分享
- 上一篇
- 豆包AI设计数据库的实用技巧分享
- 下一篇
- Win11经典模式怎么切换
查看更多
最新文章
-
- 科技周边 · 人工智能 | 1小时前 | 智能问答 多轮对话 百度AI搜索 国际版入口 chat.baidu.com
- 百度AI浏览器国际版入口及优化方法
- 358浏览 收藏
-
- 科技周边 · 人工智能 | 11小时前 | 文本处理 编码转换 乱码 DeepSeekOCR 纯文本粘贴
- DeepSeekOCR乱码问题解决方法
- 119浏览 收藏
-
- 科技周边 · 人工智能 | 11小时前 |
- Z-Image:阿里通义新推出的图像生成模型
- 303浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
查看更多
AI推荐
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3193次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3406次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3436次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4544次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3814次使用
查看更多
相关文章
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

