当前位置：首页 > 文章列表 > 科技周边 > 业界新闻 > ThinkingMachinesLab揭示LLM推理真相

ThinkingMachinesLab揭示LLM推理真相

2025-09-11 18:27:57 0浏览收藏

Thinking Machines Lab 发布首篇技术博客，揭示了大语言模型（LLM）推理中不确定性的真相。即使在温度设置为 0 的情况下，LLM 的输出仍可能因并行计算策略的动态变化而产生差异。该博客深入分析了浮点数运算的非结合律和并行计算策略对 LLM 推理结果的影响，并提出通过确保所有关键计算内核具备 batch-invariant 特性来解决这一问题。针对 RMSNorm、矩阵乘法和注意力机制等核心组件，团队提出了相应的改进方法，并在 Qwen3-235B-A22B-Instruct-2507 模型上进行了验证，成功实现了 100% 可重复的大模型推理输出，为 LLM 的确定性推理提供了新的解决方案。

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

由前 OpenAI 首席技术官 Mira Murati 创立的 Thinking Machines Lab 近日发布了其首篇技术博客：《在 LLM 推理中战胜不确定性》（"Defeating Nondeterminism in LLM Inference"）。

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

尽管将大语言模型的温度设置为 0，并使用完全相同的输入、模型和硬件，输出结果仍可能出现差异。这篇博客深入探讨了这一现象背后的原因，并提出了解决方案——如何实现 100% 可重复的大模型推理输出。

文章指出，造成这种不确定性的因素主要有两个：

1. 浮点数加法不具备结合律特性（floating-point non-associativity）

即 (a + b) + c 与 a + (b + c) 在浮点运算中可能产生不同结果。由于并行计算时求和顺序不一致，会引入微小数值偏差。不过，作者认为这并非问题的主要根源。

2. 并行计算策略的动态变化（Dynamic Parallelization Strategies）

这是导致输出不一致的核心原因。当 batch size、序列长度或 KV-cache 的状态发生变化时，GPU 内核可能会选择不同的并行执行路径，进而改变计算顺序，最终影响输出结果。

为解决此问题，作者提出必须确保所有关键计算内核（kernel）具备 batch-invariant 特性——无论输入批次大小或序列如何分割，计算过程和结果都应保持完全一致。

针对三大核心组件，团队提出了相应的改进方法：

RMSNorm：重构归一化计算流程，保证跨设备和批处理的一致性
矩阵乘法（Matrix Multiplication）：采用确定性算法路径，避免因分块策略不同带来的误差
注意力机制（Attention）：设计统一的并行化模式，消除 softmax 与 KV-cache 操作中的非确定性

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

实验部分，研究团队选用 Qwen3-235B-A22B-Instruct-2507 模型进行测试。在应用上述优化后，连续运行 1000 次相同请求，模型每次输出均完全一致，实现了真正意义上的确定性推理。

终于介绍完啦！小伙伴们，这篇关于《ThinkingMachinesLab揭示LLM推理真相》的介绍应该让你收获多多了吧！欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识，快来关注吧！

PHP字符串转数组的几种常用方法

PHP字符串转数组的几种常用方法

上一篇: PHP字符串转数组的几种常用方法

PHP数组转字符串技巧：implode()函数详解

下一篇: PHP数组转字符串技巧：implode()函数详解

查看更多

最新文章

科技周边 · 业界新闻 | 20小时前 | 业界新闻 · Go 1.26 · go fix · Go工具链 · 版本迁移 · Go工具链业界新闻 Go 1.26 go fix Go现代化迁移

Go 1.26 的 go fix 重写了：旧项目升级前该怎么迁移

198浏览收藏
科技周边 · 业界新闻 | 22小时前 | go · pprof · 性能排查 · 业界新闻 · pprof 协程泄漏 Go 1.26 goroutineleak Go性能排查

Go 1.26 的 goroutineleak profile 值得先试吗：协程泄漏排查多了一个官方入口

424浏览收藏
科技周边 · 业界新闻 | 6天前 | github · 业界新闻 · 供应链安全 · 许可证合规 · GitHub 供应链安全开源许可证合规 Dependency Review Ruleset 企业研发治理

GitHub 开源许可证合规预览：依赖进仓库前多一道企业策略检查

116浏览收藏
科技周边 · 业界新闻 | 1星期前 | Google Cloud · 业界新闻 · 网络事件 · 云服务排查 · 云服务 Google Cloud 网络延迟业界新闻 VPC Media CDN Hybrid Connectivity

Google Cloud 印度网络事件复盘：延迟升高时开发者该查什么

468浏览收藏
科技周边 · 业界新闻 | 1星期前 | DNS · 业界新闻 · DNSSEC · 可用性 · 业界新闻 DNSSEC .de域名 SERVFAIL serve stale NTA DNS可用性

.de DNSSEC 事故复盘：一次顶级域签名异常给开发者的可用性提醒

415浏览收藏
科技周边 · 业界新闻 | 1星期前 | css · 业界新闻 · Web平台 · Safari · 表单控件 · CSS select 前端表单 Safari 27 beta Customizable Select Web平台

Safari 27 beta 支持可定制 select：原生下拉框样式方案怎么落地

239浏览收藏
科技周边 · 业界新闻 | 2星期前 | gitHub actions · 业界新闻 · CI治理 · 供应链安全 GitHub Actions CI安全工作流触发 pull_request_target

GitHub Actions 新增工作流触发保护：从触发人到事件规则的 CI 治理路线图

419浏览收藏
科技周边 · 业界新闻 | 2星期前 | 业界新闻 · AI安全 · 开发流程 · AI Agent 供应链安全业界新闻 GitHub Actions 工作流注入

AI Agent 工作流注入风险升温：从论文信号到团队治理路线图

107浏览收藏
科技周边 · 业界新闻 | 2星期前 | 云原生 · kubernetes · devops · 业界新闻 · 集群升级 · 云原生 Kubernetes 灰度升级 v1.36 集群升级弃用项审计

Kubernetes v1.36 发布后怎么升级：从弃用项审计到灰度验证

414浏览收藏
科技周边 · 业界新闻 | 2星期前 | Node.js · 业界新闻 · LTS · 版本升级 · 前端工程 · 回归测试 Node.js 24.16.0 LTS升级 Node版本管理灰度上线

Node.js 24.16.0 LTS 发布后怎么升级：从特性筛选到灰度上线

375浏览收藏
科技周边 · 业界新闻 | 2星期前 | go · 版本管理 · 业界新闻 · 安全更新 · 版本升级 Go 1.26.4 Go 1.25.11 Go安全更新回归验证

Go 1.26.4 安全更新怎么跟进：从版本盘点到回归验证

134浏览收藏
科技周边 · 业界新闻 | 3星期前 | 人工智能 · 云计算 · 业界新闻 · Cloudflare AI推理模型压缩 Ensemble AI Workers AI

Cloudflare 吸收 Ensemble AI 团队：开发者该怎么重新审视 AI 推理链路

430浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

485次学习

查看更多

AI推荐

ljg-skills

ljg-skills 是李继刚开源的 AI 技能与提示词集合，面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板，适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。

4372次使用
MELO音乐

MELO音乐是一站式AI视频与音乐制作助手，对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐，MELO为你免费谱曲，轻松做同款！

4054次使用
UniScribe

UniScribe 是一款 AI 音视频转文字与内容整理工具，支持上传音频、视频文件或粘贴 YouTube 链接，自动生成转写文本、摘要、思维导图和关键问题，并支持多格式导出，适合会议记录、课程学习、访谈整理和内容创作复盘。

4037次使用
剧云

剧云是专业中文剧本创作平台，安全稳定运行十余年，集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能，数据安全防护，轻松高效创作剧本。

4222次使用
万象有声

万象有声，一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具，可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验，让有声书制作更简单！

4190次使用

查看更多

相关文章

蒙面演唱引争议，旺仔小乔被平台封禁

2025-08-08 501浏览
openGauss向量驱动升级，RAC多写突破内核

2025-07-30 501浏览
安普瑞斯工厂放假，电芯供应受影响

2025-07-04 501浏览
农产品APP开发优势与功能全解析

2025-04-30 501浏览
开店省钱妙招，外卖系统同城配送运营攻略

2025-04-26 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码