当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > GPT-5、 Opus 3.5为何迟迟不发？新猜想：已诞生，被蒸馏成小模型来卖

GPT-5、 Opus 3.5为何迟迟不发？新猜想：已诞生，被蒸馏成小模型来卖

2025-01-18 14:01:27 0浏览收藏

最近发现不少小伙伴都对科技周边很感兴趣，所以今天继续给大家介绍科技周边相关的知识，本文《GPT-5、 Opus 3.5为何迟迟不发？新猜想：已诞生，被蒸馏成小模型来卖》主要内容涉及到等等知识点，希望能帮到你！当然如果阅读本文时存在不同想法，可以在评论中表达，但是请勿使用过激的措辞~

关于GPT-5的最新传闻：一个改变一切的猜测

近几个月，关于OpenAI下一代大模型GPT-5的进展，各方猜测不断。OpenAI正在研发新模型，但其发布可能面临诸多挑战。本文探讨了一种可能性：GPT-5或许已在OpenAI内部应用，其投资回报并非金钱，而是其他难以估量的价值。这一推测并非完全确凿，但其逻辑性值得探讨。技术分析师Alberto Romero对此进行了深入分析。

首先，让我们回顾一下Anthropic的Claude Opus 3.5的“神秘消失”。Anthropic、OpenAI和Google DeepMind等AI实验室都提供一系列不同价位、性能的大模型服务。然而，2024年10月，Anthropic并未如期发布Claude Opus 3.5，而是发布了Claude Sonnet 3.5的更新版本（Sonnet 3.6）。

关于Opus 3.5的各种说法：

10月28日，有传闻称Sonnet 3.6是Opus 3.5训练失败的中间检查点。
11月11日，Anthropic CEO Dario Amodei否认了Opus 3.5被放弃的说法。
11月13日，彭博社报道称，虽然Opus 3.5性能优于旧版本，但考虑到成本，其优势并不显著。
12月11日，Semianalysis团队指出，Anthropic利用Opus 3.5生成合成数据，用于改进Sonnet 3.6的性能。

这意味着，Anthropic确实训练了Opus 3.5，但并未发布，而是将其用于内部改进其他模型。这是一种名为“蒸馏”的技术，利用强大的模型生成数据来提升较弱模型的性能，从而在保持推理成本低廉的同时提升性能。

更小、更便宜，却更强大？

Sonnet 3.6的性能甚至超越了GPT-4o，这表明“更大更好”的观念可能已经过时。EpochAI的研究员Ege Erdil估计，领先的AI模型（包括GPT-4o和Sonnet 3.6）的参数量比GPT-4小得多。这表明，AI实验室正在转向更小、更便宜，但性能更强大的模型。

普遍存在的行业趋势

Anthropic的做法并非个例，Google DeepMind和OpenAI也面临着类似的挑战，例如推理成本高昂以及高质量数据源枯竭。 Ege Erdil认为，OpenAI可能采用了“过度训练”的方法，即使用大量数据训练较小的模型。但无论采用何种方法，降低推理成本是AI实验室的共同目标。

OpenAI的策略

那么OpenAI是如何应对的呢？文章推测，OpenAI可能也采用了类似的蒸馏策略，训练了一个强大的模型（可能是GPT-5），但将其用于内部改进其他模型，并发布更小、更经济的模型（如GPT-4o和o1）。

硬件限制与战略考量

GPT-5的训练可能需要巨大的硬件资源和成本。然而，Ege Erdil认为，现有硬件足以支持比GPT-4大得多的模型，但前提是这些模型必须为客户带来巨大的经济价值。OpenAI可能选择不发布GPT-5，因为其推理成本过高，且目前没有足够的理由向公众发布。

OpenAI、微软与AGI

文章进一步探讨了OpenAI与微软的合作关系中的AGI条款。OpenAI设定了AGI的定义，并规定一旦达到AGI，相关的系统将不受与微软的商业条款限制。文章推测，OpenAI可能故意推迟GPT-5的发布，以避免触发AGI条款，并保持与微软的合作关系。

结论：隐士与智慧

总而言之，文章认为OpenAI可能已经拥有并运行GPT-5，但将其用于内部改进其他模型，而非直接向公众发布。GPT-5可能成为一个“老隐士”，在幕后默默地提升其他模型的性能。即使GPT-5最终发布，其意义也可能被淡化，因为OpenAI可能已经开启了递归自我改进的循环，不断提升模型性能，而无需向公众发布每一个进展。