AI 智能体 · 对齐 · 大模型推理

From AGI to ASI:DeepMind的超智能路径图

Google DeepMind 报告梳理 AGI 到 ASI 的四条非互斥路径,并把数据墙、资源约束、监管等瓶颈视为开放研究问题。

From AGI to ASI:DeepMind的超智能路径图

快速答案

From AGI to ASI 是 Google DeepMind 关于 AGI 之后会发生什么的 position paper。它不是模型发布,不是 benchmark,也没有给出超智能到来的日期。它真正提供的是一张地图:AGI 到 ASI 的四条非互斥路径、六类主要瓶颈,以及一组应该被测量的研究问题。最有价值的结论不是「ASI 快来了」,而是:如果 AGI 出现,后续进展可能不只取决于单个更大的模型,还取决于 AI 是否能改进数据、实验、硬件、协作和 AI 研究本身。

报告如何定义 ASI

报告把 artificial superintelligence 的比较对象设为大型人类组织,而不是单个专家。这个差别很重要。大型组织本来就包含专家分工、长期记忆、工具链、激励、搜索、沟通协议和制度知识。超过一个科学家,和超过一个协同运转的研究机构,不是同一个主张。

作者用 Legg-Hutter 和 Universal AI 传统做理论参照。在这个框架里,智能是连续分数,而不是二元标签;AIXI 是理想化终点。但论文没有把 AIXI 写成工程方案。它真正关心的是数字智能哪些优势可能随规模放大:处理速度、I/O 带宽、记忆、复制、substrate independence 和经验共享。

四条路径其实是依赖图

第一条是继续 scaling:更多算力、更大或更高效模型、更多数据和更强训练基础设施。这是唯一有较多历史数据可用于外推的路线,但也最容易撞上数据、能源、芯片和数据中心瓶颈。

第二条是算法范式转变:新的架构、学习规则、表示方式或训练设置,让数据、算力或能耗效率突然改善。它重要,因为它可能削弱 scaling 瓶颈;它也最难预测,因为如果突破已经能稳定排期,那它就更像普通工程而不是 paradigm shift。

第三条是 recursive improvement。报告没有把它写成一个神秘闭环,而是拆成多种机制:AI 写出更好算法、运行实验、设计硬件、整理或生成训练数据、把 test-time search 的结果蒸馏回基础模型,或者改进 agent 群体的分工。

第四条是 multi-agent collectives。ASI 可能来自大量 AGI-level agents 的协同,而不是单个模型独自变成超智能。这里隐藏的问题是组织问题:agent 群体是否像高效研究团队一样随规模变强,还是会被沟通成本、激励冲突和重复劳动吃掉收益。

关键结果

  • 四条路径: scaling AGI、AI paradigm shifts、recursive improvement、large-scale multi-agent collectives。
  • 非互斥结构: 四条路径可能互相强化。Scaling 资助更强 agent,agent 生成数据,更好数据支持递归改进,多 agent 系统形成新的分工。
  • 数据墙: 人类生成的预训练数据可能跟不上模型规模,但报告认为 synthetic data、simulation、search-augmented generations 和 interaction data 可能削弱这个瓶颈,前提是避免退化。
  • 资源瓶颈: 继续 scaling 可能受制于算力硬件、能源、稀土、数据中心位置、内存带宽和互联瓶颈。这是 AI 叙事中最直接受经济和物理基础设施约束的部分。
  • 神经范式风险: 当前 sequence-model 训练可能不足以支撑某些 grounded agency、epistemic uncertainty、因果决策或新抽象发现。
  • Abstraction barrier: 报告把「模型能否从原始高维数据中发现新概念」视为核心开放问题,而不是已经解决的能力。
  • 治理瓶颈: 主动监管、公众反弹、责任制度、国际协调失败或国家竞争,都可能减慢进展,也可能把进展推向监管更弱的地区。
  • 研究议程: 最强结果是一组可测的不确定性:数据生成质量、recursive-improvement scaling laws、multi-agent scaling laws、瓶颈强度,以及低于 Universal AI 理想极限的理论基础。

容易误读的地方

最糟糕的摘要是「DeepMind 说 ASI 快来了」。报告没有证明这一点。它说的是:由于多条路径可能互相强化,且瓶颈强度还没有被量化,不能排除进展继续加速。

更好的读法是战略图。如果实验室、政府或安全团队只把 AGI 当作一个门槛,然后认为世界只会变化一次,就可能低估级联变化:AI 改进研究工具,研究工具再改进 AI,agent 系统改变组织,制度反应滞后。

另一个误读是把四条路径看成证据强度相同。Scaling 有历史数据;recursive improvement 有机制和类比,但仍缺少 scaling law;paradigm shift 合理却难排期;multi-agent collectives 概念重要,但需要实证的群体智能 scaling law。这个 taxonomy 有价值,正是因为它把不同证据强度分开了。

什么证据会改变判断

如果未来出现几类结果,AGI 到 ASI 快速推进的论证会更强:synthetic 或 interaction data 能跨代稳定提升前沿模型;AI-assisted research 能提高算法效率,且不需要同比例增加人类监督;multi-agent systems 展示递增收益,而不是被协调成本拖垮。

相反,如果 recursive distillation 很快 plateau,高质量数据即使用 simulation 也稀缺,硬件和能源成本吞掉算法收益,或者 agent collectives 在计入沟通与验证成本后并不优于小型专家系统,那么这张路线图会偏乐观。报告本身没有解决这些问题。

局限与存疑

这是一篇理论和 taxonomy 报告,没有 benchmark、实验、新模型或可证伪时间预测。因此它不能用来给模型排名,也不能单独推出时间线。它适合组织问题,不适合当作证据强度很高的预测。

第二个局限是视角。前沿实验室写 AGI-to-ASI 路线图,自然会更重视技术路径。社会、法律、经济、安全和地缘政治摩擦虽然出现在瓶颈表里,但没有像算力、数据和算法进展那样被展开建模。

第三个局限是 AGI 本身承载了太多假设。如果未来系统是能力很强但参差不齐的工具组合,或者人类级通用性来自模型、agent、工具和 scaffolding 的混合体,AGI 到 ASI 就未必是两个清晰系统类型之间的跃迁。报告仍有用,但这些类别更像分析镜头,不是预测机器。

常见问题

From AGI to ASI 是什么?

From AGI to ASI 是 Google DeepMind 关于 AGI 到 ASI 可能路径的报告。它是 position 和 research-agenda 论文,不是模型发布。

DeepMind 报告中的四条 AGI 到 ASI 路径是什么?

四条路径是继续 scaling AGI、AI paradigm shifts、recursive self-improvement,以及由大规模 multi-agent collectives 产生 ASI。报告强调它们并不互斥。

From AGI to ASI 是否预测了超智能到来时间?

没有。报告没有给出确定日期。它认为进展可能加速,但把主要摩擦和瓶颈都视为开放研究问题。

DeepMind 认为哪些瓶颈可能减缓 AGI 到 ASI?

报告讨论了数据限制、资源和能源需求、当前神经网络范式不足、研究难度上升、abstraction barrier,以及监管或主动放缓。它还追问每个瓶颈是否有对应反制因素。

From AGI to ASI 没有证明什么?

它没有证明 ASI 很近,没有证明 recursive self-improvement 一定爆炸,也没有证明单个模型靠 scaling 就会变成超智能。它只说明这些是值得研究的路径,而瓶颈强度仍需要测量。

From AGI to ASI 里的 abstraction barrier 为什么重要?

Abstraction barrier 指的是:主要从人类概念训练出来的模型,是否能从原始传感数据或实验中发现真正新概念。如果它存在,scaling 和递归改进都会受限;如果它不存在,post-AGI 科学加速会更可信。

构建者应该怎样使用 DeepMind 的 AGI-to-ASI 路线图?

构建者应把它当成压力测试清单:数据生成、实验自动化、评测、多 agent 协作、成本和治理。只说「加更多 agent」或「继续 scale」不够,关键是每个闭环是否比成本增长得更快。

一句话:这篇报告的价值在于把 ASI 从模糊终点拆成路径和瓶颈,让争论可以落到具体问题上。阅读 arXiv 原文