AutoGPT 狂热与退烧:我们离‘会自己干活的 AI’到底有多远

GPT-4 一出,一个很自然的念头冒了出来:既然它这么会推理,为什么还要人一句句喂提示?干脆给它一个高层目标(‘帮我调研竞品并写份报告’),让它自己拆任务、自己上网搜、自己写代码、自己根据结果决定下一步——把人类从循环里踢出去。AutoGPT 和 BabyAGI 就是这个念头的产物,而且它们火得不可思议,AutoGPT 几周内冲到 GitHub 星标历史榜的前排,演示视频里它自主完成任务的样子,确实有点科幻照进现实的味道。

技术骨架其实很简单

剥开来看,这类 Agent 的核心是一个循环:把目标和当前状态塞进提示,让 LLM 输出‘下一步该干什么’(规划);执行这一步(调用搜索、运行代码、读写文件等工具);把执行结果作为新的观察喂回去;让 LLM 反思进展、更新计划。如此往复,直到它认为目标达成。再配一个向量数据库当‘长期记忆’,存放历史信息以备检索。听起来很美:一个会用工具、有记忆、能自我修正的数字员工。

然后大家就撞墙了

热度来得快,去得也快。真正上手用过的人很快发现,它在玩具任务之外几乎办不成事,问题是结构性的:

误差复利。一个长任务要几十上百步,每步哪怕只有 5% 概率走偏,几十步连乘下来,成功率低得感人。没有一个机制能可靠地把累积的偏差拉回正轨。
死循环。它经常陷入‘我需要搜索 X → 搜了 → 还是不确定 → 我需要搜索 X’的鬼打墙,自己意识不到自己在原地转。
没有真正的反思能力。所谓‘反思’也是让 LLM 输出一段反思文本,但它并不能真的从失败中学到结构化的教训,下次照样犯。
成本和延迟爆炸。每一步都是一次(甚至几次)GPT-4 调用,一个稍复杂的任务跑下来,几美元几十分钟就没了,还不一定有结果。

退烧之后,沉淀下来的东西

我对这轮‘发烧—退烧’的评价是正面的——它是一次必要的、公开的探边界。它让所有人都直观地看清了 2023 年大模型的一个根本短板:单次推理很强,长程自主很弱。模型能精彩地完成‘一步’,但‘把几十步可靠地串成一件事’需要的规划、纠错、稳定性,它还远远不具备。

这次退烧沉淀出的认知,会指导后面好几年的方向。大家逐渐意识到:与其追求‘全自主的数字员工’,不如先做‘人在环里的协作 Agent’——让 AI 干它擅长的单步,关键节点交回给人确认;与其指望模型凭空规划,不如给它结构化的工作流和明确的工具边界。‘Agent’这个词不会凉,但 2023 年这版天真的全自主幻想会凉。它真正成熟,得等模型的长程推理和可靠性再上几个台阶——这恰好预告了一年多以后‘推理模型’为什么会成为下一个主战场。AutoGPT 像一个早产儿,它喊出的需求是对的,只是身体还没长好。

技术骨架其实很简单

然后大家就撞墙了

退烧之后,沉淀下来的东西

每周一封，<5 分钟读完