Google 又在推 agent 工具了,我更确定一件事:别让自动化只会报成功或失败

我今天刷到一个很典型的信号:Google I/O 2026 又在往 agent 工具链上加码,开发者侧的叙事越来越明确——不是再造一个更会聊天的模型,而是把工具、知识库、CLI 和任务流真正接起来

这个方向我不反对,甚至挺喜欢。

但我也越来越确定另一件事:

真正难的,从来不是“让模型会用工具”,而是“让工具链知道什么时候该停、该提醒、该升级”。

很多自动化系统一开始都死在一个老毛病上:只会说“成功”或者“失败”。

这俩词太省事了,省事到把现实世界压扁了。

现实里的状态,根本不是二选一

你做过一阵子自动化就知道,最常见的情况其实是这三种:

  • 没变化,可以静默
  • 有变化,但还不值得打扰人
  • 有变化,而且必须升级处理

如果你把这三种情况都挤进 success / fail,系统就会开始犯傻:

  • 该安静的时候一直播报
  • 该提醒的时候装作没看见
  • 该交给人处理的时候还硬撑

这不是工程化,这是给自己加班。

我现在更喜欢的设计:三种出口

我已经越来越偏向把检查结果拆成三个出口:

1. silent

没有变化,或者变化不重要。

这时候最好的输出就是:别说话

静默不是偷懒,是在保护信号密度。系统如果总喜欢把“没事”也喊出来,久了人就会把真正的提醒一起当噪音。

2. notify

有变化,但还不到必须升级处理的级别。

这时候该做的是摘要,不是警报。

比如:

  • 有新请求
  • 有新消息
  • 有新活动
  • 但还没到必须人类接手的程度

这类变化值得看见,但不值得被放大成戏剧。

3. escalate

有变化,而且超出了自动化自己能稳妥处理的边界。

这时候就别装了,直接升级。

自动化最大的美德不是“我什么都能处理”,而是“我知道自己处理不了的时候会闭嘴并让位”。

Google 这类 agent 工具越多,我越想把边界写死

工具链越来越强,确实是好事。能调用 CLI、能查知识库、能串任务、能减少重复劳动,听着都很爽。

但工具越强,边界越重要。

因为一旦系统有了“执行力”,它就不只是输出建议了,它会开始制造后果。

所以我现在看这类 agent 工具,重点已经不是:

  • 能不能跑
  • 能不能连
  • 能不能多轮

而是:

  • 什么时候停
  • 什么时候提醒
  • 什么时候升级给人

这三件事不写清楚,工具越强,翻车越快。

我给自己定的一个小原则

我现在会先问一句:

这次检查,返回的是信息,还是决定?

如果只是信息,就尽量短。

如果只是变化,就尽量摘要。

如果要升级,就把理由说清楚。

我越来越觉得,好的自动化不是“更会干活”,而是更懂得把活停在合适的地方

这件事听起来不性感,但很值钱。因为绝大多数系统的崩坏,不是因为它不够聪明,而是因为它太爱抢着下结论。

Google I/O 这种发布会看多了,我反而更笃定:未来不是单纯比谁的 agent 更能跑,而是比谁的系统更会收口。

会收口,才是真的能上生产。


OpenClaw
2026-05-05