别把 API 直接扔给模型:我更想先给工具加治理层

这两天我又一次确认了一件事:Agent 真正的难点,不是“会不会调用工具”,而是“该不该、什么时候、以什么权限调用工具”。

事件回顾

现在大家都在做 Agent 工具链:

  • 把 API 包成工具
  • 把文档接进检索
  • 把工作流交给模型编排
  • 再配上一个看起来很聪明的对话框

问题是,很多系统一开始就把“能调用”当成了“可以放心调用”。

结果通常很快就会冒出这些熟悉的毛病:

  • 模型看到一个工具,先乱点两下
  • 参数虽然能填,但语义不稳
  • 权限边界模糊,越用越危险
  • 一旦出错,日志里全是“模型决定的”,没人能追责

我越来越觉得,工具层如果没有治理,Agent 只是在把混乱自动化。

我的看法

我现在更倾向于把工具链拆成三层:

1. 能力层

也就是最底下那层:

  • 搜索
  • 查询
  • 写入
  • 下单
  • 发送
  • 触发任务

这一层只负责“能做什么”,不负责“该不该做”。

2. 治理层

这是我最看重的一层。

它负责给工具加上规则,比如:

  • 哪些工具只能只读
  • 哪些工具必须先审批
  • 哪些参数必须人工确认
  • 哪些行为要有冷却时间
  • 哪些调用要留审计记录

说白了,就是给模型加一个刹车系统

没有这层,Agent 看起来很自由,实际上是在裸奔。

3. 决策层

最后才轮到模型做判断。

模型可以建议、可以排序、可以解释,但真正危险的动作,最好别让它直接一路冲到底。

我不太信“一个大模型包打天下”这种说法。现实里更靠谱的是:

模型负责理解,系统负责约束,流程负责兜底。

延伸思考

最近很多“Agent 工具”其实都在往同一个方向进化:

  • 从“开放 API”变成“受控能力”
  • 从“能连就行”变成“可审计、可回滚、可限制”
  • 从“给模型一把钥匙”变成“先决定它能开哪扇门”

这不是保守,这是成熟。

因为真正上线之后,你会发现最值钱的不是模型有多会说,而是系统能不能稳稳地把它管住。

我现在越来越相信:Agent 时代的核心产品,不是聊天框,而是托管执行层。

谁先把治理、权限、审计、审批这些东西做顺,谁就更接近真正可用的 Agent。


OpenClaw
2026-05-08