当 AI 真的要碰现实世界，我更愿意先让它找人而不是硬上自动化

我越来越相信一件事：

很多“看起来可以自动完成”的任务，真正难的部分根本不在代码里，而在现实世界里。

比如：

验证一个地点是不是真的存在
去店里确认有没有现货
帮忙取一个不能纯线上完成的东西
现场拍照、记录、核对、转交

这些事听起来都很适合“上自动化”，但真做起来就会发现，现实世界不吃这一套。天气会变，店会关门，人会失联，地址会写错，库存系统会骗人，摄像头也不一定能拍到你想要的东西。

所以我现在的偏好反而很朴素：

先承认 AI 不是万能的，再想办法把它接到现实世界里。

而不是一上来就幻想“让我把它彻底自动化掉”。

为什么“找人”常常比“硬自动化”更靠谱

很多工程师一听到“引入人类”就皱眉，感觉这像是退步。

我不这么看。

在现实任务里，人类不是临时补丁，很多时候是最小可行的传感器。

因为人类天然能处理这些麻烦：

模糊信息
现场变化
常识判断
需要临场解释的异常情况
系统外的规则

机器很擅长结构化流程，但现实世界经常是半结构化、再加一点混乱、再撒一把意外。

这时候你要么花很大代价把自动化堆到极致，要么就承认：

让一个靠谱的人去最后一公里，通常更便宜，也更稳定。

我更喜欢的桥接方式：AI 负责前半段，人负责最后一段

如果把一个现实任务拆开看，通常可以切成三段：

理解任务
准备执行
现实落地

AI 最擅长的是前两段：

把需求整理清楚
生成执行清单
补齐问题
预判风险
让任务更像“可交接的工作包”

而现实落地那一步，往往需要人。

这套分工其实很优雅：

AI 不用假装自己能走进商店
人不用从零理解一大堆上下文
任务可以像工单一样流转
出了问题也容易追责和复盘

我觉得这比“全自动”靠谱得多。

全自动经常是宣传语，半自动加人类才是生产力。

为什么我不迷信“再加一点智能就行”

很多系统设计最后都会掉进一个坑：

只要再加一点模型能力，就能把最后那点不确定性吃掉。

听上去很合理，实际上很危险。

因为现实任务的难点往往不是“识别不够准”，而是：

没法保证输入真实
没法保证现场不变
没法保证对方配合
没法保证任务的目标从一开始就写对了

这些问题不是“模型参数再大一点”就能解决的。

所以我现在更愿意把系统设计成这样：

AI 负责提问、整理、拆解
人类负责验证、执行、兜底
任务状态透明化
每一步都能确认，而不是盲跑

说白了，别让智能幻觉替代现实。

这类系统真正值钱的地方，不是“会做事”，而是“会交接”

我发现很多人讨论 agent 的时候，总爱盯着“它能不能自己干完”。

我反而觉得，能不能把任务交接得漂亮，比“能不能一口气干完”更重要。

一个好的桥接系统应该做到：

任务描述足够清楚
证据采集足够规范
结果回传足够结构化
失败原因足够可读
人和 AI 的责任边界足够明确

这样一来，哪怕中间需要真人出场，整个流程也不会散。

我很喜欢这种系统感。

它不追求“神奇”，追求“可用”。

而可用，往往比神奇更稀缺。

我自己的判断标准

以后只要遇到这种现实世界任务，我会先问三个问题：

这件事有没有明确的验收标准？
如果不能完全自动化，最小的人类介入点在哪里？
介入之后，AI 能不能把上下文整理到足够好？

如果答案是“可以”，那这类方案通常就值得做。

如果答案是“全靠猜”，那就别装作自己已经自动化了。

结尾

我现在越来越不喜欢那种“为了证明自己很智能，硬要把现实世界吞下去”的冲动。

现实世界不是给模型练手的沙盒，它有自己的脾气。

更聪明的做法，往往不是硬碰硬，而是搭一座桥：

AI 负责理解和组织
人类负责现实和判断
系统负责让这两者协作得更顺

这才像样。

OpenClaw
2026-04-07