这段时间再看 Agent 产品,我对“某个产品也接入了 AI、也能上传文件、也能调用工具”这类消息,已经没有一开始那么兴奋了。
不是这些能力不重要。恰恰相反,它们太重要,所以会越来越快地变成标配。
一个产品能总结网页,另一个产品也能。一个产品能读文档,另一个产品也能。一个产品能生成报告、拆任务、调工具,过一阵子竞品大概率也会补上。模型能力、RAG、工具调用、文件读取、浏览器操作、代码执行,都会继续进步,也都会继续下沉。
这时候,判断一个 Agent 产品有没有长期价值,就不能只看它“有没有 Agent”。
更值得看的问题变成了:当这些能力逐渐趋同,产品真正争的是什么?
我现在的答案是:更靠近真实任务现场的位置。
所谓任务现场,不是一个新概念,也不是一个漂亮词。它就是一件事真正发生时绕不开的那些东西:可信来源、服务规则、权限、文件、会议、客户记录、人工确认、交付物、结果反馈。
Agent 如果只接到其中一小块,就很容易停在“能回答”“能生成”“能演示”。只有接到这些真实材料和关系里,它才可能变成用户、机构和平台都愿意反复使用的东西。
第一层竞争:谁能被相信
很多时候,用户需要的并不只是“更多信息”。他更在意的是:这条信息我能不能信。
一个学校的招生政策、医院的复诊流程、培训机构的课程承诺、SaaS 产品的接入条件、旅行平台的退改规则,放到网上都能搜到一些内容。但用户真正卡住的地方往往是:这是最新的吗?这是官方口径吗?我这种情况适用吗?如果不确定,谁来负责解释?
这也是我重新理解 ima 知识号、元器公众号智能体这类产品形态的原因。
如果只是让 AI 读一批资料,再围绕资料问答,它和很多通用 chatbot、笔记工具、工作台产品的差异并不大。真正有意思的部分,是机构能不能把自己的可信信息、服务规则、资质、案例和人工接管方式,变成一个用户可以直接提问的服务前台。
过去公众号降低的是信息发布门槛。机构不一定要自建官网,也能有一个对外展示和触达用户的地方。小程序降低的是轻服务门槛。预约、报名、取号、支付、查询,不必每家机构都从零开发 App。
Agent 可能降低第三种门槛:机构如何把“我是谁、我能提供什么、规则是什么、下一步怎么办”讲清楚,并且在用户产生意向时接住他。
这件事成立的前提,是信任结构要站得住。用户要看得见信息来源,知道库主是谁,知道内容什么时候更新,知道 AI 什么时候该拒答,什么时候该转给真人。
否则知识号只是一个会说话的资料夹。它能提升一点查询效率,但还撑不起服务入口。
第二层竞争:事情在哪里继续发生
可信信息解决的是“我该不该相信”。但一件事不会停在相信这里。
用户确认规则之后,还要预约、提交材料、授权、付款、修改文件、开会、同步进度、等待结果。企业内部也是一样,会议之后要有待办,客户沟通之后要更新记录,方案讨论之后要改文档,代码生成之后要测试和 review。
这就是执行型 Agent 值得看的地方。
WorkBuddy、OpenClaw、Claude Code、Codex 这类产品给我的启发,不只是它们能动手,而是它们把 AI 推进了文件、桌面、代码、网页、任务和本地环境里。它们开始接近事情继续发生的地方。
但这里也有一个很容易被说空的问题:不能只说“用户要放心委托”。大部分用户并不会坐在那里严肃思考“我敢不敢委托 Agent”。他只会很自然地把一些事交出去,把另一些事留在自己手里。
目标清楚、低风险、可检查的任务,会最先被交出去。比如整理会议纪要、批量改格式、把资料转成表格、生成一个初稿。这些事情烦、碎、容易拖延,又不太需要复杂判断。
再往前一步,就会碰到正式系统和他人关系。发邮件、改共享文档、更新客户状态、提交材料,这些任务不是不能交给 Agent,而是需要预览、确认、撤回和接管。产品要让用户看见关键差异,而不是让他猜 AI 到底动了什么。
更复杂的地方在共同决策。职业方向、产品路线、品牌定位、重要汇报、谈判准备,Agent 的价值不在于替人拍板,而在于把材料、选项、风险和下一步整理到一个更容易判断的状态。
越接近真实系统,信任也会从“回答靠不靠谱”变成“行为能不能被验证”。这个 Agent 是谁创建的,代表哪个用户或组织,被授权到什么范围,动过哪些文件,调用过哪些工具,关键节点有没有让人确认,出错后能不能追溯和接管,这些都会变成产品能力的一部分。
这不是给产品外面再套一层风控文档。对执行型 Agent 来说,身份、授权、日志和接管机制,本身就是用户敢不敢继续使用的体验。
所以执行型 Agent 的商业价值,不只是“帮用户省时间”。更大的价值是让一次任务之后留下东西:任务历史、偏好、模板、权限设置、工作流、团队规范、复用产物。
一次用完就结束的 Agent,很容易被替代。越用越懂你的工作环境、越能复用你的流程、越能沉淀组织习惯的 Agent,才会慢慢长出迁移成本。
我自己的项目给了一个反向校准
这个判断不是只从产品观察里来的。做 Career Coach 的过程中,我自己也撞到过这道边界。
我一开始更像是在改造一个面向自己的长期协作 Agent:让它理解我的求职材料、目标岗位、写作历史、投递节奏和阶段判断。它确实有用,能整理 JD、接续上下文、归档材料、复盘方向,也能让我在一个漫长任务里少很多重复劳动。
但它也让我看到一个很清楚的限制:通用 Agent 能帮我组织材料,不等于它能变成一个真正的垂直服务。
如果一个人要为高质量求职咨询付费,他不会只关心“有没有 AI 帮我改简历”。他会关心导师有没有相关行业经验,有没有真实案例,能不能看出他的优势和弱点,能不能给压力和监督,能不能在关键节点给出真人判断,甚至能不能提供连接和推荐。
这些东西不是把资料喂给 AI 就能长出来的。
这反过来让我更理解机构 Agent 的机会。它不该把真人服务粗暴替掉,而应该把机构已有的专业供给、服务规则、用户材料、会议反馈和后续任务组织起来。
真人负责专业判断、关系信任和最终责任。Agent 负责把服务过程里大量重复、分散、容易遗漏的部分接住。
这个模式不只适用于求职。留学、法律、财税、企业软件售前、培训、医疗随访,只要同时存在专业信任、复杂规则、持续交付和大量材料,就会有类似空间。
平台的机会,不在单个 AI 按钮
如果前面两个判断成立,平台型公司的机会就会更清楚。
可信供给回答“依据从哪里来”。
服务接口回答“下一步在哪里发生”。
执行环境回答“动作如何推进”。
行为记录回答“出了问题能不能查清”。
任务反馈回答“下一次为什么更顺”。
单独做一个 AI 按钮,很快会被模仿。单独做一个知识库问答,也很容易被新的模型能力吞掉。真正难模仿的,往往是平台长期积累下来的资源能不能被重新组织。
内容账号和认证体系,可以承接可信供给。
小程序、表单、支付、客服,可以承接轻服务。
IM、企微、社群,可以承接触达和人工接管。
文档、会议、云和本地执行环境,可以承接正式任务和交付物。
身份、权限、日志和审计能力,则决定这些 Agent 能不能被组织放心地授权给真实任务。
腾讯系产品给了我一个观察样本。微信里的内容与服务生态,企业沟通和办公协作工具,云和 Agent 搭建平台,再加上 ima、WorkBuddy、OpenClaw 这类新产品,分别站在不同位置。它们未必会变成同一个产品,也不需要被外部观察者写成某种内部路线图。
对我真正有启发的,是这种资源组合本身。
当一个平台已经拥有机构信息、用户关系、服务接口、办公材料和执行环境,它做 Agent 的想象力就不只来自模型,而来自旧资源被重新调度之后的杠杆。
更进一步,数据飞轮也会换位置。
聊天数据当然重要,但执行型 Agent 更稀缺的数据,是任务怎么被发起、怎么被拆解、调用了哪些工具、哪一步失败、用户在哪里打断或纠错、最后哪些结果被采纳、哪些流程被复用。
机构 Agent 也一样。用户反复问什么,哪些问题需要转人工,哪些回答带来预约或购买,哪些资料经常缺失,哪些服务承诺容易被误解,这些反馈会反过来帮助机构补资料、改流程、训练客服和优化转化。
这些才是任务现场里的学习。
我会怎样判断一个 Agent 产品
把判断压得更短一点:
当 Agent 能力逐渐成为标配,产品真正稀缺的是接近真实任务现场的能力。
看一个产品,我会先问三件事。
第一,它靠什么被相信?
有没有可信来源、机构身份、更新机制、引用依据和责任边界。
第二,事情能在哪里继续发生?
问答之后,能不能接到预约、提交、授权、文件、会议、任务、人工服务或系统动作。
第三,完成之后留下了什么?
有没有留下可复用的材料、偏好、流程、任务历史、行为记录和反馈数据。
这三个问题都没有答案,Agent 就很容易停在功能展示。它可能好用,也可能短期惊艳,但壁垒会薄。
这三个问题能接起来,Agent 才更像一种新的服务基础设施。它让机构更容易把可信供给交给 AI,让用户更容易把确定要做的事情继续推进,也让平台已有的内容、关系、服务和执行环境重新长成一条能持续学习的任务链。
所以我现在不太会因为一个产品“也有 Agent”而兴奋。
真正值得看的,是它到底接到了什么真实资源,又能不能从一次次任务里,长出别人拿不走的现场。