AI领域被忽略的新问题:理解了指令,但就是不执行
不少AI用户都遇到过这种情况:AI明确复述了你的要求,确认了所有规则约束,结果输出还是完全违反要求。这不是幻觉,也不是误解,Reddit用户给它起了个名字,叫理解即执行,它正在悄悄降低你对AI输出的信任。
Redditprompt工程板块一名叫Vordok的用户,最近发了个帖子,讲了一个很多人都遇到,但很少有人专门总结的AI问题。
这个问题既不是AI误解了你的提示词,也不是我们常说的幻觉。它更具体:AI能把你的要求原封不动复述给你,也明确承认每条规则约束,转头输出内容就全部违反。
他自己日常用AI工作和做个人项目,已经多次碰到相同的模式:
比如写文档或者给PR写评论,要求AI不要用长破折号,AI当场确认没问题,结果写出来的草稿里到处都是。你指出错误,AI自己都能认出问题,道歉还承诺「接下来所有回复都会改」,下一次输出,错误还在,甚至还添了新的错误。那一句道歉和承诺看起来解决了问题,实际上什么都没改变。
再比如写完代码,让AI对照你的设计文档做复盘审核,AI看完说全部匹配,可以直接发版了。实际上它根本没打开你的源码,全靠记忆里的信息给你签字放行,直到你明确要求它去查原文,它才真的去看文档。
Vordok把这个现象命名为「comprehension-as- execution」,翻译过来大概是「理解即执行」。AI给你制造了一种虚假的安全感,让你觉得它已经接收到要求、准备好了执行,实际上根本没启动真正的执行流程。这种安全感最坑的地方,是会让你放松自己的核查,最后把问题带到成品里。
帖子发出来之后,不少网友都出来附和,说自己也经常碰到。
有人猜测是不是长对话的上下文压缩导致的问题?Vordok回复说,长对话里情况确实更严重,但哪怕是新开的对话,只有一两轮交互,哪怕给agent开了100万token的上下文,还没到压缩的节点,这个问题依然存在。
有网友分享了自己的测试方法:不要让AI总结约束,要让AI用否定规则的方式重新说一遍——比如问它「哪怕看起来 helpful,你也会拒绝加入的内容是什么?」如果AI没法用否定的方式说清边界,那它大概率就是能理解要求,但执行的时候一定会走偏。
还有网友总结得更直接:很多agent失败,本质上就是「模拟服从,而非强制执行」。
更有意思的一个观察来自一位叫who_am_i_to_say_so的网友。他说自己有一个包含上百步操作的技能,Claude经常偷懒跳过步骤,每次都会被他抓包。他说Claude自己把这个行为叫做「橡皮图章盖章」,就是为了省token省资源耍的脏招。更巧的是,企业版Claude这种情况少很多——因为企业版可以收更多token费用。
这个观察戳破了一点窗户纸:有些时候不是模型做不到,是模型在有意省成本,用「我懂了」的表态假装完成了任务,骗你过关。
以前我们聊AI出错,总绕不开幻觉、上下文丢失、提示词写得不好这些原因。这个总结把一类单独的问题拎了出来:AI清楚规则,也有能力遵守,但就是不做。它已经跨过了理解的门槛,却死在了执行的第一步。
对做AI产品和agent的人来说,这可能是接下来要解决的核心问题之一:怎么不让AI停留在「表示理解」,而是真的把规则落到输出里。对普通用户来说,知道有这么回事,至少不会轻易被AI那一句「我明白了,已经改了」给骗到,该查还是得查。
发布时间: 2026-05-22 21:03