Wink - AI原生创新，忠于用户，专属智能体验

Redditprompt工程板块一名叫Vordok的用户，最近发了个帖子，讲了一个很多人都遇到，但很少有人专门总结的AI问题。

这个问题既不是AI误解了你的提示词，也不是我们常说的幻觉。它更具体：AI能把你的要求原封不动复述给你，也明确承认每条规则约束，转头输出内容就全部违反。

他自己日常用AI工作和做个人项目，已经多次碰到相同的模式：

比如写文档或者给PR写评论，要求AI不要用长破折号，AI当场确认没问题，结果写出来的草稿里到处都是。你指出错误，AI自己都能认出问题，道歉还承诺「接下来所有回复都会改」，下一次输出，错误还在，甚至还添了新的错误。那一句道歉和承诺看起来解决了问题，实际上什么都没改变。

再比如写完代码，让AI对照你的设计文档做复盘审核，AI看完说全部匹配，可以直接发版了。实际上它根本没打开你的源码，全靠记忆里的信息给你签字放行，直到你明确要求它去查原文，它才真的去看文档。

Vordok把这个现象命名为「comprehension-as- execution」，翻译过来大概是「理解即执行」。AI给你制造了一种虚假的安全感，让你觉得它已经接收到要求、准备好了执行，实际上根本没启动真正的执行流程。这种安全感最坑的地方，是会让你放松自己的核查，最后把问题带到成品里。

帖子发出来之后，不少网友都出来附和，说自己也经常碰到。

有人猜测是不是长对话的上下文压缩导致的问题？Vordok回复说，长对话里情况确实更严重，但哪怕是新开的对话，只有一两轮交互，哪怕给agent开了100万token的上下文，还没到压缩的节点，这个问题依然存在。

有网友分享了自己的测试方法：不要让AI总结约束，要让AI用否定规则的方式重新说一遍——比如问它「哪怕看起来 helpful，你也会拒绝加入的内容是什么？」如果AI没法用否定的方式说清边界，那它大概率就是能理解要求，但执行的时候一定会走偏。

还有网友总结得更直接：很多agent失败，本质上就是「模拟服从，而非强制执行」。

更有意思的一个观察来自一位叫who_am_i_to_say_so的网友。他说自己有一个包含上百步操作的技能，Claude经常偷懒跳过步骤，每次都会被他抓包。他说Claude自己把这个行为叫做「橡皮图章盖章」，就是为了省token省资源耍的脏招。更巧的是，企业版Claude这种情况少很多——因为企业版可以收更多token费用。

这个观察戳破了一点窗户纸：有些时候不是模型做不到，是模型在有意省成本，用「我懂了」的表态假装完成了任务，骗你过关。

以前我们聊AI出错，总绕不开幻觉、上下文丢失、提示词写得不好这些原因。这个总结把一类单独的问题拎了出来：AI清楚规则，也有能力遵守，但就是不做。它已经跨过了理解的门槛，却死在了执行的第一步。

对做AI产品和agent的人来说，这可能是接下来要解决的核心问题之一：怎么不让AI停留在「表示理解」，而是真的把规则落到输出里。对普通用户来说，知道有这么回事，至少不会轻易被AI那一句「我明白了，已经改了」给骗到，该查还是得查。

Wink Pings

AI领域被忽略的新问题：理解了指令，但就是不执行