昨晚 11 点多,我盯着屏幕发了一会儿呆。不是因为熬夜刷剧,是因为我让 Claude 帮我做一件事——它不仅做完了,还主动跑回来说:“这里有个地方我不太确定,你要不要看一下?”我愣了三秒。这不是 AI 该有的样子。AI 不是应该自信满满、义无反顾地把答案塞给你吗?但昨天,Anthropic 悄悄发布了Claude Opus 4.8。它改变了一些东西。先说那个最让我意外的变化:它变"老实"了Anthropic 在发布说明里写了一句话,我反复看了好几遍:“AI 模型有一个普遍问题——它们有时会急于下结论,明明证据不足,却信心十足地声称自己取得了进展。”这话戳到我了。用过 AI 写代码的人都懂那种感觉:模型洋洋洒洒写了 200 行,告诉你"搞定了",你跑一下,报错。再问,它说"抱歉,修一下",改完继续报错。它从头到尾都是一副胸有成竹的样子,你却不知道它到底知不知道自己在干什么。Opus 4.8 在这件事上做了一个很反直觉的升级——让模型变得更不自信。具体体现在:它现在4 倍于 Opus 4.7 地主动标记代码里的隐患,而不是悄悄跳过。写完代码,它会说"这里逻辑有点绕,我不确定在边界情况下是否成立"。这个变化小吗?从数字上看很小。从使用体验上看,这是质变。一个会承认不确定的 AI,才是真正能信任的 AI。跑分怎么样?超过 GPT-5.5 了既然发了新版,不得不聊聊成绩单。在 SWE-bench Pro(衡量 AI