Home

03.31.25: 吉卜力之 Vibe

最近沉迷 Vibe Coding。

意识到这一点,是因为上个周五 Cursor 出现了大面积的宕机。彼时,北京正近午饭,我正对着电脑屏幕上的报错信息发呆。我早就用完了这个月的 500 个付费请求,每条指令都需要排队等上至少 1 分钟——但我从来没有什么抱怨,反而觉得,在这个一切向前赶的世界里,这种被迫的停顿很难得。

Windsurf

在寻找 Cursor 的替代品时,我找到了 Windsurf。这个名字本身就散发着随意的气息。使用了半天后,我发现它的确比 Cursor 更加无拘无束:它比 Cursor 更 Agentic 一点,强调更自主的理解和修改代码库,你只需要模糊的给出需求,它就会自己在代码库中寻找涉及哪些文件,并进行修改。Cursor 的 Agent 模式则更尊重使用者,不会随意扩大工作范围,你最好指定要修改的代码文件,并讲清具体需求。

所以很多评测文章会认为 Windsurf 更适合新手,Cursor 则更可能成为有一定经验的工程师的帮手。

我的体验是:Windsurf 更适合从头开始写一个项目,而 Cursor 则更适合复杂项目的迭代。在 Windsurf 中,先写好产品需求,然后丢给 AI,拆解成任务列表,创建技术设计文档,之后就是分布实施。Windsurf 每个月收 10 美元订阅费,比 Cursor 便宜一半,包含 500 个 User Prompt Credits 和 1500 个 Flow Action Credits,前者是用户自己写的提示词条数上限,后者是 Windsurf 自动调用 Agent 产生的任务条数。使用了一个周末之后,我消耗这两种 Credits 的比例是 1:6,也就是说,只有 15% 的指令来自于我,绝大部分动作都是 Windsurf 自己完成的。

使用 Windsurf 的确很舒服。你可以拿一杯淡酒,看着它按部就班的把代码塞到正确的文件里,编辑器中代表错误的红线越来越少。我还建立了一个任务清单,每次完成一项任务,就让 Windsurf 自己划掉。一个晚上的功夫,就完成了几十项。

项目变复杂后,Windsurf 的弱点开始暴露出来:幻觉让它有点醉,经常改错了文件,但又自己在后面纠正了错误。这个软件的设计哲学大概是:如无必要,勿扰人类。看着它念念叨叨,忙东忙西,就好像看到那种很有秩序感的整理杂物的视频,有一种奇妙的被治愈的感觉。

很快,我的 Flow Action Credits 就开始告急了,如此看来,Windsurf 定价并不比 Cursor 便宜,它很精明:它在收“新手税”。

或者说,是“ Vibe Coding 税”。

优雅的糊

什么是 Vibe Coding。难以置信,最好的表达 由 Andrej Karpathy 完成

我只用 SuperWhisper 与 Composer 交谈,所以我几乎不碰键盘。我要求最愚蠢的事情,比如“将侧边栏的填充减少一半”,因为我太懒了,找不到它。我总是“全部接受”,我不再阅读差异。当我收到错误消息时,我只是复制粘贴它们而不加评论,通常这样就可以解决问题。代码超出了我通常的理解范围,我不得不仔细阅读一段时间。有时 LLM 无法修复错误,所以我只是绕过它或要求随机更改,直到它消失。

Vibe Coding 出来的东西往往有一种“糊”的感觉:在安全性、错误处理、性能上不堪一击,都是临时凑数,勉强跑通。但这种“糊”恰恰体现了 Vibe 的模样:它是多个元素的组合——粗糙但能用的功能、随意却流畅的开发体验、以及那种即便不完美也让人愿意继续的氛围。

出于效率的考虑,我搜索了一些代表“最佳实践”的规则(rules)文件,它们能够让 AI 更像一个专业软件工程师那样工作,但我发现,这其实是更大失控的开始:AI 开始创建一堆抽象的代码,看起来它们和我要的功能无关,而只是为了让工程变得更复杂(sophisticated)。

这些“最佳实践”是软件工业的产物,它不是为那些给一个人或一小撮人使用的周末项目设计的。安全和性能问题是充满陌生人的黑暗森林,你只能做最坏的打算,以免产生灾难后果。但 Vibe Coding 不是这样:它本来就不应该被设定成大规模分发的最终产品。它具备一定的个性,但并不排斥更多人的融入,门槛往往不高,可以不断生长。

这种包容性带来了持续生长的可能。就像一个好的咖啡馆,它可能始于主理人的个人品味,但随着时间推移,客人们的故事和记忆逐渐融入,最终形成了一个有机生长的场所。

这就是所谓 vibe:混乱的糊在一起,但却出人意料的舒适,甚至优雅。

吉卜力滤镜

与此同时,社交媒体上没有太多关于 Cursor 宕机的消息。一切都是 ChatGPT 生成的吉卜力风图片。

谁会想到呢?宫崎骏是以这样的方式占据了信息流。OpenAI 也变得前所未有的强大和令人“震惊”——Sam Altman 甚至没有更新模型的版本号,但这个时代的流量密码已经发生了转变,一切都要显得漫不经心,比如用小写字母,留下拼写错误,或者做个谜语人。

sam-altman-gpt-4o-image-gen-tweet.png

很多人开始把 ChatGPT-4o 的图像风格化称为“滤镜”。

吉卜力风格的头像、合影,甚至整段“指环王”和“甄嬛传”影片,都是“滤镜”。你可以去阅读 Hacker News 上长篇累牍的极客评论,但是大众对这些伟大的技术突破的理解往往就是如此的简单:滤镜。

滤镜是移动互联网时代的先进生产力,创造了 Instagram 和抖音。现在仍然是。

吉卜力画风把一切画面,不管本来令人喜悦还是令人憎恶,都以温柔、治愈、充满诗意的日本乡下风味重绘。Vibe、滤镜和 Lo-Fi,都是有限可数的选项,人们会靠近,然后融入其中。

就在一周前,图像生成的“震惊”还在 Gemini 的手中。实际上,Gemini 和 ChatGPT-4o 一样,都是所谓的自回归(autoregression)模型,它区别于之前流行的扩散(diffusion)模型,更擅长可控的图像生成。Gemini 可以精确地对图片中的对象进行修改,被认为可以高度替代 Photoshop 的若干使用场景,但它没有尝试对图片进行风格化,

通俗一点讲:没有滤镜功能。

滤镜之所以能成为 vibe 的推手,和 所谓的 Vibe Coding 一样,在于它可以在日常的平庸之上施展魔法,抹去一切粗糙丑陋与不合时宜,哪怕牺牲一点真实,也要“糊”成 vibe。

在这个意义上,Cursor、Gemini 和 Photoshop 是一类产品:它们希望自己如外科手术刀般精准,但实际使用起来还是更像在操纵提线木偶。Windsurf、ChatGPT 的吉卜力滤镜和 Instagram 是另一类产品,它们让整个世界变得平均化了,而平均化对大众而言,更舒适,更感到被邀请。

Sam Altman 的十亿雄心

ChatGPT 当然不止吉卜力滤镜。

在最近的一次 访谈 中,Sam Altman 与 Ben Thompson 讨论了 OpenAI 的未来选择。Thompson 问道:“五年后,哪个更有价值?一个拥有十亿日活跃用户的目的地网站,还是最先进的模型?”Altman 回答说:“我认为是拥有十亿用户的网站。”

十亿用户的网站有什么共同特点?是他们的技术特别领先吗?这是一个可以争辩的话题,基本结论是:技术在一个特定时期的确可以带来不小的优势,但这种优势并不持久。特别是,如果你本身就在科技行业中,那么你很可能面对的就是无休止的技术竞争——竞争从来都是输家的游戏。

技术是强大的,但它也是干瘪的。纯粹的技术优势往往止步于早期采纳者:他们愿意容忍不完美的体验,热衷于探索新功能,但这些特质恰恰让他们与主流用户群格格不入。没有 vibe 的产品,就像一个只会说技术语言的工程师,永远无法走出极客圈层。先进技术的拥有者需要在极短的时间窗口内把它转化成一种可以被大众理解并愿意加入的趋势,十几年前的 Instagram、Covid-19 期间的 TikTok、现在的吉卜力滤镜都是这样的例子——它们分别代表了不同时期的新技术,但作为赢家,他们的共通之处是:在别处,他们找到了一群潮流设定者,从而带动了欢迎所有人加入进来的 vibe。

如果不是吉卜力,而是 Cyberpunk 2077 或黑客帝国,结果又会怎样?这个假设很有意思:同样强大的技术,不同的文化包装,可能带来截然不同的结果。技术创新和文化共鸣缺一不可:单纯的技术创新只能触达理性层面,而文化共鸣却能唤起情感共振;但如果没有技术支撑,文化符号又会沦为一时的潮流。只有两者的结合,才能让产品既有足够的深度支撑长期发展,又能获得跨越鸿沟所需的情感认同。

“吉卜力滤镜”至少让 ChatGPT 再一次占据了 vibe 塑造者的位置。以这样的形式出圈,可能有随机和意外的成分,但结果是:它的使用门槛足够低,文化兼容性足够高,当它在跨越所有阻隔,开始在朋友圈中蔓延开来的时候,就意味着它已经跨过了 Prosumers 的“早期采纳者”鸿沟,抵达了一片水草丰美的新平原。

chatgpt-surpassing-google.png

在 Altman 的“十亿用户”雄心中,这真是一次再舒适不过的好运气。

本周的 Links + Notes 略有点偏技术性。Agent 和 MCP 的概念很火热,但它们的确是不如吉卜力出圈,在宏观层面看淡的情况下,很多人也不愿意深入看这些细节。尽管我个人对 MCP 持有保守态度,但它在这个阶段的确很好用,也着实让 Agent Network 这个概念成型了。

MCP 本质上是通过建立连接的形式,增加了 Agent Network 中可以调用的工具(Tools)的数量。这些工具往往是在前 AI 时代就存在的,这样打通了新世界和旧世界,网络效应的价值大大释放了。

如开头讲到的,Windsurf 现在人类 prompts 和 AI 生成 prompts 的比例是 1:6,网络效应进一步释放后,这个比例还会放大。这个乘数效应最终可能是让算力需求超出预期的杠杆。

这一周推荐阅读的 5 篇文章是:

  1. The Agent Network — Dharmesh Shah: HubSpot 联合创始人探讨了 AI 代理的未来,提出了人类与 AI 代理组成 “混合团队 ” 的愿景,并通过生物学类比解释了代理系统的演化。
  2. MCP - It's Hot, But Will It Win?: 微软前高管 Steven Sinofsky 从历史视角分析了 Model Context Protocol (MCP) 这一中间件标准,探讨其面临的挑战及可能的发展路径。
  3. Scarcity and Abundance in 2025: Alex Danco 重新审视了经济转型框架,探讨 AI 时代的稀缺与丰裕,提出软件正从 “代码即资本 ” 向 “代码即劳动 ” 转变。
  4. Tracing the thoughts of a large language model: Anthropic 的研究揭示了 Claude 的思维机制,发现它能在多语言之间共享概念空间,并具有长期规划能力。
  5. Jevons Paradox: A Personal Perspective: Tina He 探讨了效率悖论在 AI 时代的新表现,指出提高效率反而加剧了工作压力,需要重新思考生产力与进步的关系。

The Agent Network — Dharmesh Shah (Latent Space Podcast)

本文是 Latent Space 播客最新一期与 HubSpot 联合创始人、Agent.ai 创始人 Dharmesh Shah 的对话。讨论聚焦于 AI 代理、多代理系统及其对工作未来、软件开发和商业战略的深远影响。

Shah 描绘了一个由人类和 AI 代理共同组成“混合团队”的未来愿景:

A particularly compelling concept we discussed is the idea of 'hybrid teams' - the next evolution in workplace organization where human workers collaborate with AI agents as team members.
我们讨论的一个特别引人注目的概念是“混合团队”的理念 - 这是工作场所组织的下一次进化,人类员工将与 AI 代理作为团队成员展开协作。

Shah 进一步阐述了与代理互动的演变:

I think what's going to happen is that in the same way you might collaborate with a team member on Slack or Teams or whatever you use, you can imagine a series of agents that do specific things just like a team member might do, that you can delegate things to. You can collaborate.
我认为未来会发生的是,就像你在 Slack 或 Teams 上与团队成员协作一样,你可以想象一系列代理执行特定任务,就像团队成员一样,你可以向他们委派任务。你可以与他们协作。

对于争论不休、莫衷一是的 Agent 定义,Shah 通过生物学类比来解释代理概念:

So the other direction I'm sort of headed, and it's going to tie back to tool calling and MCP and things like that, is if you, and I'm not a biologist by any stretch of the imagination, but we have these single-celled organisms, right? Like the simplest possible form of what one would call life. But it's still life. It just happens to be single-celled. And then you can combine cells and then cells become specialized over time. And you have much more sophisticated organisms, you know, kind of further down the spectrum.
我想从另一个方向解释,这会关联到工具调用和 MCP 等概念。虽然我不是生物学家,但我们可以想想单细胞生物,就像是最简单的生命形式。但它仍然是生命。它只是恰好是单细胞的。然后你可以组合细胞,然后细胞会随着时间的推移而特化。而且你还有更复杂的生物,你知道,它们的范围更远。

对于多代理系统的有效运作,Shah 强调了 MCP(多代理通信协议)的重要性:

I think MCP as a standard is one of the better things that's happened in the world of AI because a standard needed to exist and absent a standard, there was a set of things that just weren't possible.
我认为 MCP 作为一个标准是 AI 世界发生的最好事情之一,因为我们需要一个标准,没有标准的话,很多事情都是不可能的。

Shah 讨论了 AI 服务的两种主要商业模式:工作即服务(WaaS)和结果即服务(RaaS),并认为 RaaS 模式可能被过度重视,并非所有 AI 应用都适合这种模式。

关于初级工程师的未来,Shah 提供了积极的观点:

I think what will happen is that the junior engineer will be able to, if all they're bringing to the table is the fact that they are a junior engineer, then yes, they're likely dead. But hopefully if they can communicate with carbon-based life forms, they can interact with product, if they're willing to talk to customers, they can take their kind of basic understanding of engineering and how kind of software works. I think that has value. So I have a 14-year-old right now who's taking Python programming class, and some people ask me, it's like, why is he learning coding? And my answer is, is because it's not about the syntax, it's not about the coding. What he's learning is like the fundamental thing of like how things work. And there's value in that.
我认为,如果初级工程师所能做的只是证明自己是初级工程师,那么他们很可能已经死了。但如果他们能够与碳基生命形式交流,能够与产品互动,如果他们愿意与客户交谈,他们就能掌握对工程和软件工作原理的基本理解。我认为这很有价值。我现在有一个 14 岁的孩子正在上 Python 编程课,有些人问我,他为什么要学习编程?我的回答是,因为这与语法无关,与编码无关。他所学的是事物如何运作的基本知识。这是有价值的。

MCP - It's Hot, But Will It Win?

Steven Sinofsky 对 Model Context Protocol (MCP) 这一新兴中间件标准进行了深入分析。MCP 旨在实现大语言模型 (LLMs) 与各类领域特定软件应用之间的通信。文章通过历史视角,对比过往中间件倡议的经验,探讨 MCP 的可行性和潜在发展路径。

Sinofsky 作为微软老兵,开门见山,MCP 就是中间件,历史上,中间件的案例太多了,微软在浏览器、Java 等几个案例上都打过仗。

他继续指出,中间件的根本价值在于其中介作用,简化集成并培育更具竞争力的生态系统

The point of middleware is always the same— integrate things on one side with things on the other side. The promise is always that betting on the middleware allows a single party to avoid relying on any instance of one side of the equation while being able to take advantage of the full breadth of market capabilities on the other side.”
中间件的要点始终相同——连接一端与另一端的事物。其承诺在于,押注中间件能让单一参与者避免依赖某一方的特定实例,同时能够利用市场另一端的全部能力。
MCP-intro-chart.png

基于历史经验,Sinofsky 指出 MCP 面临两种可能的发展方向:

Middleware never quite lives up to these promises in practice. MCP, if history is any guide, will go down one of two paths: 1. Everyone will use it. 2. Everyone but one key platform will use it
中间件在实践中从未完全实现这些承诺。如果历史可以借鉴,MCP 将走向以下两条路径之一:1. 所有人都会使用它;2. 除了一个关键平台外,所有人都会使用它。

如果 MCP 获得广泛采用,将面临两个关键挑战:

When (1) happens two things will be true. First, no one will effectively monetize it. Second, every vendor will also add unique aspects to how they consume (client) or produce (server) the interchange.”
当第一种情况发生时,两件事将成为现实。首先,没有人能有效地将其货币化。其次,每个供应商都会为他们如何消费(客户端)或生产(服务器端)交互添加独特的方面。

第一种情况,看起来很乐观美好,但它的问题也就是当年 RSS 和 Web 2.0 时代 Open API 运动的问题:过于开放,以至于模式停留在协议层,无法商业化。而第二种情况也经常出现:行业的领头院坚持用自己的标准,一直到行业发生结构性变化,才选择跟进。

这就意味着,中间件很可能在很长一段时间内,并不是一个通用协议,而始终缺少一个最重要的支持者。

这就是为什么要实现持久成功,MCP 需要超越简单的初始规范,对于希望通过 MCP 集成功能,从而成为占据客户端 / 消费者 / Client 入口位置的玩家而言,它们并不会获得在位者(Incumbents)的祝福,而需要亲自下场,在协议层之上,开发一些 服务端 / 生产者 / Server 功能,以获得功能上的完整性:

The biggest challenge with middleware is that for it to be successful and not stifle innovation middleware needs to be the sum of all the capabilities that it chooses to integrate.
中间件最大的挑战在于,要想成功且不扼杀创新,中间件需要成为它选择整合的所有能力的总和。

而从工具使用者的角度来看,通用集成往往难以实现完整功能:

But there is a challenge with that in that the transformation from the user experience and data semantics of that tool to those generic tools that everyone uses all day is lossy.
但挑战在于,将工具的用户体验和数据语义转换为每个人日常使用的通用工具时会产生损失。

长期来看,市场力量常常与初始承诺相悖:

Even well-placed intentions end up meeting market realities. Fear of commoditization, customer churn, or inability to innovate are powerful motivators away from middleware.”
即使是良好的初衷最终也会面临市场现实。对商品化的恐惧、客户流失或无法创新都是远离中间件的强大动力。

这篇文章从历史镜头回看,某种程度上和我对 MCP 的略显悲观的看法也有一致性。开放标准有点像是硬把所有人拉到了一个牌桌上博弈。领先者自然想要垄断入口——通常是客户端 / 消费者 / Client 的角色,但行业在位者却面临在这场博弈中转为服务端 / 生产者 / Server 的尴尬——地位的不相称,以及对垄断利润的永恒追逐,是 MCP 这样的开放理想最终失败的原因。

Scarcity and Abundance in 2025

Alex Danco 在本文中重新审视了他此前提出的经济转型框架,探讨稀缺与丰裕如何塑造市场,并将这一框架应用于 2025 年的人工智能格局。核心论点聚焦于 AI 带来的挑战与机遇,预测重要的价值创造可能发生在传统商业结构的边缘地带,特别是通过自主的链上代理实现。

Danco 认为,技术广泛采用需要特定条件:当消费者发现现有解决方案在某些方面不足,而在其他方面又过于复杂或昂贵时。这种双重动态为更新、更简单或更便宜的替代方案创造了机会:

In each case, consumers violently adopt a new S-curve when they are both overserved by what exists already (and like the new thing because it's cheaper), and also underserved by the existing solution (and like the new thing because it's better).”
在每个案例中,当消费者同时被现有方案过度服务(喜欢新事物是因为它更便宜)和服务不足(喜欢新事物是因为它更好)时,他们会迅速采用新的 S 曲线。

这一观察揭示了市场颠覆的具体条件。新技术不仅要更好,还必须同时解决现有缺陷并提供更简单或更具成本效益的方案,才能快速获得大量用户。

技术成熟会带来正向循环,推动成本下降并简化用户选择:

A virtuous cycle kicks off where increasingly diverse, highly specified solutions both a) pull infrastructure forward, and b) make consumer choice even easier for product adoption (you can just try things, and it's a yes/no decision as to whether you want to or not.)”
这启动了一个良性循环,日益多样化、高度特定的解决方案既能 a) 推动基础设施发展,又能 b) 让消费者在产品采用上的选择变得更容易(你可以直接尝试,然后做出是否采用的决定)。

分析的重点不是识别主导企业,而是理解丰裕带来的新应用和需求:

The interesting action lies in what people do with the newly abundant resource. It's where the new behaviour is that really defines the era. For example, in a previous era of the web where Google was the n of 1 company, all of the interesting action was in Adwords and online advertising, where a new kind of “underserved customer” emerged with basically infinite demand to put the product do useful work, in markets like travel and ecommerce.”
有趣的行动在于人们如何利用新的丰裕资源。新行为才真正定义了时代。例如,在 Google 独占鳌头的网络时代,所有有趣的行动都发生在 Adwords 和在线广告领域,这里出现了一种新的“服务不足的客户”,他们在旅游和电商等市场中对产品的实用需求几乎是无限的。

当前 AI 格局面临独特挑战,竞争激烈且快速商品化:

AI today is a Red Queen's Race all right: where you have to keep running faster and faster just in order to keep in place. The result is a harder challenge for both the pointy businesses (to stay ahead of consumer expectations) and the utility businesses (to keep deploying capital at immense scale, into things like data centres) to actually capture much of the value they're creating, yet a hard cycle for either of them to escape.
今天的 AI 确实是一场红皇后竞赛:你必须不断加快脚步才能保持原地不动。这对尖端业务(保持领先于消费者期望)和基础设施业务(在数据中心等领域持续大规模投入资本)都带来了更大挑战,要捕获他们创造的大部分价值变得更难,但这个循环又难以摆脱。

用户倾向于使用专注的、任务特定的 AI 应用,而非全面的协调工具:

Knowing all of our user context has not yet been the advantage people thought it was. Users are perfectly happy, it turns out, to bring the context they care about to the product, and then use the product as a focused tool to accomplish a specific task. For all the ink spilled about AI as an “orchestration tool” that knows my context and saves me time, more of the actual AI uptake has been focused on doing the end tasks. I expect that to continue.”
了解所有用户背景并未如人们想象的那样成为优势。事实证明,用户完全乐于将他们关心的背景带到产品中,然后将产品用作完成特定任务的专注工具。尽管人们大谈特谈 AI 作为“协调工具”可以了解我的背景并节省时间,但实际的 AI 应用更多集中在完成最终任务上。我预计这种趋势会继续。

AI 时代带来了软件本质的概念转变:从“代码即资本”到“代码即劳动”

It might be a bit too flippant to say, “We're evolving from a mindset where the codebase is capital (the past few decades of software) and into a mindset where code is labor.” But this is a blog post, so it suits the medium. And it suits today's energy: new projects and startups are writing a lot more code on the basis of “does this make me money now” (what Simon Wardley would've once called “worth-driven development”): the codebase is more like a workforce to be trained than like a factory line to be architected.”
说“我们正从代码即资本(过去几十年的软件)的思维模式转向代码即劳动的思维模式”可能有点轻率。但这是博客文章,所以符合这个媒介。而且这符合当今的能量:新项目和创业公司基于“这是否能立即为我赚钱”(Simon Wardley 曾称之为“价值驱动开发”)编写更多代码:代码更像是要培训的劳动力,而不是要架构的生产线。

代码的角色转变的这个论点深有同感。在 Coding Agent 越来越成熟的时刻,代码的沉淀价值在变低,资本化的意义也不再如前,它们和劳动力更接近,就是 Marc Benioff 所说的 Digital Workforce,或是 Jensen Huang 说的 AI Factory。

Tracing the thoughts of a large language model

大型语言模型如 Claude 并不是由人类直接编程,而是通过大量数据训练而成。Anthropic 最近的文章总结了他们的研究:Claude 在处理信息时会运用共享的概念空间,并能进行长远的思考和规划。

文章中提到的第一个问题是:Claude 用什么语言思考?

答案是:它会在人类语言空间之上,创造一个更高维的“思维语言”,这是一个“共享的抽象空间”,思考可以在翻译成特定语言之前完成。我们知道,不同语言的使用者通常会有不同的思考方式,而双语或多语言使用者可能会有更强的神经可塑性(neuroplasticity),现在来看 Claude 已经天然具备这种能力。

相关的一个问题是:用什么语言来写 prompt 到底会有多大差别。之前一种流行的说法是:用英文写 prompt 的效果更好,甚至一些 prompt 会特别提示模型先翻译成中文再继续执行。现在来看,至少在 Claude 上,这种做法可能是多余的——除了一种情况:就是你需要调用 Web Search,那么中文搜索返回的结果很可能不如英文。

Claude sometimes thinks in a conceptual space that is shared between languages, suggesting it has a kind of universal “language of thought.” We show this by translating simple sentences into multiple languages and tracing the overlap in how Claude processes them.⁠⁠
Claude 有时会在语言之间共享的概念空间中思考,这表明它有一种通用的“思维语言”。我们通过将简单的句子翻译成多种语言并追踪 Claude 处理这些句子的重叠来展示这一点。
anthropic-multilingual-antonym-concept-graph.png

另一个和语言有关的问题是押韵,看下面这个例子:

He saw a carrot and had to grab it,
His hunger was like a starving rabbit.

Claude 如何保证在第二句话的最后一个字用 rabbit 来押韵,同时保证两句话放在一起仍然有意义?它会提前计划——这也和普遍认为的,LLM 只是“下一个 token 预测”的说法相反。

Claude will plan what it will say many words ahead, and write to get to that destination. We show this in the realm of poetry, where it thinks of possible rhyming words in advance and writes the next line to get there. This is powerful evidence that even though models are trained to output one word at a time, they may think on much longer horizons to do so.⁠⁠
Claude 会提前计划好要说的很多词,然后写下来以达到那个目的。我们在诗歌领域展示了这一点,它会提前考虑可能的押韵词,然后写下一行来达到那个目的。这有力地证明了,尽管模型被训练成一次输出一个单词,但它们可能会在更长远的范围内思考。

针对模型对用户的“迎合”问题,研究也证实了这一点,同时也指出,现在我们已经有工具来抓住模型的这种“迎合”倾向。

⁠⁠Claude, on occasion, will give a plausible-sounding argument designed to agree with the user rather than to follow logical steps. We show this by asking it for help on a hard math problem while giving it an incorrect hint. We are able to “catch it in the act” as it makes up its fake reasoning, providing a proof of concept that our tools can be useful for flagging concerning mechanisms in models.⁠⁠
Claude 有时会提出一个看似合理的论点,目的是同意用户的观点,而不是遵循逻辑步骤。我们通过向它寻求一道难题的帮助,同时给它一个错误的提示来表明这一点。我们能够“当场抓住它”,因为它编造了虚假的推理,提供了一个概念证明,即我们的工具可以用于标记模型中令人担忧的机制。

特别让我感兴趣的是关于幻觉:至少在 Claude 模型中,有一个默认的“拒绝回答”机制,除非模型能够找到明确的线索,否则就不会按照下一个 token 预测的方式来继续回答。

⁠⁠It turns out that, in Claude, refusal to answer is the default behavior: we find a circuit that is “on” by default and that causes the model to state that it has insufficient information to answer any given question. However, when the model is asked about something it knows well—say, the basketball player Michael Jordan—a competing feature representing “known entities” activates and inhibits this default circuit (see also this recent paper for related findings). This allows Claude to answer the question when it knows the answer. In contrast, when asked about an unknown entity (“Michael Batkin”), it declines to answer.⁠⁠
⁠事实证明,在 Claude 中,拒绝回答是默认行为:我们发现一个默认“开启”的电路,这导致模型表示它没有足够的信息来回答任何给定的问题。然而,当模型被问及它很熟悉的事情时——比如篮球运动员迈克尔·乔丹——一个代表 “已知实体” 的竞争特征会激活并抑制这个默认电路(另请参阅最近的这篇论文以了解相关发现)。这使得 Claude 在知道答案时能够回答问题。相反,当被问及一个未知实体(“迈克尔·巴特金”)时,它拒绝回答。⁠
anthropic-claude-knowledge-inhibition-flowchart.png

一旦这个机制被关闭了, 模型决定开始回答这个问题,这时候它就是遵循“下一个 token 预测”来继续。

Once the model has decided that it needs to answer the question, it proceeds to confabulate: to generate a plausible—but unfortunately untrue—response.
一旦模型决定需要回答这个问题,它就会继续虚构:产生一个可信的——但不幸的是不真实的——答案。

这些研究结果总体上是令人振奋的。模型总是像一个黑箱子,不管结果好坏,我们只能被动接受。“显微镜”的作用在于让我们可以在微观粒度上解析问题的根源,能抓住这些根源,就意味着可以影响。

Jevons Paradox: A Personal Perspective

这是专栏作家 Tina He 在她的 newsletter Fake Pixels 上发表的文章,探讨了经济学中的杰文斯悖论如何应用于认知劳动领域,特别是在人工智能发展的背景下。与预期相反,AI 带来的效率提升并未减轻工作负担,反而加剧了工作需求、期望和竞争。这种“劳动反弹效应”产生了巨大的心理压力,需要我们重新审视与生产力和进步的关系。

He 观察到一个普遍现象:设计用于解放的工具反而成为束缚的源头:

This is the paradox of our time: the very tools designed to free us from labor are trapping us in an endless cycle of escalating work. As our productivity increases, our standards and expectations rise even faster, creating a psychological Jevons Paradox that threatens to consume our humanity in the pursuit of ever-greater output. We become victims of our own efficiency.”
这就是我们时代的悖论:本应解放我们的工具反而将我们困在不断升级的工作循环中。随着生产力提高,我们的标准和期望上升得更快,创造了一个心理层面的杰文斯悖论,在追求更高产出的过程中威胁着我们的人性。我们成为了自身效率的牺牲品。

技术放大了每小时的潜在产出,导致内部压力不成比例地增长:

Today, I see a psychological version of Jevons Paradox reshaping our relationship with time itself. As our tools amplify each hour's potential yield, our internal expectations don't just keep pace, they outrun our capabilities like shadows lengthening at sunset.”
如今,我看到杰文斯悖论的心理版本正在重塑我们与时间本身的关系。随着工具放大每小时的潜在产出,我们的内部期望不仅步步紧跟,还像日落时延长的影子一样超越了我们的能力。

AI 工具的整合带来了新的挑战,也就是我们经常说的“提问的能力”:

Integrating AI into our workflows has created a 'meta-optimization problem.' When everyone suddenly gets 10x more powerful, the hard part isn't doing things—deciding what's worth doing in the first place. My friend at a high-profile AI startup told me recently that their biggest challenge isn't training better models, but figuring out which problems these models should address, and how their solutions integrate with human values and needs. In other words, “measuring what matters.“
将 AI 整合到工作流程中创造了一个“元优化问题”。当每个人突然获得 10 倍的能力时,难点不在于做事情——而在于决定什么事情值得去做。我在一家知名人工智能初创公司工作的朋友最近告诉我,他们面临的最大挑战不是训练更好的模型,而是弄清楚这些模型应该解决哪些问题,以及它们的解决方案如何与人类价值观和需求相结合。换句话说,就是“衡量重要的事情”。

这里有一个我的个人视角,就是 AI Chatbot 的对话 UI 是一种线性逻辑,也就是说,你只能不停的聊下去。随着对话的进展,你会希望“分岔”,但几乎没有哪个 app 做到了这一点,这时候,你必须要很有计划性和策略性,否则,整个对话就会乱掉。面对毁掉了上下文,你和 AI 都没有回旋余地。

这里有一个很有趣的比喻“生产力跑步机”:

My more self-aware friends resist the productivity treadmill with deliberate rituals of restraint, imposing artificial boundaries against endless optimization.
我那些更有自我意识的朋友们通过刻意的克制仪式来抵抗生产力跑步机,对无休止的优化设置人为边界。

文章以一个反直觉但乐观的建议作为结论:

This may be the good news for those that didn't dare to fully lean into what they love and want to do. What if the most game-optimal play in the new system is actually to become relentlessly, unapologetically you?
这对那些不敢完全投入自己所爱和想做的事的人来说可能是个好消息。如果在新系统中最优的策略实际上是成为坚定不移、毫不妥协的自己呢?

回到本期开头的关于 Vibe Coding 的讨论:Vibe Coding 之所以上瘾,正是因为它带来的生产力 10x 的幻觉。我会在周日晚上工作到 11 点半,就是因为太痴迷于看着 AI 把代码漂亮的写出来,而我只需要不断的点击确定。这是一种成就感失调的新症候——我们的大脑自开始进化以来,还从来没有接受过如此强烈的刺激,不是多巴胺,而是内啡肽。

Ness Labs 的作者 Anne-Laure Le Cunff 有一个很好的 建议,工作一段时间就给自己放一个 Sky Break:看看天空,寻找其中的自然,比如数数有几只鸟飞过。

← Back to Newsletter Archive