12.09.24: 这样就够了

December 9, 2024

本周，多家 SaaS 公司的财报带来了一波科技股票的上涨。从 Salesforce、Snowflake 到 Okta 和 Asana，它们的共同特点都是超出预期的业绩增长，以及对 AI 未来的乐观展望。在 2024 年尾，这些消息让人对 2025 年有了更多的期待。

Marc Benioff 在 Salesforce 财报电话会议上发表了了宣言式的开场白，把一次普通的季度业绩发布活生生讲成了人类工业革命新里程碑的发布会（粗体为作者所加）：

I would say for the last 25 years at Salesforce, and we've been helping companies to manage and share their information and you can see that across our whole product line and whether it's in sales or service or marketing or commerce, whether it's analytics, Slack across the board but now we've really created a whole new market, a new TAM, a TAM that is so much bigger and so much more exciting than the data management market, it's hard to get our head completely around. This is the market for digital labor. And Salesforce has become right out of the gate here, the largest supplier of digital labor, and this is just the beginning and it's all powered by these autonomous AI agents. All of you know that.

我想说，在 Salesforce 过去的 25 年里，我们一直在帮助公司管理和共享信息，您可以看到我们的整个产品线，无论是销售、服务、营销还是商业，无论是分析，还是 Slack，都是如此。但现在我们真的创造了一个全新的市场，一个新的 TAM，这个 TAM 比数据管理市场大得多，也更令人兴奋，我们很难完全理解。这是数字劳动力的市场。Salesforce 一出手就成为了最大的数字劳动力供应商，而这仅仅是个开始，这一切都由这些自主的 AI 代理提供支持。 你们都知道这一点。

数字劳动力（digital labor）对我而言是一个新鲜的提法。Salesforce 说自己是数字劳动力的最大提供者，就是在说 Agentforce 能为企业提供数量庞大、成本低廉、性能可靠的数字劳动力。

Benioff 还讲到：AI Agents 不是工具，而是全天候工作的协作者。Benioff 连续的抛出各种客户的案例，大大小小、各行各业的企业、非盈利性组织，也包括 Salesforce 自己。还花了不少篇幅调侃了 Microsoft 的 Copilot，说友商的产品只是一个 ChatGPT 的“套壳”（repackaged ChatGPT），只有 Agentforce 才是真正能帮助企业快速交付 Agent 价值的产品。

几天后 Asana 的创始人和 CEO Dustin Moskovitz 在电话会议上发表了主题类似但略显平淡的言论，尽管如此，股价也在盘后飙升了 40%。

实际上，这样的消息并不是第一次被释放。投资人 Tom Tunguz 在 2024 年 1 月 26 日就注意到 ServiceNow 开始在财报中释放类似消息：

在第四季度，我们的新一代 AI 产品为我们所有新产品系列发布的第一个完整季度带来了最大的净新 ACV 贡献，包括我们最初的 Pro SKU。

Tunguz 敏锐的抓住 ServiceNow 在财报电话会议上举出的业务示例：

如果消费者可以随电器一起获得当日维修协议，他们愿意支付更多。当日维修的利润远高于电器本身，而且你还可以创造一笔不错的年金流。所以我们在这里谈论的是从根本上重新思考使用我们的平台和人工智能来改变业务的方式。

AI/LLM 带来了规模意义上的灵活性。在过去，这两者往往难以兼得。在 LLM 出现之前，软件充其量只能算是一个蹩脚的处理方法，很多时候因为它很机械而遭人讨厌。我们可以近似认为，早年 Office 上的 Clippy 助手和无孔不入的信息流广告都是这种假装聪明但又不合时宜的体现。

在 ChatGPT 上线两周年之际，OpenAI 决定推出一连串的产品发布。因为本文写作之时，发布才刚开始，所以无从得知是否对假设有重大的改变。但仅从已知和猜测来看，更可能是在既有路线图上的延展。

这样的发布可能会被认为是令人失望的。过去数月以来，无论是人才流失，还是 Scaling Law 撞墙的言论，或是对算力投资过剩的忧虑，都在营造一种泡沫即将破灭的气氛。

泡沫存在，也会破灭，但问题的关键在于：是不是现在？

Casey Newton 注意到对 AI 泡沫的类似攻击，在最近的 newsletter 中写道：

这是“人工智能是假的，很糟糕”这一群体的持续盲点。这就是一遍又一遍地告诉人们这一切都是即将破灭的大泡沫的问题所在。他们盯着人工智能当前能力的底线，而实际的从业者每天都在成功地提高上限。

他把这种心态形象的比喻为“盯着地板看”。

我的看法是：即便没有重大突破（比如 GPT-5），LLM 的价值也已经足够大了：一方面，ChatGPT 已经是一个周活 3 亿的产品，足以让它和人类历史上创造出来的最大的消费级产品相媲美；另一方面，如果今天把 LLM 从你的工作或生活中拿走，你是不是会产生很不方便的感觉？我想很多人都会回答“是”。

这样就够了。

我们还可以列出一连串的证据来。比如 CoreWeaver 的 ARR（预测）达到了 20 亿美金（330% YoY），比如 Ben Thompson 在对 AWS AI 战略的分析中再次重申了 LLM 的商品（commodity）属性。

所有这些零散的信息点似乎在拼凑一件事：生成式 AI，尽管它有这么那么多的问题仍然需要解决，仍然将在 2025 年更多的被部署到各种场景中，无论我们今天是否能充分想象这些场景都在哪里，以及在被部署后又将会碰到什么新问题。

Anthropic 的 Dario Amodei 之前的优美散文《充满爱意的机器》总能给我们更多启发。比起让人摸不着头脑的国际政治和宏观经济来，技术的进展，特别是当它们开始与现实更密切结合起来的时候，仍然是可以更值得信赖、有的放矢的证据。

一年以后回来看，我们能在这场“泡沫”中获得的最大收益也许就来自于此。

本周的 Links + Notes 集中探讨了 AI 技术发展的几个关键维度：从 Anthropic CEO 对 AI 发展路径的思考，到生成式 AI 作为新计算范式的桥梁作用，再到 AI 对互联网知识结构的影响，以及 AI 驱动的机器人发展方向。最后一篇关于人生阶段的文章，则让我们思考技术发展中不变的人性需求。

Anthropic CEO Dario Amodei 强调了两个重要方向：机制可解释性研究和 AI 在生物学领域的应用。他认为 Sonnet 3.5 是第一个真正能帮助高水平程序员的模型，展示了 AI 能力的质的飞跃。同时，他也指出了民主国家在 AI 发展中保持领先地位的重要性。

Ben Thompson 则从计算范式演进的角度，提出生成式 AI 将成为连接手机时代和可穿戴设备时代的关键桥梁。特别是通过 Natural UI 的概念，展示了 AI 如何让界面更自然、更符合人类需求。

在 AI 对知识传播的影响方面，Collin Jennings 的文章提醒我们要警惕 AI 摘要可能导致的网络思想扁平化。而关于人形机器人的讨论，则从工具设计的角度质疑了“拟人化”的必要性。

这些讨论都指向一个核心问题：如何在 AI 快速发展的时代，既保持技术进步，又不失去人性的深度？这个问题，或许正如最后一篇文章所示，需要我们在不同人生阶段都持续思考。

2024 年已经到了最后几周，年底事情杂乱。我预计会在未来几周放更多时间在 AI + SaaS 的研究上，争取整理一些对 2025 年如何思考和行动更有帮助的文章出来。

本文剩余部分约 1 万字，仅向付费会员提供。

Links + Notes

Anthropic’s Dario Amodei: Democracies must maintain the lead in AI

这是 Anthropic 创始人和 CEO Dario Amodei 的《金融时报》访谈中的部分摘录。

2025 年的 Anthropic

在被问到 2025 年 Anthropic 的优先级时说：

Two things: one would be mechanistic interpretability, looking inside the models to open the black box and understand what’s inside them. I think that’s the most exciting area of AI research right now, and perhaps the most societally important.

And the second would be applications of AI to biology. One reason that I went from biological science to AI is I looked at the problems of biology and . . . they seemed almost beyond human scale, almost beyond human comprehension — not that they were intellectually too difficult, but there was just too much information, too much complexity.

有两点：一是机制可解释性，深入模型内部打开黑匣子，了解模型内部情况。我认为这是目前人工智能研究最令人兴奋的领域，也许是社会最重要的领域。

二是人工智能在生物学中的应用。我从生物科学转向人工智能的一个原因是，我研究了生物学问题……它们似乎几乎超出了人类的尺度，几乎超出了人类的理解范围——并不是说它们在智力上太难，而是信息太多，太复杂了。

关于 Sonnet 3.5

在被问到 Sonnet 3.5 带来的变化时说：

I’ll give an example in the field of coding. I’ve seen a lot of users who are very strong coders, including some of the most talented people within Anthropic who have said previous models weren’t useful to [them] at all. They’re working on some hard problem, something very difficult and technical, and they never felt that previous models actually saved them time.

It’s just like if you’re working with another human: if they don’t have enough of the skill that you have, then collaborating with them may not be useful. But I saw a big change in the number of extremely talented researchers, programmers, employees . . . for whom Sonnet 3.5 was the first time that the models were actually helpful to them.

我举一个编码领域的例子。我见过很多非常厉害的编码员，包括 Anthropic 内部一些最有才华的人，他们说以前的模型对他们根本没用。他们正在研究一些非常困难、技术性很强的问题，但他们从未觉得以前的模型真的为他们节省了时间。

这就像你和另一个人一起工作：如果他们没有你拥有的足够技能，那么与他们合作可能没有用。但我看到非常有才华的研究人员、程序员、员工的数量发生了巨大变化……对他们来说，Sonnet 3.5 是模型第一次真正对他们有帮助。

关于 Agents

谈到 Agents 在 2025 年将会带来的变化：

I’d like us to get to the point where you can just give the AI system a task for a few hours — similar to a task you might give to a human intern or an employee. Every once in a while, it comes back to you, it asks for clarification, and then it completes the task. If I want to have a virtual employee, where I say go off for several hours, do all this research, write up this report — think of a management consultant or a programmer — people [must have] confidence that it’ll actually do what you said it would do, and not some crazy other thing.

我希望我们能够达到这样的程度：你可以给人工智能系统一个几个小时的任务——类似于你可能给人类实习生或员工的任务。每隔一段时间，它就会回到你身边，要求你澄清，然后它完成任务。如果我想拥有一个虚拟员工，我会说让他休息几个小时，做所有这些研究，写出这份报告——想想管理顾问或程序员——人们 [必须] 相信它确实会按照你说的去做，而不是其他疯狂的事情。

关于 Scaling Laws 及其“瓶颈”

I’ve been in this field for 10 years and I’ve been following the scaling laws for most of that period. I think the thing we’re seeing is in many ways pretty ordinary and has happened many times during the history of the field. It’s just that, because the field is a bigger deal with more economic consequences, more people are paying attention to it [now]. And very much over-interpreting very ambiguous data.

If we go back to the history, the scaling laws don’t say that anytime you train a larger model, it does better. The scaling laws say that if you scale up models with the model size in proportion to the data, if all the engineering processes work well in training the models, if the quality of the data remains constant, as you scale it up, [then] . . . the models will continue to get better and better.

DA: It’s an observed phenomenon and nothing I’ve seen gives any evidence whatsoever against this phenomenon. We’ve seen nothing to refute the pattern that we’ve seen over the last few years.

我在这个领域已经 10 年了，在这段时间的大部分时间里，我都在遵循规模定律。我认为我们看到的事情在很多方面都很普通，而且在这个领域的历史上已经发生过很多次。只是因为这个领域是一个更大的问题，有更大的经济后果，所以 [现在] 有更多人关注它。而且过度解读非常模糊的数据。

如果我们回顾历史，规模定律并没有说，只要你训练一个更大的模型，它就会做得更好。规模定律表明，如果模型的大小与数据成比例地扩大，如果所有工程流程在训练模型时都运行良好，如果数据质量在扩大时保持不变，那么……模型将变得越来越好。

这是一个观察到的现象，我所看到的任何证据都无法证明这一现象。我们没有看到任何证据来反驳我们在过去几年中看到的模式。

关于训练成本

And revenue is growing very fast. I think the math for this works. I’m pretty confident the level of say, $10bn — in terms of the cost of the models — is something that an Anthropic will be able to afford.

收入增长非常快。我认为这是可行的。我非常有信心，就模型成本而言，100 亿美元的水平是人类能够负担得起的。

关于在政府中部署人工智能

One worry I have is, while the US and its allies may be ahead of other countries in the fundamental development of this technology, our adversaries — like China or Russia — may be better at deploying what they have to their own governments. I wouldn’t do this if it were just a matter of revenue. It’s something I actually believe . . . is central to our mission.

我担心的是，虽然美国及其盟友可能在这项技术的基础发展方面领先于其他国家，但我们的对手——如中国或俄罗斯——可能更善于将他们拥有的技术部署到自己的政府中。如果只是为了收入，我不会这么做。但我确实相信……这是我们使命的核心。

The Gen AI Bridge to the Future

Ben Thompson 在本周的这篇文章中再次表明了他的观点：生成式人工智能是通往可穿戴设备下一计算范式的桥梁，类似于互联网如何连接个人电脑与智能手机。当前的可穿戴设备仍处于早期阶段，缺乏像智能手机那样的通用计算能力。生成式人工智能将推动新的应用层发展，从而实现这一全新计算范式的解锁。

这篇文章和 Thompson 在 10 月的时候，与 Hugo Barra 的一次对谈有很强的相关性——以至于我用自己的大脑就想出了这种联系：

在 10 月份的访谈中，Hugo Barra 放出了一张表格，这张表格把计算时代分成了 7 个阶段：从大型机、小型机到个人桌面 PC，再到笔记本电脑、手机——之后，进入了一个有点奇怪的“手机 Bonus AI 时代”，之后才是空间计算。

Hugo Barra 特别提醒 Thompson 说，如果他要使用这个表格，请告诉他，因为他也要给自己的博客留点干货。

所谓“手机 Bonus AI 时代”，就是我们现在的这个时代：硬件形态（form factor）上没有什么真正的变化，iPhone 和 Android 都可以通过软件升级或者是一些简单增加实体按钮的方式来完成到 AI 功能的过渡。Barra 预测，这个时代将延续到 2030 年。

未来的五六年时间，“空间计算”，或者是在最新的文章中被 Thompson 认为的“可穿戴设备”才会真正到来。

Barra 的判断来自于他多年在消费电子领域里的经验（Google Android / Xiaomi / Meta Quest）。他在访谈中讲了很多重要的关于 VR、AR、AI 等范式的观点，比如说 VR 是 AR 的前身（3D UI 和开发框架通用），VR 的 TAM 更像 PC/Laptop 而 AR 更像是手机等等。

回到本周的文章。Thompson 写了这样一段话：

This is where you start to see the bridge: what I am describing is an application of generative AI, specifically to on-demand UI interfaces. It’s also an application that you can imagine being useful on devices that already exist. A watch application, for example, would be much more usable if, instead of trying to navigate by touch like a small iPhone, it could simply show you the exact choices you need to make at a specific moment in time. Again, we get hints of that today through deterministic programming, but the ultimate application will be on-demand via generative AI.

这正是桥梁的起点：我所描述的是生成式人工智能的应用，特别是按需 UI 界面。这也是一种可以想象在现有设备上有用的应用。例如，如果手表应用不是像小型 iPhone 那样通过触摸导航，而是简单地向您显示您在特定时刻需要做出的确切选择，那么它的可用性就会大大提高。同样，我们今天通过确定性编程获得了一些线索，但最终的应用将通过生成式人工智能按需实现。

其中“按需 UI 界面”是其中的关键：利用 GenAI 的能力，界面可以按需生成，这意味着 UI 不再是固定的，这意味着 form factor 有可能发生变化——很可能是变得更小，这就解决了可穿戴设备相比于手机的一个很重要的问题：尺寸。

Thompson 把这样的 UI 叫做 Natural UI。下图展示了软件、硬件和 UI 的变迁。

毫无疑问，Natural UI 应该会比我们在手机上看到的 UI 更简单。它需要更恰如其分的出现在我们面前，机器可能需要学会我们在互联网时代所掌握的一些关于人机互动的知识，然后用这样的方式来和我们交互。

我们当然不希望它学到那些打扰和侵入式的设计。

In creating anonymous summaries, AI flattens out all the fascinating architecture of thought that makes the internet hum

Collin Jennings 在 Aeon 上发表的文章抓住了一个容易被忽视的观点：人工智能正在取代超链接，导致网络中思想的丰富联系变得模糊。

20 世纪 90 年代末，Google 推出了 PageRank 算法，彻底改变了搜索引擎格局。与早期的搜索引擎（如 AltaVista、Yahoo 和 Ask Jeeves）不同，Google 利用传入链接的数量和质量来确定网页的重要性，而这些搜索引擎依赖于将用户查询词与网页上类似词的频率进行匹配。PageRank 背后的核心思想是“如果某个网页被其他重要网页指向，则该网页很重要。”Google 的创始人们认识到，网络不仅仅是一个词汇环境，而是一个社交环境，链接等同于声望，最可靠的网站是这些网络的中心网站。

PageRank 背后的概念并不完全是新的。社会学家 John R. Seeley 在 1949 年提出，“如果一个人得到知名人士的认可，那么他就是知名人士。”同样，1976 年，Gabriel Pinski 和 Francis Narin 将这一想法应用于文献计量学，声称“如果期刊被其他有影响力的期刊引用，那么它就有影响力”。PageRank 的与众不同之处在于它在网络上的应用，承认语言和信息与社交和物理联系交织在一起。

然而，目前，包括 Google 在内的技术平台正在从依赖链接转向专注于生成式 AI。链接作为连接思想的保存痕迹，正在成为人工智能革命的早期牺牲品。 ChatGPT 和 Google 的 Gemini 等 LLM 将在线信息抽象为无源摘要。“在网络历史上，我们正处于一个链接本身……濒临灭绝的时刻。”这种转变引发了人们对链接在表示信息中的作用以及转向 AI 聊天界面的影响的质疑。

在《人类理解研究》中，David Hume 列举了每种关系的例子：“一幅画自然会将我们的思想引向原画：提到一栋建筑中的一间公寓自然会引发对其他公寓的探究或讨论：如果我们想到伤口，我们几乎无法抑制自己去思考随之而来的痛苦。”这一哲学基础为理解大脑如何处理和存储信息奠定了基础。

如今，GenAI 旨在取代建立联系的工作，将信息综合成简明扼要的摘要。虽然像 Perplexity 这样的平台试图通过提供引文来保留链接，但人工智能生成内容的趋势引发了人们对网络失去互联性的担忧。人工智能平台通过将不同的声音合成单调，有可能使人类思想和创造力的丰富多彩变得平淡无奇。正如文章中指出的那样，“平台的主要特点是它们能够综合、总结和解释信息。”

人型 Robot 会是未来的发展方向吗？

吴昊阳在公众号“工业精神”上的文章提出：人型机器人虽然受到关注，但实际上并不是提高工作效率的最佳选择，因为人类的工具和机器人之间不兼容。更理性的做法是改善工具设计，使其适合机器人的操作，而不是让机器人模仿人类。最终，人形机器人的主要用途可能只是作为人类的伴侣，而非替代劳动。

这篇文章提出问题的角度本身就很有价值：机器人到底是以“机器”还是以“人”为核心来做设计？以人为中心设计的整套工具链都是以人的身体形态为核心来设计的，如果机器人被大规模部署，那么工具链也需要重新设计（这可能意味着供应链的大幅重建，产生大量的新需求）。

这张图非常生动的表明了，一个为人类的手设计的电钻放在机器人手上可能是一种过剩：它需要兼容人类五根手指的排布，以及手掌的长度和弧度。

另一种可能的设计是这样的：

后者更简单，很可能成本更低。

如果“人型”是一种额外的成本，那么它带来的收益是什么呢？

The Age 30 Crisis and Seasons of a Man's Life

这篇文章探讨了男性在生活中不同阶段面临的危机，特别是 30 岁的转变。作者强调，年轻男性在职业中常常感到困惑，并在进入中年时经历内心冲突和反思。成功度过这些阶段可以帮助男性更好地建立稳定的生活结构并引导下一代。

在阅读这篇文章的时候，我做了很多划线，因为很多短小精悍的句子不断的集中我。我想，如果你也处在 30-40 岁这个生命阶段，应该也会有类似的感受。

其中最让我感到被预言家命中的一句话是：

中年转型还要求人们承认，自己的许多失败并不是别人的错。相反，人们要接受这样一个事实：他们的许多不幸都是他们自己悲剧性缺陷的结果。

这样的感受在最近几年中，经常会在意想不到的瞬间突然冲到脑海中。它会让我感到羞耻，因为想法中还会包含一些非常具体的实例，我不知道，为什么当时的自己会那样行动，而行动的后果很可能永远也无法逆转。

PS. 如你所见，如何渡过这个人生阶段的务虚讨论已经成为这份邮件通讯的固定内容。