Home

10.15.23: Retention Business

本周的主题是 Retention Business 留存生意。

在一条推文中,Linear 的创始人 Karri Saarinen 这样写道:

Most of us are in the retention business. We like to see our customers stick around, build trust and loyalty. Quality of the product, and customer is one the key drivers of that - yet many companies forget that.

我们大多数人都是在做留存生意。我们希望看到我们的客户留下来,建立信任和忠诚度。产品质量和客户是关键驱动因素之一——但许多公司忘记了这一点。

这句话是在一大段关于 Quality 品质的讨论中的结尾。他援引 Timeless Way of Building 一书中的 quality without a name 概念:

What he is saying is that quality exists, it can be experienced and perceived, but it cannot be described by words. A town, place, or building that just feels good and natural.

他的意思是,品质是存在的,它可以被体验和感知,但它不能用言语来描述。城镇、地方或建筑就是那么美好和自然。

「无名的品质」无法被衡量,按照管理的常识,无法衡量,也就无法被激励,进而就无法被实现。这种还原论式的观念自工业革命后就薪火相传,直到今天 AI 降临,仍然具有统治性的思想地位。持有此种观点或许会让管理工作变简单——恐怕也是管理大规模业务的唯一方法,人和人的信任度随着群体规模的上升而下降,这时只有数字简单可依赖。

自然而美好的品质并非完全无法被数字衡量,六西格玛这样的质量标准已经被广泛应用了,但它是属于制造业时代的。在软件时代,产品和服务的界限已经非常模糊,一款软件需要在生命周期中持续一贯的保持品质;而在所有的软件中,平台是最为复杂的,它拥有多样的参与者,在渡过了最初的冷启动期之后,往往会跨越更长的时间周期。

长周期的问题是什么呢?

大部分的实体产品的生命周期都远远短于我们的生理周期。比如一双鞋,每过几年都要换掉,只有身体快速成长的青少年阶段,才会感觉到鞋子无法适应身体的变化。而对于软件特别是平台产品而言,长生命周期可能会跨越使用者的不同阶段,比如在十年中,一个使用者可能完成了结婚生子、职位变换等多个阶段,生理心理都会发生很多变化,外部社会的经济、文化等环境也发生了变化。同时,产品的开发者也可能发生了很大的变化,无论是原来的人进入了新的阶段,还是换了新的人,都会对产品在不同时期产生不同的影响。

特别是对于平台型产品而言,长周期中使用者对平台的参与必然会沉淀下很多的数字资产和使用习惯,产生强大的惯性。这么说来,平台就是典型的留存生意,用户的惯性本身也是依赖性的体现。

如果平台发生激烈的变化,就会造成不可预料的后果。而平台是典型的「留存生意」:参与者越多的留下来,就越可能产生种种互动或交易,从而构成平台持续存在下去的价值基础。死亡螺旋就出现在参与者再也不愿意留下来的时候。

巴以冲突中的 X 似乎已经踏入了这一境地。Elon Musk 显然低估了人性的复杂,他的「五步工作法」崇尚简化掉不必要的步骤,而现在看起来,一个收费的蓝色标识对于虚假信息的抵抗是虚弱无力的。The Verge 的文章 How the attacks in Israel are changing Threads 分析了在这场冲突中 X vs. Threads 两个平台的不同立场。

摘抄如下(经过了机器翻译):

和 X 不同,Threads 一开始就是一个以兴趣推荐为主信息流的产品,虽然你可以选择自己关注谁,关注流始终处于次要地位。关注行为会为推荐模型提供有效的输入,让算法更了解你关心的兴趣,从而在推荐流中看到更多相关的内容。X 或者是 Twitter 在很长时间内都是以关注流为主的,直到最近才有了推荐流。

是关注流还是推荐流已经不是这场辩论的主题。Threads 变现更好的原因也并非因为其负责人反复强调不会以「硬新闻」作为推荐信息流的主体。我认为,Threads 在关系和身份上继承了来自 Facebook 和 Instagram 的遗产,账号的真实性得到了基础保证。一个账号背后可以是一个人、一个品牌、一家媒体——甚至是一条狗,校验身份的最好办法就是用关系来证明(而非支付月费),比如:微信也是用好友来协助验证一个账号的异常行为。

Meta 可能在这里找到了新的护城河:那就是在长周期中持续积累的关系数据,这些数据在不同的社交 app 中被反复使用,而作为基础的算法对这些杂乱关系的理解越来越深入。

回到最开始讲到的「无名的品质」,我想,「无法衡量,也就无法被激励」的问题或许并不在其表面,而在于「衡量」本身是一种对事物的浅层理解,它没有很好的传递出长周期中品质的重要价值。如果把这个词换成「理解」,或许就能把更多深层信息加入到考虑中。

谈到理解,就必须提到 Ben Evans 最近发表的文章 Unbundling AI。他写道:

Of course, one of the big questions in AI now is around that ‘thin’ in ‘thin ChatGPT wrappers’ - how thin? If you’re just an API call with a GUI, you probably don’t have much of a moat. But on the other hand, everyone in tech today is wrapping something else at some level. Snap uses Google Cloud for storage, but we don’t call it a ‘thin GCP Wrapper’. A big part of the way that the last wave of machine learning was deployed was that the basic capabilities became building blocks on the ‘hyperscalers’ (Google Cloud, AWS and Microsoft Azure) and those were then integrated into more specialised products further up the stack. A legal software company might use GCP translation and AWS sentiment analysis just as it used AWS data storage, but it used them to build something that law firms could buy, with a lot of other product around that, and a sales force and understanding of what lawyers needed, and it didn’t worry at all about competition from AWS. And then, as part of that product, it might built its own models with its own data doing things that the hyperscalers did not.

I don’t know that it’s clear yet how far LLMs will follow this pattern. It might be that there will be lots of smaller, cheaper, open source LLMs, or it might be that there will be a small number of models that are very expensive, very big and very good (and very generalised), and that reach much further up the stack than the models of the previous wave. Again, you could watch a lot of YouTubes of people debating this, but in this context I don’t think it changes the point: in a lot of cases, the general purpose system will probably be abstracted into single purpose UIs, even if those UIs are pretty thin.

当然,现在人工智能的一大问题是“瘦 ChatGPT 包装器”中的“瘦”——薄到什么程度?如果您只是使用 GUI 进行 API 调用,那么您可能没有太多护城河。但另一方面,当今科技行业的每个人都在某种程度上包装了其他东西。 Snap 使用 Google Cloud 进行存储,但我们不称其为“瘦 GCP Wrapper”。上一波机器学习部署方式的一个重要部分是,基本功能成为“超大规模”(Google Cloud、AWS 和 Microsoft Azure)的构建块,然后将这些功能集成到堆栈中更专业的产品中。一家法律软件公司可能会使用 GCP 翻译和 AWS 情绪分析,就像使用 AWS 数据存储一样,但它使用它们来构建律师事务所可以购买的东西,以及围绕这些产品的许多其他产品,以及销售队伍和对业务的了解。需要律师,而且它根本不担心来自 AWS 的竞争。然后,作为该产品的一部分,它可能会用自己的数据构建自己的模型,做超大规模企业没有做的事情。

我不知道大语言模型会在多大程度上遵循这种模式。可能会有很多更小、更便宜的开源大模型,或者可能会有少量非常昂贵、非常大、非常好(而且非常通用)的模型,并且可以达到很多目标。比前一波的模型更进一步。同样,你可以在 YouTube 上观看很多人对此进行辩论,但在这种情况下,我认为这不会改变要点:在很多情况下,通用系统可能会被抽象为单一用途的 UI,即使这些用户界面非常薄。

Evans 用他擅长的产业分析角度来看 AI / LLM 可能会发生变化:软件总是在包装其它的软件,而每一次包装都在把通用能力变得更加具象,也就是「瘦」,或者是「特定用途」。对于大部分人而言,这可能是更容易理解使用方式。他指出,ChatGPT 的困境正在于其丰富性 vs. 大部分人贫瘠的想象力:

Going back to Excel and shifting my metaphor up a level, today ChatGPT sometimes seems more like the original PCs than like Excel (or VisiCalc). It’s a general purpose technology, there’s a command line, and some stuff that’s theoretically magic, and a few things that are extremely useful to a few people, but we don’t yet have the richness of all the software that came on top - all of the embodied use cases. Right now, ChatGPT is very useful for writing code, brainstorming marketing ideas, producing rough drafts of text, and a few other things, but for a lot of other people it looks a bit like those PCs ads of the late 1970s that promised you could use it to organise recipes or balance your cheque book - it can do anything, but what?

回到 Excel,将我的比喻提升一个层次,今天的 ChatGPT 有时看起来更像原始 PC,而不是 Excel。它是一种通用技术,有命令行,还有一些理论上很神奇的东西,还有一些对少数人来说非常有用的东西,但我们还没有拥有所有最重要的软件的丰富性——所有所体现的用例。目前,ChatGPT 对于编写代码、集思广益营销创意、生成文本草稿以及其他一些事情非常有用,但对于许多其他人来说,它看起来有点像 20 世纪 70 年代末的那些 PC 广告,承诺您可以用它来整理食谱或调平你的支票簿——它可以做任何事情,而具体是什么呢?

我记得上半年有一次和一位大模型的从业者对话,他充满激情的说,AGI 最终会让每个人都拥有自己的「个人助理」。我的问题其实很简单:人们为什么要拥有「个人助理」呢?

大部分人不会理解,用助理来做什么。

← Back to Newsletter Archive