09.03.23: Curve Dependent
本周的主题是 Curve Dependent 曲线依赖。
看下面这张图,关于过去 20 年中,互联网的数据传输速率如何从每秒不到 1000 比特增长为现在的每秒十亿比特以上。

这张图很有力量,不仅仅是因为它展示了一张技术进步的图景,更是因为我们可以把这条曲线商业机会结合起来。投资人 Chris Paik 讲道:
One thing that I think is underexplored is the impact of data transfer speeds as actual why now reasons for companies existing. Let's look at mobile social networks and the order that they were founded in; Twitter 2006, Instagram 2010, Snapchat 2011, maybe most recently TikTok named Musical.ly in 2014.
我认为尚未充分探讨的一件事是数据传输速度的影响作为公司存在的实际原因。让我们看看移动社交网络及其创建的顺序; Twitter 2006 年、Instagram 2010 年、Snapchat 2011 年,也许最近的是 2014 年命名为 Musical.ly 的 TikTok。
对于那些或许不大清楚 Bits Per Second 的含义的读者(其实也包括我自己),2003 年,互联网每秒可以传输 1 百万比特数据,大概相当于 125k 字节;而到了 2013 年,这个数字增长了一个数量级,就是达到了每秒兆字节的速率,再过十年,又增长了两个数量级,达到了每秒百兆字节的速率——这时候你可能会注意到,这张图的纵轴具有误导性:它的刻度是指数级增长的。
换算为字节单位后,我们都能够估算从 1983 年到 2023 年的 40 年时间里,互联网发生了怎样的变化。在 Paik 的回溯中,每一代社交媒体应用的出现时机都刚好在它们所代表的内容形态可以在一秒以内被传输到消费者面前的时间点上。
Instagram 和 Snapchat 都曾经出现在 Platform Thinking + 过去的 newsletter 中。我花费了大量的篇幅追溯它们的创业故事和产品演进,在传记、财报和评论文章之中沉迷太久,以至于忘记了它们和早先的 Twitter 以及后来的 TikTok 并非同代竞争,它们诞生于曲线的不同阶段,而这些阶段并非如我们的日历一般是均匀线性分布的。
未来从未以均匀分布的形态降临,但这并不妨碍评论者们假装一切都是平的。比如在 Eugene Wei 发布于今年 7 月份的文章 How to Blow Up a Timeline 中,他这样写道:
Twitter’s interface doesn’t capture sentiment, both positive and negative, as cleanly, as TikTok.
Twitter 的界面无法像 TikTok 那样清晰地捕捉积极和消极的情绪。
他认识到,Twitter 与 TikTok 在内容形态上的巨大差异使得前者无法像后者一样通过用户的简单滑动行为来捕捉用户的兴趣数据,也就无法如后者一般构建强大的兴趣图谱(interest graph)。在 Twitter 所处的时代,构建信息流的主要方式是通过关注关系,也就是所谓的社交图谱(social graph)来构建的,Wei 写道:
The idea of using a social graph to build out an interest-based network has always been a sort of approximation, a hack.
使用社交图谱构建基于兴趣的网络的想法一直是一种近似, 一种 hack。
以及:
The problem with approximating an interest graph with a social graph is that social graphs have negative network effects that kick in at scale.
用社交图谱来近似兴趣图谱的问题在于,社交图谱具有大规模的负面网络效应。
逻辑链条已经足够长了,我们来回顾一下:
Twitter 和 TikTok 处于曲线的不同阶段,如果按照互联网数据传输速度来看,很可能相差两个数量级。我们当然不能忽视同时在快速演进的机器学习算法和移动计算硬件的发展,但两个数量级的差距使得 TikTok 可以以高清码率全屏连续自动播放视频内容,而 Twitter 则以文字+图片的形式在一屏幕中挤下多条内容,并依赖用户的关注和互动行为来近似社交/兴趣图谱。在内容形态和界面上巨大差异直接导致了两者能够构建的图谱密度。
Wei 的另一个观点很大程度上来自于 Seeing Like a State(James C. Scott) 一书:
In the modern world, machine learning algorithms that mediate who interacts with whom and how in social media feeds are, in essence, social institutions.
在现代世界中,在社交媒体中调解谁与谁互动以及如何互动的机器学习算法,本质上,就是社会制度。
以及:
The machine learning algorithms have been crucial to scaling our largest social media feeds. They are among the most enormous social institutions in human history, but we don't often think of them that way.
机器学习算法对于社交媒体的规模拓展至关重要。它们是人类历史上最庞大的社会制度之一,但我们并不经常这样看待它们。
这些比喻都足够强大。我的理解是:制度决定了规模,网络规模发展的最大规模正是其负网络效应的顶点,而其起点却是在一条在逻辑上看起来遥不可及的曲线上形成的。
社交媒体或是推荐信息流是过去一个时代里面人类发明出来的信息获取机制。它们出现得如此密集,以至于在分析对比的时候,我们并不关心他们出现的时候所处的曲线阶段。而在这样的复杂系统发展中,初始条件对后续的影响无疑是巨大的,我们已经在上面的讨论中看到,文本和短视频由于数据传输速度的影响所带来的巨大差异——它们最终形成了制度差异的鸿沟,正如我们在历史课上学到的那样,经济和技术条件影响了历史的走势。
Wei 进一步把目光投向了商业化,认为社交网络的发展是路径依赖的,特别是当「广告动力学」加入讨论的时候:
Social networks are path dependent. This is especially true in the West where social networks are largely ad-subsidized and where they’re almost all built around a singular dominant architecture of an infinite scrolling feed optimized for serving ads on a mobile phone. The path each network took to product-market fit selected for a specific user base. As with any community, but especially ones forced to cluster in close proximity in a singular feed, as is common in the West, the people making up the community go a long way towards determining its tenor and values. Its vibes. The composition of its users then determines how conducive that network is to what types of advertising and at what scale. Finally, closing the circle of life, those ad dynamics then influence the network’s middle age evolution as a service. Money may not begin the conversation, that starts with the users, but money gets the final word.
社交网络是路径依赖的。在西方尤其如此,那里的社交网络很大程度上是由广告补贴的,而且它们几乎都是围绕一个单一的主导架构构建的,该架构是针对在手机上投放广告而优化的无限滚动信息流。每个网络为特定用户群选择的产品市场匹配路径。与任何社区一样,尤其是那些被迫紧密聚集在单一信息流中的社区(这在西方很常见),组成社区的人们在决定其基调、价值观和氛围方面走了很长的路。然后,其用户的构成决定了该网络对何种类型的广告以及规模的有利程度。最后,生命周期走向终结,广告动力学会影响网络的中期演变。或许对话并非由金钱开始的,而是由用户开始的,但金钱有最终决定权。
我想把这种依赖称之为「曲线依赖」,虽然它听上去有点刻意简化。有一些曲线是决定性的,在上面选择哪个点进入,对后续发展的影响至关重要。这就是为什么在今天的技术演进速度之下,先发可能并不意味着优势:可能会错失技术的关键突破,而停留在一个早熟的优化阶段上。
今天最重要的曲线是什么呢?我怀疑,很可能也是一条与信息获取效率相关的曲线。从速率(tokens per second)到成本(costs per thousand tokens),可能是模型能力达到基线之后的两个关键变量,前者影响用户体验,后者影响商业模式。