05/06/2023: Provenance
本周的主题是 Provenance 来源。
主题的来源是即将要推荐的一篇 New Yorker 的长文 There Is No A.I.,作者是 Jaron Zepel Lanier,被认为是最早提出虚拟现实概念的计算机科学家。这篇文章中如此提到了 provenance 的概念:
We assume that decontextualization is intrinsic to the very idea of a digital network. That was never so, however; the initial proposals for digital-network architecture, put forward by the monumental scientist Vannevar Bush in 1945 and the computer scientist Ted Nelson in 1960, preserved provenance. Now A.I. is revealing the true costs of ignoring this approach. Without provenance, we have no way of controlling our A.I.s, or of making them economically fair. And this risks pushing our society to the brink.
我们假定去语境化是数字网络的本质思想。然而,事实并非如此;1945 年由杰出科学家 Vannevar Bush 提出的数字网络架构的最初提议,以及 1960 年由计算机科学家 Ted Nelson 提出的提议,都保留了来源(provenance)。现在,人工智能正在揭示忽略这种方法的真正成本。没有来源(provenance),我们就没有办法控制我们的人工智能,或者使它们具有经济公平性。这可能会将我们的社会推向悬崖边缘。
这和我大约在三个月之前的一些想法很相似。在 LLM 的讨论最热烈的时候,我想到如下几个我认为比较重要的问题:
- 可信,或者说容错性、准确性。
- 溯源,能否追溯模型是从哪些「素材」生成了新的内容。
- 收益或追责,在 1 没有达成,但 2 可以达成的情况下,是否可以分配收益,以及追溯责任。
这些问题没有达到人类存亡的高度,他们更像是比较实际的可行性问题——但只有解决了这些问题,人类社会才能在比较大的范围中采纳和实施大模型。
在这 3 个问题中,1 和 2 更基础,3 则像是 1 + 2 的组合衍生。但 3 不仅仅是商业模式问题,更是法律和伦理问题。
Lanier 的这段话指出,即便在最野蛮生长的互联网上,最初的设定也是包含「来源」的,超级链接 Hyperlink 这个定义了互联网基础产品形态的网页元素,不仅仅是一种让用户更为方便使用的界面,也是构建点击广告等商业模式的技术基础。现代商业模式不仅仅是买卖双方的事情,更是多个参与方协作,形成复杂的多边供需关系,最终构造价值网络,而在网络中,超级链接就是来源的证明,也是利益分配和责任归属的直接抓手。
在 ChatGPT 上,这种溯源的能力已经消失了。AI 处理事情的做法就好像是步入不惑之年的中年男人的头脑,在琐碎与混沌中说不清道不明。无法辨明来源,也就无法为容错性负责,也无法处理收益分配的问题。与 AI 的对话,是孤独的单人游戏——假设我们在有了互联网之前,先有了 AI,那么对话中的错误又将如何被纠正呢?
消费主义的一种形态,便是所谓的非炫耀性消费,根据《微小的总和》一书的解释:
消费不再倾向于让全社会看到,或是从文化上可见,但仍能展示阶级地位,雇佣园丁、保姆,享受汽车服务,或把钱投入教育和退休计划等都属于这类消费。这些商品都是非物质性或为展示身份地位而使用,但其中传达出的一个人能负担得起这些消费的信息,则起到了展示财富的作用。
换句话说,比起那种把商品的 Logo 放在显眼位置的行为,非炫耀消费更加自省和内敛,很多时候,是一种「富有的必需」。而在这其中,能够追溯商品的来源,往往意味着对个人、家庭甚至社会肩负重要的责任。书中举出大量类似 Whole Foods 超市、Intelligentsia Coffee 或者 Industry of All Nations 买手店这样的例子,其共同特性在于鼓励消费者在购买商品之外,还在乎商品之源头。这种溯源实际上是追溯原子经过何人之手才被重新组合成了特定的样子。我们不难想见,其必要性出现在工业革命之后,大规模制造让商品生产变得面目全非,守着古老手艺的工匠们在他们的活计上不再配拥有镌刻的名号。
也当然能够想见,在大语言模型让一切信息都真伪难辨、源头不分时,知识工作者又将面临何种境况?专栏作家、小说作者甚至是电视主持,都可能不再配拥有自己的姓名,也不再成为内容作品(或者说是产品)的主要购买动机。如果没人署名,自然也就可以没人负责。
Lanier 的这篇文章引发了我的注意,最初是因为 SITALWeek 这个 newsletter 的推荐,作者是 NZS Capital 的创始人 Brad Slingerlend,这个每周定期发送的 newsletter 在格式上很像 Platform Thinking,有大量优质文章的链接,但少了一些引用,多了一些评论。而发现这篇文章之后,我再一次发现这篇标题意义并不明确的文章的作者的背景——这种背景调查几乎成为阅读的必要习惯,进一步引发了阅读的兴趣。如果没有这些「溯源」,这篇长文难以进入我忙碌的阅读清单。
好处在于,除了 Slingerlend 引用的三段文字,原文提出了一个更有价值的概念,将在后面继续展开。
Essays
There Is No A.I. by Jaron by Zepel Lanier
Digital Diginity「数字尊严」就是 Lanier 在文中提到的那个重要观念。这个概念应该在他的著作 Who Owns the Future? 有进一步展开。
In a world with data dignity, digital stuff would typically be connected with the humans who want to be known for having made it. In some versions of the idea, people could get paid for what they create, even when it is filtered and recombined through big models, and tech hubs would earn fees for facilitating things that people want to do. Some people are horrified by the idea of capitalism online, but this would be a more honest capitalism. The familiar “free” arrangement has been a disaster.
在一个具有数字尊严的世界中,数字物质通常与希望以其创造而出名的人们联系在一起。在某些版本的想法中,人们可以因自己创造的东西而获得报酬,即使它们被大型模型过滤和重组,技术中心也可以通过促进人们想做的事情而获得收入。有些人对在线资本主义的想法感到恐惧,但这将是一种更加诚实的资本主义。我们熟知的「免费」安排已经是一场灾难。
以及:
A data-dignity approach would trace the most unique and influential contributors when a big model provides a valuable output. For instance, if you ask a model for “an animated movie of my kids in an oil-painting world of talking cats on an adventure,” then certain key oil painters, cat portraitists, voice actors, and writers—or their estates—might be calculated to have been uniquely essential to the creation of the new masterpiece. They would be acknowledged and motivated. They might even get paid.
如果一个大模型提供了有价值的输出,那么采用数字尊严的方法就会追踪最独特和最有影响力的贡献者。例如,如果你向模型询问「一部讲述孩子们在一个谈话猫的油画世界冒险的动画电影」,那么某些关键的油画家、猫肖像画家、配音演员和作家(或其遗产)可能会被计算出是创作这部新杰作所必不可少的。他们将得到认可和激励,甚至可能会得到报酬。
Lanier 认为,这种溯源归因的方法不仅仅适用于知识工作者,也可能适用于蓝领劳动者。比如,在一个伐木工人的例子中,有经验的工人可以分享自己的伐木经验,帮助机器人更高效的分析树木的全息图像,并能从中转去酬劳。
显然,这个概念会被拿来与 Universal Basic Income 相提并论:
Many people in Silicon Valley see universal basic income as a solution to potential economic problems created by A.I. But U.B.I. amounts to putting everyone on the dole in order to preserve the idea of black-box artificial intelligence. This is a scary idea, I think, in part because bad actors will want to seize the centers of power in a universal welfare system, as in every communist experiment. I doubt that data dignity could ever grow enough to sustain all of society, but I doubt that any social or economic principle will ever be complete. Whenever possible, the goal should be to at least establish a new creative class instead of a new dependent class.
在硅谷,许多人将通用基本收入(UBI)视为应对由人工智能带来的潜在经济问题的解决方案。但是,UBI 实质上是将所有人都放在救济制度中,以维持黑盒人工智能的理念。我认为,这是一个令人担忧的想法,部分原因是坏人会想要抓住普遍福利体系中的权力中心,就像每一个共产主义实验一样。我怀疑数字尊严永远不可能足够强大以支撑整个社会,但我也怀疑任何社会或经济原则都不会是完整的。每当可能的时候,目标应该是建立一个新的创意阶层,而不是一个新的依赖阶层。
这段引用中的最后一句中提到的「依赖阶层」也是对 UBI 批评的一种常见论调,认为 UBI 可能会让很多人依赖于这种被动收入,进而失去在社会中存在的意义。
这也是本文中提到的另一个重要观点:
In my view, the most accurate way to understand what we are building today is as an innovative form of social collaboration.
我认为,最准确地理解我们今天正在构建的是什么,就是一种创新形式的社会协作。
Lanier 观察到,大语言模型对于用户输入并不是一成不变的提供重复回答,其内在的复杂性(或者说涌现性)往往会在同一问题下给出不同的答案。这种不重复的特质使得人类的选择成为必需。在这个意义上讲,过去的技术过于机械化,如果人类不能给出正确的指令,就不能产出结果。大语言模型是一个主动适应人类的技术,而不是强迫人类学习如何使用——自然语言就是界面。
这就回到我在 AI 杂记 4 中所引述的一个观念 software layer(软件层):
The software layer between the company and their armies of contractors eliminates a huge amount of middle management, and creates a worrisome disconnect between jobs that will be automated, and jobs of increasing leverage and value.
公司与他们的合同工之间的软件层消除了大量的中间管理,并在被自动化的工作与不断增加杠杆的工作之间创造了一个令人担忧的断层。
这篇文章写作于 2015 年,但它指出了一个由软件代码构成的断层,以 Uber 软件为例,软件层之上是坐在硅谷的程序员,而之下则是无数在全世界各地奔波的人类驾驶员。软件层的两边没有直接沟通的管道,乘客们也几乎不知道也不关心为他们提供驾驶服务的到底是谁。
无独有偶,最近 Todoist 的创始人 Amir Salihefendic 分析自动驾驶会比预想来得更快,背后的主要驱动力是经济原因:
- 对于供给方:出租车行业中,司机构成成本的主要来源。
- 对于需求方,个人能够省去驾驶车辆的时间是巨大的效率改善。
供给和需求完美对接,没有任何空间留给司机,无人驾驶,无人在场。
如果按照 Lanier 的判断,大模型似乎比之前的那些代码要好一些,比如说它可能会在从 A 点到 B 点的机械指令之外考虑更多人性因素——这就是复杂性的体现,大模型的奢侈之处可能就在于此:用超常规的语料和算力补完了既有代码中过度简化的部分。
冗余之处,照顾人性。
The Unbundling Fallacy by Dan Hockenmaier
Dan Hockenmaier 是商品批发平台 Faire 的战略与分析主管。本文回顾了过去十年中的 Unbundling Craiglist / eBay / Facebook 的叙事为什么没有获得成功。
Unbundling 的叙事是这样的:
The narrative goes like this: the incumbents are fat and lazy, and under-serve their various niche audiences. This makes them vulnerable to startups which can better serve those niches, sharding them into a million pieces, or at least into many unicorn-sized pieces.
故事是这样的:现有的企业被形容为又胖又懒,而且服务于各种细分市场受众的能力不足。这使得它们容易受到初创企业的挑战,这些初创企业可以更好地服务这些细分市场,将它们分裂成一百万份,或者至少分裂成许多独角兽大小的份额。
作者认为,unbundling 未能奏效的本质原因就是:未能提高效率。效率被定义为: 客户获取的回报周期,也就是,一个顾客所产生的毛利在多久之后能够完全覆盖获取该顾客所需的成本。
这个解释简单粗暴,符合作者一路从 BCG 打怪升级的职业履历。他进一步用网络效应和规模经济这些概念来解释,为什么 unbundling 行为不能提升客户获取的回报周期。但这些都是老生常谈,我不想展开。
而更有价值的一个概念是 Engagement frequency 活跃频率。更广泛的选择给顾客更多的机会参与,这就导致更频繁的使用和交易。而 unbundling 则减少了顾客再次访问的理由,而减少的频次最终导致更低的 LTV,从而让回报周期的账面算不过来。
作者认为,少数 unbundling 成功的案例至少满足以下三个条件中的一个:
- 顾客的 LTV 足够高,即便在一个较为垂直和狭窄的领域中,或者是交易频次足够高(比如:共享单车?),或者是客单价足够高(比如:旅行)。
- 负网络效应:一些顾客群体与其他群体的重叠度足够小,降低网络效应带来的好处。或者,一个顾客群体明确不希望与另一个顾客群体处于同一网络中,这是一种负网络效应。
- 异质的交互模式:目标顾客群体有明确的偏好,导致更深入的参与,并最终实现货币化。
在作者引用的另外一篇文章 The Rebundling of Craigslist 中(发表于 5 年前),风险投资人 Josh Breinlinger 这样写道:
Many of the vertical marketplaces that were featured originally have failed. I know as a consumer, I don’t really want to go to 60 different sites or apps to get my shopping and gigs and other stuff done. The narrow verticals have died off in favor of horizontal categories. Many of them lacked the frequency of usage (eg, Getable) to build a large sustainable network or they lacked the monetization potential of bigger ticket items to build a wildly profitable business (like an Airbnb).
很多最初的垂直市场都失败了。作为消费者,我不想去 60 个不同的网站或应用程序来完成我的购物、工作和其他事情。狭窄的垂直市场已经被横向类别所取代。其中很多缺乏使用频率(例如 Getable),无法建立一个大型可持续的网络,或者缺乏高单价商品的赚钱潜力,无法建立一个获利丰厚的企业(如 Airbnb)。
今天看来 Airbnb 似乎比 Breinlinger 想得更加成功一些,但的确后者也在不断的拓展自己的边界,努力从一个短期出租空置房屋的公司,变为一家提供独特旅行体验的公司。
Substack Notes, Twitter Blocks Substack, Substack Versus Writers by Ben Thompson
Buying a company is easy (see Vine); actually realizing that company’s potential requires vision and execution, not internal politics and indecision.
收购公司很容易(参见 Vine);实现公司潜力的真正要求是远见和执行力,而不是内部政治和犹豫不决。
See also: 杂谈|中型企业的并购增长(一) | 杂谈|中型企业的并购框架(二) by 王力行
I Don't Like Making the Best Things by Vin
Futureland 的创始人 Vin 写道:
The truth is, there's a lot of things I don't know. I have more questions than answers. My most authentic reason for making anything is that I am just a curious person. Asking questions and then exploring them makes me happy.
I love making me things because they tell me who I am, and that makes me happy.
Shortform
Early 2023: “LLMs will disrupt search!” Spring 2023: search is probably the only thing that you can’t use an LLM for.
You can, of course use it for search. 60 to 70% of what it says will be correct. If that doesn’t matter, or if you can tell the difference, it’s fine, but you can’t ask you for anything where the error rate matters and you can’t tell.
Evans 嘲讽大模型的准确率还不如搜索引擎。
搜索引擎的优点是:从来没有承诺自己给出的就是正确回答(而是给出一堆看起来杂乱无章的相关信息让用户自己判断)。
Longform
假期读完了两本书《微小的总和》和《贫穷的质感:王梆的英国观察》,都被我打上了 #consumers 的标签。
理解消费者还是挺重要的,特别是作为一个还想在余生好好做一把生意的人。但写消费的书,除了一些有点枯燥的类似《第四消费时代》或者《M 型社会》,剩下的都多少有一点嘲讽的语气——这恐怕这类作者的通病。
《微小的总和》在前文也有过引用,最重要的是提出了非炫耀性消费的概念,可以算是在消费主义研究上有新的建树。而《贫穷的质感:王梆的英国观察》一书在去年上过很多阅读榜单,的确写作质感一流,遣词造句丰富细腻,读起来一种醇厚的胶片感。不过说实话,读前半部分着实让人有点抑郁,看到老牌资本主义国家的底层民生如此不堪,不由得联想后世可能如何发展,颇有些担心自己的老年光景。
《贫穷的质感:王梆的英国观察》中写道:
2017 年的英国大选,69%的 70 岁以上老人选了提倡紧缩的保守党;60—69 岁的选民中,选保守党的占 58%;50—59 岁的,则占 47%。为什么火鸡总为圣诞节投票?原因诸多,但有一点非常显著,绝大部分的老一代人,尽管他们像托马斯和玛丽一样,曾是福利制度这颗糖的甜蜜受益者,却一厢情愿地相信,自己的中产好生活是“个人打拼”的结果,这是资本主义自 1834 年的《济贫法修正案》推广以来,在价值观上取得的最大胜利之一。年轻的低中阶级收入者还因此得了一个花名“雪花”(Snowflakes),意即“虚荣、懒惰、易碎,妄想不劳而获”。如果年轻人抱怨薪水太低,老一代人的解决方式是,那就脱欧,脱欧之后,移民们就不会再来抢你们的饭碗了。所以你会看到 65 岁以上的选民,64% 选择了脱欧,和保守党 138 个议员的选择不谋而合(相比之下,工党只有 10 个议员投了赞成票,自由民主党、苏格兰民族党和绿党的议员全部反对),用《独立报》专栏作家安德鲁·库珀 (Andrew Cooper) 的话说,它是资本主义在“国家主义”价值输出上的巨大成功。
「紧缩」政策被认为是导致英国中产阶级衰落的原因,而其背后则是全球化产业链的重新分工。尽管如此,在庞大的选战宣传之下,饱受贫穷之苦的民众仍然投票给了提倡这一政策的政党,认为勒紧裤腰带,努力打拼,就能重新过上好日子。然而:
今天,想解开中上阶级的嗅觉密码已非易事(除非你是寻血猎犬),毕竟,英国社会经历了两百多年频繁的罢工、女权和民主运动,早就蜕掉了显而易见的阶级的蜥皮,还长出了一层层政治正确的新皮。
抹除了阶级的标识,人们再也搞不清楚自己应该站在哪个队伍里面,这时候选票就等于一些令人追味往昔的口号。
- 首先,我们将推出一个新的付费层级,每月 1 美元,包括 Links+Notes 的每周更新。这将是我们最受欢迎的服务,已经有数千名订阅用户。
- 其次,我们的免费订阅将只包括内容的部分预览,或偶尔发布(大约每月 1 次)的完整内容。2023 年 5 月之前的的免费订阅用户将被自动转换为这个层次的订阅者。
- 最后,我们的最初的付费层级将保持不变,但更名为 Full Access。这个层级将包括所有我们的内容。2023 年 5 月之前的的付费订阅用户将被自动升级到这个层次。
我们做出这些变化的原因是因为支持 Platform Thinking + 的云服务成本不断上升:免费会员数量与这个成本线性相关,我希望将创作长期进行下去,所以调整价格就成为必需。
非常感谢您一直以来的支持,希望这些变化可以让我继续提供高质量的创作。